KHAI PHÁ và MÔ HÌNH DỮ LIỆU VỚI R

Ý chính của một lớp học về khoa học dữ liệu -> thành chuyên gia được ư?

Giảng viên: TS. Nguyễn Quang và Ths Nguyễn Thế Anh

KẾT QUẢ NHẬN ĐƯỢC

  • Thành thạo lập trình ngôn ngữ R
  • Khai phá dữ liệu: tổng hợp, làm sạch, chuẩn hóa, biến đổi dữ liệu kinh doanh
  • Biểu diễn hình ảnh và tạo lập các báo cáo Business Intelligence hiệu quả
  • Sử dụng các phương pháp thống kê để phân tích dữ liệu kinh doanh
  • Xây dựng các mô hình dự báo xu hướng và rủi ro
  • Làm chủ quá trình triển khai dự án khoa học dữ liệu trong Doanh nghiệp

CÔNG VIỆC PHÙ HỢP

  • Data analyst
  • Business analyst
  • Business Intelligence
  • Machine Learning specialist
  • Data Manager

CHƯƠNG TRÌNH HỌC (10 buổi * 3h hoặc 4 ngày * 7.5h)

Phần 1:

  • Giá trị của Dữ liệu và vai trò của Khoa học dữ liệu
  • Quy trình một dự án Khoa học dữ liệu
  • Cách nhận diện bài toán Dữ liệu trong DN và giá trị mang lại
  • Giới thiệu công cụ: R, Rstudio, Markdown

Phần 2:

– Ngôn ngữ lập trình R: từ cơ bản đến nâng cao

– Thao tác với dữ liệu:

  • Tải dữ liệu, ghép nối, tổng hợp, làm sạch, xây dựng từ điển dữ liệu
  • Xây dựng báo cáo kinh doanh cơ bản

Phần 3:

– Khai phá dữ liệu kinh doanh (EDA):

  • Thống kê và Biểu diễn đồ thị đơn biến phân loại và liên tục
  • Thống kê và Biểu diễn đồ thị đa biến với ggplot2
  • Phân nhóm dữ liệu

Phần 4:

    – Giới thiệu về Business Intelligence

    – Thực hành xây dựng báo cáo Business Intelligence

Phần 5:

– Biến đổi dữ liệu:

o Tìm kiếm điểm bất thường

o Chuẩn hóa dữ liệu, xử lý phân bố

o Giảm chiều dữ liệu

o Tạo biến mới từ dữ liệu

– Các mô hình thống kê:

  • Khoảng tin cậy
  • Kiểm định giả thiết
  • Kiểm định Bootstrap
  • Phân tích phương sai (ANOVA)

Phần 6:

– Mô hình Hồi quy:

  • Hồi quy đơn biến
  • Phân tích sai số
  • Hồi quy đa biến

Phần 7:

    – Các mô hình phân loại

    o Giới thiệu Các mô hình phân loại

    o Mô hình Hồi quy Logistics

o Mô hình cây quyết định và Random Forest

Phần 8:

    – Đánh giá và hiệu chỉnh mô hình

    o Đánh giá mô hình liên tục

o Đánh giá mô hình phân loại

o Xây dựng biến mới

o Lựa chọn biến

Phần 9:

    – Các mô hình không giám sát

    o Mô hình phân cụm

o Mô hình Khuyến nghị

Phần 10:

    – Giới thiệu về mạng Neuron và Deep Learning

– Cách trình bày kết quả dự án ML

– Dự án cuối khóa học