Ý chính của một lớp học về khoa học dữ liệu -> thành chuyên gia được ư?
Giảng viên: TS. Nguyễn Quang và Ths Nguyễn Thế Anh
KẾT QUẢ NHẬN ĐƯỢC
- Thành thạo lập trình ngôn ngữ R
- Khai phá dữ liệu: tổng hợp, làm sạch, chuẩn hóa, biến đổi dữ liệu kinh doanh
- Biểu diễn hình ảnh và tạo lập các báo cáo Business Intelligence hiệu quả
- Sử dụng các phương pháp thống kê để phân tích dữ liệu kinh doanh
- Xây dựng các mô hình dự báo xu hướng và rủi ro
- Làm chủ quá trình triển khai dự án khoa học dữ liệu trong Doanh nghiệp
CÔNG VIỆC PHÙ HỢP
- Data analyst
- Business analyst
- Business Intelligence
- Machine Learning specialist
- Data Manager
CHƯƠNG TRÌNH HỌC (10 buổi * 3h hoặc 4 ngày * 7.5h)
Phần 1:
- Giá trị của Dữ liệu và vai trò của Khoa học dữ liệu
- Quy trình một dự án Khoa học dữ liệu
- Cách nhận diện bài toán Dữ liệu trong DN và giá trị mang lại
- Giới thiệu công cụ: R, Rstudio, Markdown
Phần 2:
– Ngôn ngữ lập trình R: từ cơ bản đến nâng cao
– Thao tác với dữ liệu:
- Tải dữ liệu, ghép nối, tổng hợp, làm sạch, xây dựng từ điển dữ liệu
- Xây dựng báo cáo kinh doanh cơ bản
Phần 3:
– Khai phá dữ liệu kinh doanh (EDA):
- Thống kê và Biểu diễn đồ thị đơn biến phân loại và liên tục
- Thống kê và Biểu diễn đồ thị đa biến với ggplot2
- Phân nhóm dữ liệu
Phần 4:
– Giới thiệu về Business Intelligence
– Thực hành xây dựng báo cáo Business Intelligence
Phần 5:
– Biến đổi dữ liệu:
o Tìm kiếm điểm bất thường
o Chuẩn hóa dữ liệu, xử lý phân bố
o Giảm chiều dữ liệu
o Tạo biến mới từ dữ liệu
– Các mô hình thống kê:
- Khoảng tin cậy
- Kiểm định giả thiết
- Kiểm định Bootstrap
- Phân tích phương sai (ANOVA)
Phần 6:
– Mô hình Hồi quy:
- Hồi quy đơn biến
- Phân tích sai số
- Hồi quy đa biến
Phần 7:
– Các mô hình phân loại
o Giới thiệu Các mô hình phân loại
o Mô hình Hồi quy Logistics
o Mô hình cây quyết định và Random Forest
Phần 8:
– Đánh giá và hiệu chỉnh mô hình
o Đánh giá mô hình liên tục
o Đánh giá mô hình phân loại
o Xây dựng biến mới
o Lựa chọn biến
Phần 9:
– Các mô hình không giám sát
o Mô hình phân cụm
o Mô hình Khuyến nghị
Phần 10:
– Giới thiệu về mạng Neuron và Deep Learning
– Cách trình bày kết quả dự án ML
– Dự án cuối khóa học