Chi tiết khóa học
Hình thức đào tạo
- Tham gia học trực tiếp tại OpenLab
- Hoặc theo yêu cầu doanh nghiệp (In house Training)
- Cấp chứng nhận hoàn thành sau khóa học
Sơ lược chương trình
Giới thiệu và Chuẩn bị Dự án (4 giờ)
- Tổng quan về quy trình thực hiện dự án Data Science
- Giới thiệu các case studies và datasets
- Hình thành nhóm và chọn đề tài dự án
- Xác định mục tiêu và phạm vi dự án
- Lập kế hoạch và phân công nhiệm vụ
Dự án 1: Phân tích Dữ liệu Khách hàng và Dự đoán Churn (12 giờ)
- Phân tích và Tiền xử lý Dữ liệu (3 giờ)
- EDA (Exploratory Data Analysis)
- Xử lý dữ liệu thiếu và outliers
- Feature engineering và selection
- Xây dựng Mô hình Dự đoán (3 giờ)
- Thử nghiệm các thuật toán Machine Learning khác nhau
- Tinh chỉnh hyperparameters
- Đánh giá và so sánh hiệu suất mô hình
- Triển khai và Monitoring (3 giờ)
- Đóng gói mô hình thành API
- Thiết kế pipeline monitoring
- Xử lý concept drift
- Trực quan hóa và Báo cáo (3 giờ)
- Tạo dashboard tương tác
- Chuẩn bị báo cáo kỹ thuật và báo cáo cho stakeholders
Dự án 2: Hệ thống Gợi ý Sản phẩm Real-time (12 giờ)
- Thiết kế Kiến trúc Hệ thống (3 giờ)
- Lựa chọn công nghệ phù hợp (e.g., Spark, Kafka)
- Thiết kế data pipeline
- Xác định các metrics đánh giá hiệu suất
- Xây dựng Mô hình Gợi ý (3 giờ)
- Implement các thuật toán collaborative filtering và content-based filtering
- Kết hợp các phương pháp để tạo hybrid recommender system
- Tối ưu hóa mô hình cho xử lý real-time
- Xử lý Dữ liệu Streaming (3 giờ)
- Implement real-time feature extraction
- Xử lý cold-start problem
- Cập nhật mô hình on-the-fly
- Đánh giá và Tối ưu hóa Hệ thống (3 giờ)
- Thiết lập A/B testing
- Phân tích và tối ưu hiệu suất hệ thống
- Chuẩn bị báo cáo kỹ thuật và demo
Thuyết trình và Đánh giá Dự án (4 giờ)
- Mỗi nhóm thuyết trình dự án của mình
- Q&A và feedback từ giảng viên và các nhóm khác
- Đánh giá và cho điểm dự án
/* Nội dung chương trình có thể thay đổi theo yêu cầu đào tạo của Doanh nghiệp */
------------------------------------