Chi tiết khóa học
Hình thức đào tạo
- Tham gia học trực tiếp tại OpenLab
- Hoặc theo yêu cầu doanh nghiệp (In house Training)
- Cấp chứng nhận hoàn thành sau khóa học
Sơ lược chương trình
Phần 1: Giới thiệu Machine Learning và các thư viện (4 giờ)
- Tổng quan về Machine Learning (1 giờ)
- Định nghĩa và phân loại ML
- Các ứng dụng của Machine Learning trong thực tế
- Quy trình xây dựng một dự án ML
- Giới thiệu các thư viện Machine Learning phổ biến (3 giờ)
- NumPy và Pandas cho xử lý dữ liệu
- Scikit-learn cho các thuật toán ML
- Matplotlib và Seaborn cho visualization
Phần 2: Các thuật toán học có giám sát (36 giờ)
- Hồi quy tuyến tính (6 giờ)
- Hồi quy tuyến tính đơn biến và đa biến
- Gradient Descent
- Đánh giá mô hình hồi quy
- Hồi quy Logistic (6 giờ)
- Lý thuyết và ứng dụng trong phân loại nhị phân
- Hàm mất mát và tối ưu hóa
- Mở rộng cho bài toán đa lớp
- Support Vector Machine (SVM) (8 giờ)
- Linear SVM
- Kernel SVM
- Ứng dụng trong phân loại và hồi quy
- Decision Tree (8 giờ)
- Các tiêu chí chia nhánh (Gini, Entropy)
- Cắt tỉa cây để tránh overfitting
- Bayesian Learning (8 giờ)
- Naive Bayes
- Bayesian Networks
- Ứng dụng trong phân loại văn bản và lọc spam
Phần 3: Chuẩn hóa và Tối ưu hóa tham số (4 giờ)
- Kỹ thuật chuẩn hóa (2 giờ)
- L1 và L2 regularization
- Dropout
- Tối ưu hóa tham số (2 giờ)
- Grid Search
- Random Search
- Bayesian Optimization
Phần 4: Các thuật toán học không giám sát (16 giờ)
- Phân cụm (8 giờ)
- K-means clustering
- Hierarchical clustering
- DBSCAN
- Mean Shift
- Giảm chiều dữ liệu (8 giờ)
- Principal Component Analysis (PCA)
- t-Distributed Stochastic Neighbor Embedding (t-SNE)
- Linear Discriminant Analysis (LDA)
Phần 5: Ensemble learning (12 giờ)
- Bagging (6 giờ)
- Nguyên lý của Bagging
- Random Forest
- Extra Trees
- Boosting (6 giờ)
- AdaBoost
- Gradient Boosting
/* Nội dung chương trình có thể thay đổi theo yêu cầu đào tạo của Doanh nghiệp */
------------------------------------