Kỹ sư máy học (Machine Learning Engineer)

Chương trình học này cung cấp các kiến thức, kỹ năng từ cơ bản đến nâng cao dành cho Kỹ sư Máy học (Machine Engineer) dành cho các bạn học sinh mới tốt nghiệp THPT, các sinh viên cao đẳng, đại học hoặc các bạn muốn chuyển ngành sang lĩnh vực Máy học. Đây cũng là khoá nền tảng cho các bạn muốn trở thành Kỹ sư Khoa học dữ liệu, Kỹ sư cầu nối chất lượng cao ngành Máy học, …
Trong khoá học này, học viên sẽ được học các học phần:
– Tổng quan về Máy học dành cho người mới bắt đầu: trong đó bao gồm định nghĩa về Trí tuệ nhân tạo, định nghĩa về Máy học, các khái niệm về (overfitting, underfitting, bias-variance tradeoff, …) phân loại các bài toán trong máy học (classification, regression, recommender system, …) , vị trí của máy học trong tổng thể hệ thống thông tin, các khái niệm về biến (variables), đặc trưng (features), các kỹ thuật về phân chia tập dữ liệu, sơ lược tiền xử lý dữ liệu căn bản (encoding, normalization, feature transformation), …. Cuối học phần này học viên cũng sẽ được trang bị các kỹ năng cơ bản cần thiết và roadmaps cho các ngành nghề trong lĩnh vực Máy học và Trí tuệ nhân tạo.
– Kỹ thuật lập trình Python nâng cao: học phần này cung cấp các kỹ năng về lập trình trên ngôn ngữ Python được xây dựng dành cho các bạn mới bắt đầu tham gia vào lĩnh vực Máy học. Trong đó, các học viên sẽ được học các khái niệm về biến, về các kiểu giá trị, các kiểu dữ liệu, các cấu trúc điều khiển, các thao tác trên các kiểu dữ liệu phổ biến (list, array, dictionary, ..), cũng như các khái niệm về lập trình hướng đối tượng (lớp, kế thừa, đa hình …). Ngoài ra học viên cũng được cung cấp các kỹ năng sử dụng Python để lập trình giao diện người dùng (GUI), lập trình xử lý ảnh trên Python…
– Kỹ thuật thu thập, xử lý và phân tích dữ liệu chuyên sâu: Trong khoá này, học viên sẽ được tiếp cận với các kỹ thuật để thu thập dữ liệu, xử lý dữ liệu (encoding, feature transformation, xử lý dữ liệu bị khuyết, xử lý với dữ liệu hình ảnh, xử lý với dữ liệu văn bản, xử lý với dữ liệu âm thanh,…), các kỹ thuật khám phá dữ liệu qua trực quan hoá dữ liệu (bằng các thư viện vẽ đồ thị như matplotlib, seaborn, …) với các biểu đồ như biểu đồ phân phối, biểu đồ hộp, biểu đồ đường, biểu đồ thứ hạng, biểu đồ time series, biểu đồ quan hệ tương quan…. Trọng tâm của khoá học này sẽ là các kỹ thuật để phân tích dữ liệu thăm dò (Exploratory Data Analysis, phân tích cụm,….) nhằm giúp học viên các kỹ năng phong phú để có thể khai phá ra những ý nghĩa mới, những tri thức mới từ dữ liệu, từ đó có thể diễn giải và giúp khách hàng hoặc các bên kinh doanh có được những quyết định kinh doanh hiệu quả nhất.
– Kỹ thuật chuyên sâu về xử lý và trích chọn đặc trưng: Đây là khoá học nâng cao dành cho các bạn Kỹ sư phân tích dữ liệu và cũng là một khoá học trọng tâm cho hầu hết các chuyên ngành trong lĩnh vực Máy học và Trí tuệ nhân tạo. Khoá học này cung cấp cho học viên các kỹ thuật để xử lý và trích chọn đặc trưng tốt nhất cho việc huấn luyện mô hình hoặc diễn giải các mô hình máy học. Trong đó bao gồm các kỹ năng về giảm miền dữ liệu (Dimensionality Reduction: PCA,..), các giải thuật lựa chọn đặc trưng dựa trên phân tích nhân tố (Factor Analysis, Confirmatory Factor Analysis), các giải thuật lựa chọn đặc trưng dựa trên mô hình tuyến tính và kỹ thuật regularization (LASSO, Ridge, Elasticnet), các giải thuật lựa chọn đặc trưng dựa trên mức độ không đồng nhất dữ liệu (impurity), giải thuật lựa chọn đặc trưng dựa trên hoán vị (feature permutation).
– Các mô hình máy học trên các lĩnh vực: Từ các mô hình đơn giản như Hồi quy tuyến tính (Linear Regression), Cây quyết định (Decision Tree), Random Forest, Ensembles, XGBoost, …; đến các mô hình Deep Learning trong Thị giác máy (RestNet, ImageNet, DeepFace, …) và các lĩnh vực về thị giác máy (Computer Vision) như Image Classification, Face Detection, Image Segmentation, Object Dection, …; các kỹ thuật và mô hình trong NLP (Tokenizers, Text Summarization, BERT Transformer, Machine Translation, …), các kỹ thuật và mô hình trong phân tích dữ liệu time series (ARMA, ARIMA, SARIMAX, LSTM, …) và các mô hình dựa trên autoencoders và GANs (Style Transfers, Cycle GAN, Conditional GAN, …); hay các mô hình máy học dùng trong các hệ khuyến nghị (Recommender Systems)

Kết thúc chương trình đào tạo này học viên có thể:
– Hiểu rõ các khái niệm cơ bản, phân loại các mô hình máy học, vị trí của máy học trong hệ thống thông tin.
– Nắm rõ lộ trình và tập kỹ năng cần thiết cho các ngành nghề trong lĩnh vực Máy học và Trí tuệ nhân tạo, trong đó bao gồm cả kỹ năng của Kỹ sư phân tích dữ liệu.
– Lập trình thành thạo ngôn ngữ Python và giải quyết các bài toán về xử lý dữ liệu, khám phá dữ liệu và phân tích dữ liệu. Đồng thời học viên có đủ kiến thức để có thể bắt đầu huấn luyện các mô hình máy học.
– Sử dụng thành thạo các công cụ vẽ, phân tích và diễn giải đồ thị trong Python
– Nhuần nhuyễn các kỹ năng về phân tích dữ liệu thăm dò
– Nhuần nhuyễn các kỹ năng về xử lý và trích chọn đặc trưng
– Có khả năng khai phá, phân tích và diễn giải các đặc trưng dữ liệu một cách khoa học và gợi ý ra được nhiều kết luận, tri thức mới từ dữ liệu.
– Có hiểu biết và kỹ năng sâu và rộng trên các lĩnh vực Máy học từ cơ bản (classification, regresions) đến các lĩnh vực chuyên sâu và phổ biến như Thị giác máy (Computer Vision), Xử lý ngôn ngữ tự nhiên (NLP), Xử lý dữ liệu chuỗi thời gian (Time Series), hay các hệ khuyến nghị (Recommender Systems)
– Sẵn sàng tham gia các dự án Máy học với vai trò là Kỹ sư Máy học.