Khóa học Big Data in Machine Learning Của Csc Edu là khóa học thứ 5 trong chuỗi combo 10 khóa học Machine Learning Của Csc Edu ứng dụng tạo ra những mô hình Machine Learning hiệu quả.
Khóa Học giúp bạn
hướng dẫn về cách xử lý, phân tích và tận dụng dữ liệu lớn
kiến thức về dữ liệu lớn và ứng dụng nó trong Machine Learning
Đưa ra các quyết định thông minh và tối ưu hóa các mô hình Machine Learning.
Trang bị các kiến thức với PySpark (Python package tích hợp Spark dùng để thực hiện tính toán song song với các bộ dữ liệu lớn) như PySpark RDDs, PySpark DataFrames, PySpark SQL, PySpark Mllib, PySpark Streaming, PySpark GraphX…
Công nghệ sử dụng trong Big Data: cách lưu trữ, quản lý, xử lý
Nội dung khóa học
Big Data in Machine Learning 15 Buổi zoom học kèm theo tài liệu
Overview of Big Data
Overview of PySpark
PySpark RDDS
PySpark DataFrame
PySpark SQL
Data Preprocessing & Analysis
Overview of PySpark MLlib
Machine Learning with PySpark MLlib
PySpark Streaming
Apache Spark standalone cluster
Graphx