書單推薦 新書推薦 |
Spark大數(shù)據(jù)處理與分析
本教材重點介紹了Linux集群環(huán)境的完全分布式環(huán)境搭建、SparkCore(RDD)、SparkSQL數(shù)據(jù)處理編程(DataFrame)、SparkStreaming編程模型(LegacyDStream)、StructuredStreaming編程模型、SparkMLlib(DataFrame-based、RDD-based),以幫助學(xué)生初步掌握大數(shù)據(jù)平臺的數(shù)據(jù)接入、處理、分析和挖掘工作,理解Spark生態(tài)的大數(shù)據(jù)離線/實時處理平臺的設(shè)計、開發(fā)及持續(xù)優(yōu)化和數(shù)據(jù)模型的建立、設(shè)計與算法實現(xiàn),以及模型效果的追蹤、檢驗及優(yōu)化。
你還可能感興趣
我要評論
|