![]() ![]() |
大數(shù)據(jù)處理:從采集到可視化
《大數(shù)據(jù)處理:從采集到可視化》共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關技術;第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現(xiàn)的主要步驟以及相應的Python語言實現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關聯(lián)規(guī)則的推薦、基于內(nèi)容過濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關鍵技術,主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關的交互技術。
你還可能感興趣
我要評論
|