數(shù)據(jù)分析算法及應(yīng)用實(shí)踐.基于Python 3.x(富媒體)
定 價(jià):59 元
叢書(shū)名:高等院校特色規(guī)劃教材
當(dāng)前圖書(shū)已被 2 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者: 劉建軍,董少群,崔學(xué)慧 著
- 出版時(shí)間:2020/9/1
- ISBN:9787518341511
- 出 版 社:石油工業(yè)出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:372
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
《數(shù)據(jù)分析算法及應(yīng)用實(shí)踐.基于Python 3.x(富媒體)》基于Python 3.x平臺(tái),介紹了數(shù)據(jù)分析方法和應(yīng)用實(shí)踐。內(nèi)容涉及數(shù)據(jù)分析中的有監(jiān)督和無(wú)監(jiān)督方法,包括關(guān)聯(lián)規(guī)則、聚類(lèi)和分類(lèi)三類(lèi)基本方法。重點(diǎn)介紹數(shù)據(jù)分析方法中的算法思想及算法詳細(xì)實(shí)現(xiàn)過(guò)程,并結(jié)合簡(jiǎn)單實(shí)例進(jìn)行說(shuō)明,以達(dá)到深入淺出、通俗易懂的目標(biāo)。對(duì)于一些重要定理和結(jié)論,適當(dāng)增加了數(shù)學(xué)證明或公式推導(dǎo)等內(nèi)容,以加強(qiáng)學(xué)習(xí)者對(duì)算法理論的深入理解。書(shū)末附有數(shù)據(jù)分析實(shí)驗(yàn)與應(yīng)用實(shí)踐,給出了基于Python的項(xiàng)目解決方案和過(guò)程。
《數(shù)據(jù)分析算法及應(yīng)用實(shí)踐.基于Python 3.x(富媒體)》的適用對(duì)象主要是高等院校的統(tǒng)計(jì)專(zhuān)業(yè)、大數(shù)據(jù)專(zhuān)業(yè)等高年級(jí)本科生和理工類(lèi)學(xué)科的碩士研究生,也適用于有關(guān)領(lǐng)域中需要數(shù)據(jù)分析處理的廣大工作者。
數(shù)據(jù)分析方法與Python軟件相結(jié)合是本書(shū)的特點(diǎn),隨著大數(shù)據(jù)與人工智能的快速發(fā)展,優(yōu)秀的數(shù)據(jù)處理軟件Python被廣大科技工作者公認(rèn)為數(shù)據(jù)處理的開(kāi)源軟件之一。為使數(shù)據(jù)分析算法與Python更好地結(jié)合,以Python 3.x為平臺(tái)編寫(xiě)了本教材,這也是數(shù)據(jù)處理方法教材發(fā)展進(jìn)步的必然結(jié)果。
本書(shū)主要介紹了數(shù)據(jù)分析中的有監(jiān)督和無(wú)監(jiān)督方法,包括關(guān)聯(lián)規(guī)則、聚類(lèi)和分類(lèi)三類(lèi)基本方法。對(duì)關(guān)聯(lián)規(guī)則、聚類(lèi)和分類(lèi)各部分內(nèi)容的編排上,注重方法發(fā)展的遞進(jìn)性。對(duì)書(shū)中所有的算法都給出了Python參考程序,并在Anaconda 3中的Spyder下測(cè)試通過(guò),同時(shí)每章末都配有一定量的習(xí)題,以方便自學(xué)之用。附錄數(shù)據(jù)分析實(shí)驗(yàn)與應(yīng)用實(shí)踐部分包含8個(gè)項(xiàng)目,并給出了基于Python的項(xiàng)目解決方案和過(guò)程。
建議用64學(xué)時(shí)學(xué)完本書(shū)所有內(nèi)容,同時(shí)要求學(xué)生課下自由上機(jī)實(shí)踐16學(xué)時(shí);本書(shū)的關(guān)聯(lián)規(guī)則方法、聚類(lèi)方法、分類(lèi)方法和高級(jí)數(shù)據(jù)分析方法基本相互獨(dú)立,因此教師也可以根據(jù)學(xué)時(shí)要求,適當(dāng)選擇內(nèi)容進(jìn)行教學(xué)。
本書(shū)由中國(guó)石油大學(xué)(北京)劉建軍、董少群、崔學(xué)慧編著。編寫(xiě)分工如下:劉建軍編寫(xiě)書(shū)中緒論、第1~14章,董少群編寫(xiě)第16章和附錄中的前4個(gè)實(shí)驗(yàn)項(xiàng)目及各章中的Python算法實(shí)現(xiàn)程序,崔學(xué)慧編寫(xiě)第15章和附錄中的后4個(gè)實(shí)驗(yàn)。劉建軍進(jìn)行統(tǒng)稿。
本書(shū)編寫(xiě)過(guò)程中參考了國(guó)內(nèi)已出版的相關(guān)書(shū)籍和算法的原始論文及大量在線(xiàn)資料,對(duì)這些作者致以誠(chéng)摯的謝意。中國(guó)石油大學(xué)(北京)許香敏老師對(duì)部分章節(jié)作了認(rèn)真審閱,翟瑞、李文亮、王炳哲、黃麗媛、林秋婷、尹彤、孫萌萌和董靖等研究生幫助整理和校讀了部分書(shū)稿,對(duì)他們的熱忱幫助表示感謝。
由于編著者水平所限,盡管做了很大努力,書(shū)中仍可能存在一些缺點(diǎn)和錯(cuò)誤,望廣大讀者給予批評(píng)指正。
緒論
0.1 大數(shù)據(jù)背景下的數(shù)據(jù)分析
0.2 大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析的區(qū)別
0.3 數(shù)據(jù)分析的基本過(guò)程及數(shù)據(jù)的預(yù)處理
0.4 數(shù)據(jù)分析方法分類(lèi)
0.5 本書(shū)主要內(nèi)容
第1篇 關(guān)聯(lián)規(guī)則方法
第1章 關(guān)聯(lián)分析算法
1.1 Apriori算法
1.2 AprioriTID算法
習(xí)題
第2章 FP-Growth、ECLAT和RElim算法
2.1 FP-Growth算法
2.2 ECLAT算法
2.3 RElim算法
習(xí)題
第2篇 聚類(lèi)方法
第3章 聚類(lèi)問(wèn)題基礎(chǔ)知識(shí)
3.1 聚類(lèi)分析概述
3.2 數(shù)據(jù)變換處理方法
3.3 聚類(lèi)算法中的距離計(jì)算
3.4 聚類(lèi)算法評(píng)價(jià)
習(xí)題
第4章 基于劃分的聚類(lèi)方法
4.1 K-Means聚類(lèi)算法
4.2 K-Means的改進(jìn)算法
4.3 AP聚類(lèi)算法
習(xí)題
第5章 基于層次的聚類(lèi)方法
5.1 基于層次的聚類(lèi)方法思想
5.2 BIRCH算法
5.3 CURE算法
5.4 ROCK算法
習(xí)題
第6章 基于密度的聚類(lèi)方法
6.1 DBSCAN聚類(lèi)方法
6.2 OPTICS聚類(lèi)方法
6.3 均值遷移聚類(lèi)方法
6.4 密度峰值聚類(lèi)方法
習(xí)題
第7章 基于網(wǎng)格的聚類(lèi)方法
7.1 STING算法
7.2 WaveCluster算法
7.3 CLIQUE算法
習(xí)題
第8章 基于圖的聚類(lèi)方法
8.1 圖的基本概念
8.2 Chameleon算法
8.3 譜聚類(lèi)算法
習(xí)題
第9章 基于模型的聚類(lèi)方法
9.1 EM算法
9.2 混合高斯模型(GMM)算法
習(xí)題
第3篇 分類(lèi)方法
第10章 分類(lèi)方法概述
10.1 分類(lèi)概述
10.2 分類(lèi)模型的評(píng)估
第11章 k-近鄰算法與k-d樹(shù)
11.1 k-近鄰算法
11.2 k-d樹(shù)
習(xí)題
第12章 決策樹(shù)與隨機(jī)森林
12.1 決策樹(shù)
12.2 隨機(jī)森林
12.3 決策樹(shù)與隨機(jī)森林分類(lèi)算法的Python實(shí)現(xiàn)
習(xí)題
第13章 自適應(yīng)提升和梯度提升算法
13.1 Boosting算法
13.2 自適應(yīng)提升算法
13.3 梯度提升決策樹(shù)算法
13.4 XGBoost算法
習(xí)題
第14章 樸素貝葉斯分類(lèi)算法
14.1 貝葉斯基礎(chǔ)知識(shí)
14.2 樸素貝葉斯算法原理
14.3 樸素貝葉斯分類(lèi)算法的參數(shù)估計(jì)
14.4 樸素貝葉斯算法的Python實(shí)現(xiàn)
習(xí)題
第4篇 高級(jí)數(shù)據(jù)分析方法
第15章 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理方法
15.1 人工神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
15.2 感知器分類(lèi)算法
15.3 BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)分類(lèi)
15.4 SOM聚類(lèi)法
習(xí)題
第16章 支持向量機(jī)分類(lèi)算法
16.1 線(xiàn)性支持向量機(jī)
16.2 軟間隔線(xiàn)性支持向量機(jī)
16.3 非線(xiàn)性支持向量機(jī)
16.4 序列最小優(yōu)化算法
16.5 SVM實(shí)現(xiàn)多分類(lèi)
16.6 SVM的特點(diǎn)及SVM分類(lèi)的Python實(shí)現(xiàn)
習(xí)題
參考文獻(xiàn)
附錄 數(shù)據(jù)分析實(shí)驗(yàn)與應(yīng)用實(shí)踐
附錄A 數(shù)據(jù)文件操作基礎(chǔ)
A.1 導(dǎo)入導(dǎo)出txt文件
A.2 導(dǎo)入導(dǎo)出csv文件
A.3 應(yīng)用pandas包讀寫(xiě)數(shù)據(jù)文件
附錄B 零售市場(chǎng)數(shù)據(jù)關(guān)聯(lián)分析
B.1 項(xiàng)目背景
B.2 導(dǎo)入數(shù)據(jù)
B.3 數(shù)據(jù)描述性分析
B.4 數(shù)據(jù)預(yù)處理
B.5 尋找關(guān)聯(lián)規(guī)則
B.6 小結(jié)
附錄C 用K-Means聚類(lèi)進(jìn)行客戶(hù)細(xì)分
C.1 項(xiàng)目背景
C.2 導(dǎo)入數(shù)據(jù)
C.3 數(shù)據(jù)分析
C.4 小結(jié)
附錄D 應(yīng)用GMM識(shí)別語(yǔ)音人物
D.1 項(xiàng)目任務(wù)
D.2 數(shù)據(jù)準(zhǔn)備
D.3 GMM建模
D.4 結(jié)果與結(jié)論
附錄E 基于K-近鄰算法的手寫(xiě)數(shù)字識(shí)別
E.1 項(xiàng)目背景
E.2 手寫(xiě)數(shù)字識(shí)別模型原理
E.3 數(shù)據(jù)及數(shù)據(jù)前期處理
E.4 構(gòu)建KNN算法并測(cè)試算法
E.5 小結(jié)
附錄F 應(yīng)用樸素貝葉斯分類(lèi)器過(guò)濾垃圾郵件
F.1 項(xiàng)目背景
F.2 收集并準(zhǔn)備數(shù)據(jù)
F.3 構(gòu)造分類(lèi)函數(shù)
F.4 訓(xùn)練算法
F.5 測(cè)試算法
F.6 小結(jié)
附錄G 基于隨機(jī)森林和GBDT的心血管疾病診斷
G.1 項(xiàng)目背景
G.2 數(shù)據(jù)說(shuō)明與預(yù)處理
G.3 探索性分析
G.4 分類(lèi)建模
G.5 小結(jié)
附錄H 基于SVM的圖像分類(lèi)
H.1 項(xiàng)目任務(wù)
H.2 SVM圖像分類(lèi)的基本流程
H.3 實(shí)際數(shù)據(jù)處理
H.4 結(jié)果與小結(jié)