數(shù)據(jù)科學(xué)理論與實踐--基于Python的實現(xiàn)
定 價:68 元
當前圖書已被 10 所學(xué)校薦購過!
查看明細
- 作者:何曙光
- 出版時間:2024/5/1
- ISBN:9787030784063
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP311.561
- 頁碼:326
- 紙張:
- 版次:1
- 開本:16
本書內(nèi)容涵蓋數(shù)據(jù)科學(xué)基礎(chǔ)知識,介紹了數(shù)據(jù)科學(xué)的工作流程,包括數(shù)據(jù)采集、數(shù)據(jù)整理和探索、數(shù)據(jù)可視化和數(shù)據(jù)建模預(yù)測等技術(shù),并通過文本、圖像、語音等前沿應(yīng)用,引入人工智能技術(shù)在數(shù)據(jù)科學(xué)領(lǐng)域應(yīng)用的新成果。全書設(shè)計收集了多個數(shù)據(jù)分析案例,采用Python及相關(guān)科學(xué)計算工具包介紹數(shù)據(jù)分析實現(xiàn)的方法,幫助讀者通過實際應(yīng)用理解數(shù)據(jù)科學(xué)知識,掌握實踐技能,運用統(tǒng)計學(xué)、人工智能等技術(shù)解決實際問題。本書通俗易懂、實例豐富、技術(shù)先進,配備豐富的教學(xué)資源,可作為各類大專院校數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)的入門教材,計算機基礎(chǔ)教學(xué)較高層次課程的教材,也可以作為數(shù)據(jù)科學(xué)實踐的技術(shù)參考書。
更多科學(xué)出版社服務(wù),請掃碼獲取。
中國質(zhì)量協(xié)會學(xué)術(shù)教育工作委員會委員、天津市工業(yè)工程學(xué)會副理事長、天津市現(xiàn)場統(tǒng)計研究會理事
目錄
前言
第1章 數(shù)據(jù)科學(xué)概論1
1.1 數(shù)據(jù)與大數(shù)據(jù)1
1.1.1 數(shù)據(jù)、信息和知識1
1.1.2 大數(shù)據(jù)3
1.2 數(shù)據(jù)科學(xué)及其工作流程概述4
1.2.1 數(shù)據(jù)科學(xué)概述4
1.2.2 數(shù)據(jù)科學(xué)工作流程4
習(xí)題6
第2章 Python基礎(chǔ)7
2.1 Python概述7
2.1.1 計算機語言概述7
2.1.2 Python語言簡介8
2.1.3 Python解釋器及開發(fā)環(huán)境的安裝9
2.2 Python基礎(chǔ)12
2.2.1 Python基礎(chǔ)語法12
2.2.2 Python復(fù)雜數(shù)據(jù)類型13
2.2.3 Python運算符19
2.2.4 Python控制語句20
2.3 函數(shù)和類的定義27
2.3.1 Python函數(shù)的定義和調(diào)用27
2.3.2 Python與面向?qū)ο缶幊?0
2.4 Python包31
2.4.1 Python包的結(jié)構(gòu)和導(dǎo)入31
2.4.2 Python常用包簡介33
習(xí)題33
第3章 Python常用模塊35
3.1 numpy與矩陣運算35
3.1.1 numpy多維數(shù)組基礎(chǔ)35
3.1.2 數(shù)組索引39
3.1.3 數(shù)組運算40
3.1.4 numpy簡單統(tǒng)計函數(shù)41
3.2 基于pandas的數(shù)據(jù)操縱與管理42
3.2.1 pandas基礎(chǔ)43
3.2.2 DataFrame的切片和計算45
3.2.3 DataFrame數(shù)據(jù)運算48
3.2.4 數(shù)據(jù)的合并54
3.3 基于matplotlib和seaborn的數(shù)據(jù)可視化57
3.3.1 matplotlib數(shù)據(jù)可視化概述57
3.3.2 matplotlib數(shù)據(jù)可視化示例60
3.3.3 seaborn數(shù)據(jù)可視化67
3.4 基于sympy的符號計算74
3.4.1 sympy基礎(chǔ)74
3.4.2 表達式操作75
3.4.3 積分與微分78
3.4.4 sympy方程求解81
3.4.5 sympy與函數(shù)可視化82
3.5 基于scipy的科學(xué)計算83
3.5.1 scipy線性代數(shù)84
3.5.2 數(shù)值積分86
3.5.3 插值87
習(xí)題91
第4章 基于Python的最優(yōu)化92
4.1 最優(yōu)化問題的形式化定義與分類92
4.2 基于scipy的函數(shù)優(yōu)化93
4.2.1 無約束最優(yōu)化93
4.2.2 約束最優(yōu)化98
4.2.3 其他最優(yōu)化算法101
4.3 基于cvxpy的凸優(yōu)化建模與求解103
4.3.1 凸優(yōu)化的基本概念104
4.3.2 cvxpy及凸優(yōu)化問題求解106
4.3.3 凸優(yōu)化問題實例116
4.4 基于gurobipy的數(shù)學(xué)規(guī)劃建模與求解134
4.4.1 Gurobi簡介134
4.4.2 基于gurobipy求解數(shù)學(xué)規(guī)劃的步驟135
4.4.3 gurobipy建模與求解實例138
4.4.4 gurobipy中的常用問題轉(zhuǎn)換技巧145
習(xí)題147
第5章 基于Python的統(tǒng)計分析148
5.1 scipy與統(tǒng)計分布148
5.1.1 基于scipy的基本統(tǒng)計分布148
5.1.2 主要離散分布簡介149
5.1.3 主要連續(xù)分布簡介153
5.1.4 抽樣分布158
5.1.5 基本統(tǒng)計分析160
5.2 基于Python的分布參數(shù)估計163
5.2.1 參數(shù)的點估計164
5.2.2 參數(shù)的區(qū)間估計165
5.2.3 存在截尾數(shù)據(jù)的韋布爾分布參數(shù)估計實例167
5.3 假設(shè)檢驗169
5.3.1 假設(shè)檢驗的基本概念169
5.3.2 scipy中的假設(shè)檢驗170
5.4 基于Python的統(tǒng)計模型174
5.4.1 線性回歸174
5.4.2 廣義線性模型179
5.4.3 廣義估計方程181
5.4.4 廣義加性模型182
5.4.5 基于表達式的模型定義184
習(xí)題186
第6章 基于Python的機器學(xué)習(xí)187
6.1 機器學(xué)習(xí)概述187
6.1.1 機器學(xué)習(xí)及相關(guān)概念187
6.1.2 機器學(xué)習(xí)的結(jié)構(gòu)189
6.1.3 基于Python的機器學(xué)習(xí)192
6.1.4 sklearn基礎(chǔ)192
6.2 監(jiān)督學(xué)習(xí)模型199
6.2.1 分類模型199
6.2.2 回歸模型217
6.2.3 集成方法223
6.3 非監(jiān)督學(xué)習(xí)算法229
6.3.1 聚類229
6.3.2 高斯混合模型234
6.3.3 流形學(xué)習(xí)235
6.3.4 信號成分分解237
6.3.5 異常檢測239
6.4 機器學(xué)習(xí)模型選擇和評估242
6.4.1 模型選擇與評估242
6.4.2 超參數(shù)設(shè)置247
6.4.3 特征選擇250
6.4.4 模型的保存和讀取252
習(xí)題253
第7章 基于PyTorch的神經(jīng)網(wǎng)絡(luò)254
7.1 神經(jīng)網(wǎng)絡(luò)254
7.1.1 神經(jīng)網(wǎng)絡(luò)基本原理254
7.1.2 激活函數(shù)255
7.1.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程256
7.2 基于PyTorch的神經(jīng)網(wǎng)絡(luò)建模257
7.2.1 Torch簡介258
7.2.2 變量和自動求導(dǎo)機制autograd259
7.3 PyTorch神經(jīng)網(wǎng)絡(luò)建模262
7.4 基于PyTorch的神經(jīng)網(wǎng)絡(luò)示例267
7.4.1 回歸問題267
7.4.2 分類問題268
7.4.3 多項式擬合問題269
習(xí)題271
第8章 網(wǎng)絡(luò)文本數(shù)據(jù)分析與實踐272
8.1 網(wǎng)絡(luò)文本數(shù)據(jù)分析概述272
8.1.1 網(wǎng)絡(luò)數(shù)據(jù)分析的基本流程272
8.1.2 網(wǎng)絡(luò)數(shù)據(jù)分析主要應(yīng)用場景273
8.1.3 網(wǎng)絡(luò)數(shù)據(jù)分析典型案例273
8.2 Web應(yīng)用構(gòu)成要素及工作流程275
8.2.1 網(wǎng)頁構(gòu)成要素276
8.2.2 Web訪問請求和響應(yīng)過程277
8.2.3 靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁280
8.2.4 審查網(wǎng)頁元素282
8.3 基于Python的網(wǎng)絡(luò)數(shù)據(jù)獲取283
8.3.1 User-Agent283
8.3.2 基于urllib的網(wǎng)絡(luò)數(shù)據(jù)獲取284
8.3.3 基于requests包的網(wǎng)絡(luò)數(shù)據(jù)獲取287
8.4 網(wǎng)絡(luò)數(shù)據(jù)解析289
8.4.1 正則表達式289
8.4.2 基于lxml的信息提取291
8.4.3 Beautiful Soup293
8.5 文本處理298
8.5.1 數(shù)據(jù)預(yù)處理298
8.5.2 中文分詞300
8.5.3 去除停用詞301
8.5.4 關(guān)鍵詞分析302
8.6 文本數(shù)據(jù)建模與分析306
8.6.1 文本主題模型306
8.6.2 情感分析模型309
習(xí)題311
參考文獻312