《Python數據分析項目全程實錄》精選不同行業(yè)、不同分析方法以及機器學習等方向的12個熱門Python數據分析項目。這些項目既可以作為練手項目,也可以應用于實際數據分析工作中,其中的機器學習還可作為參賽項目的參考?傮w來說,這些項目的實用性都非常強。具體項目包含:熱銷產品銷售數據統計分析、籃壇薪酬揭秘:球員位置與薪資數據的深度分析、股海秘籍:股票行情數據分析之旅、京東某商家的銷售評價數據分析、商城注冊用戶數據探索分析、自媒體賬號內容數據分析、汽車數據可視化與相關性分析、抖音電商數據分析系統、會員數據化運營RFM分析實戰(zhàn)、商超購物Apriori關聯分析、基于K-Means算法實現鳶尾花聚類分析、電視節(jié)目數據分析系統。本書從數據分析、機器學習的角度出發(fā),按照項目開發(fā)的順序,系統、全面地講解每一個項目的開發(fā)實現過程。體例上,每章一個項目,統一采用開發(fā)背景系統設計技術準備各功能模塊實現項目運行源碼下載的形式完整呈現項目,給讀者明確的成就感,可以讓讀者快速積累實際數據分析經驗與技巧,早日實現就業(yè)目標。
叢書說明:軟件項目開發(fā)全程實錄叢書第1版于2008年6月出版,因其定位于項目開發(fā)案例、面向實際開發(fā)應用,并解決了社會需求和高校課程設置相對脫節(jié)的痛點,在軟件項目開發(fā)類圖書市場上產生了很大的反響,在全國軟件項目開發(fā)零售圖書排行榜中名列前茅。
軟件項目開發(fā)全程實錄叢書第2版于2011年1月出版,第3版于2013年10月出版,第4版于2018年5月出版。經過十六年的錘煉打造,不僅深受廣大程序員的喜愛,還被百余所高校選為計算機科學、軟件工程等相關專業(yè)的教材及教學參考用書,更被廣大高校學子用作畢業(yè)設計和工作實習的參考用書。
軟件項目開發(fā)全程實錄叢書第5版在繼承前4版所有優(yōu)點的基礎上,進行了大幅度的改版升級。首先,結合當前技術發(fā)展的最新趨勢與市場需求,增加了程序員求職急需的新圖書品種;其次,對圖書內容進行了深度更新、優(yōu)化,新增了當前熱門的流行項目,優(yōu)化了原有經典項目,將開發(fā)環(huán)境和工具更新為目前的新版本等,使之更與時代接軌,更適合讀者學習;最后,錄制了全新的項目精講視頻,并配備了更加豐富的學習資源與服務,可以給讀者帶來更好的項目學習及使用體驗。
現如今,數據分析已經廣泛應用于各行各業(yè),成為許多商家和企業(yè)不可或缺的一部分。無論是金融、醫(yī)療、教育、制造還是零售等行業(yè),都需要數據分析來幫助人們做出判斷,以便采取適當的措施。對于企業(yè)和商家來說,數據分析可以幫助企業(yè)更好地理解市場需求、制定營銷策略、提升運營水平,并為決策者提供戰(zhàn)略參考等。
作為數據分析工具,Python無疑是最佳之選,因為它不僅簡單易學、數據處理高效,而且對于初學者來說容易上手。在科學計算、數據分析、數據可視化、數據挖掘和機器學習等方面,Python占據了越來越重要的地位。本書以中小型項目為載體,帶領讀者親身體驗數據分析在各個領域應用的實際過程,從而提升數據分析技能和項目經驗,掌握各種分析方法以及機器學習技術。全書內容不是枯燥的語法和陌生的術語,而是一步一步地引導讀者實現一個個熱門的項目,從而激發(fā)讀者學習數據分析的興趣,將被動學習轉變?yōu)橹鲃訉W習。另外,本書的項目開發(fā)過程完整,不僅可以應用于實際工作,還可以作為數據分析師以及從事數據相關工作的人員提升數據分析項目經驗的工具書,同時可以作為大學生畢業(yè)設計的項目參考用書。
本書內容
本書提供不同行業(yè)、不同分析方法以及機器學習等方向的12個熱門Python數據分析項目,具體項目包括:熱銷產品銷售數據統計分析、籃壇薪酬揭秘:球員位置與薪資數據的深度分析、股海秘籍:股票行情數據分析之旅、京東某商家的銷售評價數據分析、商城注冊用戶數據探索分析、自媒體賬號內容數據分析、汽車數據可視化與相關性分析、抖音電商數據分析系統、會員數據化運營RFM分析實戰(zhàn)、商超購物Apriori關聯分析、基于K-Means算法實現鳶尾花聚類分析、電視節(jié)目數據分析系統。
本書特點
(1)項目典型。本書精選12個熱點項目。這些項目均是當前實際開發(fā)領域常見的熱門項目,且每個項目均從實際應用角度出發(fā),進行系統性的講解,旨在幫助讀者通過項目學習,積累豐富的數據分析經驗。
(2)流程清晰。本書項目從軟件工程的角度出發(fā),統一采用開發(fā)背景系統設計技術準備各功能模塊實現項目運行源碼下載的形式呈現內容,這樣的結構讓讀者能夠更加清晰地了解項目的完整開發(fā)流程,從而增強讀者的成就感和自信心。
(3)技術新穎。本書所有項目的實現技術均采用目前業(yè)內推薦使用的最新穩(wěn)定版本,確保了技術與時俱進,并且具有極強的實用性。同時,每個項目都配備了技術準備一節(jié),其中對項目中用到的Python數據分析基本技術點、高級應用、第三方庫等進行了精要講解。這些內容在Python數據分析基礎和項目開發(fā)之間搭建了有效的橋梁,為僅有Python數據分析基礎的初級編程人員參與數據分析項目掃清了障礙。
(4)欄目精彩。本書根據項目學習的需要,在每個項目講解過程的關鍵位置添加了注意說明等特色欄目,點撥項目的開發(fā)要點和精華,以便讀者能更快地掌握相關技術的應用技巧。
(5)源碼下載。本書在每個項目的最后都安排了源碼下載一節(jié),讀者可以通過掃描對應二維碼下載對應項目的完整源碼,從而方便學習和參考。
(6)項目視頻。本書為每個項目都提供了開發(fā)及使用微視頻,使讀者能夠更加輕松地搭建、運行、使用項目,并且可以隨時隨地進行查看和學習。
讀者對象:數據分析愛好者;高等院校的教師;Python愛好者;IT培訓機構的教師與學員;提升數據分析技能的職場人員;數據分析師;參加畢業(yè)設計的學生;編程愛好者。
資源與服務
本書提供了大量的輔助學習資源,同時還提供了專業(yè)的知識拓展與答疑服務,旨在幫助讀者提高學習效率并解決學習過程中遇到的各種疑難問題。讀者需要刮開圖書封底的防盜碼(刮刮卡),掃描并綁定微信,獲取學習權限。
(1)開發(fā)環(huán)境搭建視頻。搭建環(huán)境對于項目開發(fā)非常重要,它確保了項目開發(fā)在一致的環(huán)境下進行,減少了因環(huán)境差異導致的錯誤和沖突。通過搭建開發(fā)環(huán)境,可以方便地管理項目依賴,提高開發(fā)效率。本書提供了開發(fā)環(huán)境搭建講解視頻,可以引導讀者快速準確地搭建本書項目的開發(fā)環(huán)境。
(2)項目精講視頻。本書每個項目均配有對應的項目精講微視頻,主要針對項目的需求背景、應用價值、功能結構、業(yè)務流程、實現邏輯以及所用到的核心技術點進行精要講解,可以幫助讀者了解項目概要,把握項目要領,快速進入學習狀態(tài)。
(3)項目源碼。本書每章一個項目,系統全面地講解了該項目的設計及實現過程。為了方便讀者學習,本書提供了完整的項目源碼(包含項目中用到的所有素材,如圖片、數據表等)。
(4)AI輔助開發(fā)手冊。在人工智能浪潮的席卷之下,AI大模型工具呈現百花齊放之態(tài),輔助編程開發(fā)的代碼助手類工具不斷涌現,可為開發(fā)人員提供技術點問答、代碼查錯、輔助開發(fā)等非常實用的服務,極大地提高了編程學習和開發(fā)效率。為了幫助讀者快速熟悉并使用這些工具,本書專門精心配備了電子版的《AI輔助開發(fā)手冊》,不僅為讀者提供各個主流大語言模型的使用指南,而且詳細講解文心快碼(Baidu Comate)、通義靈碼、騰訊云AI代碼助手、iFlyCode等專業(yè)的智能代碼助手的使用方法。
(5)代碼查錯器。為了進一步幫助讀者提升學習效率,培養(yǎng)良好的編碼習慣,本書配備了由明日科技自主開發(fā)的代碼查錯器。讀者可以將本書的項目源碼保存為對應的txt文件,存放到代碼查錯器的對應文件夾中,然后自己編寫相應的實現代碼并與項目源碼進行比對,快速找出自己編寫的代碼與源碼不一致或者發(fā)生錯誤的地方。
(6)Python開發(fā)資源庫。本書配備了強大的線上Python開發(fā)資源庫,包括技術資源庫、技巧資源庫、實例資源庫、項目資源庫、源碼資源庫、視頻資源庫。
(7)Python面試資源庫。本書配備了Python面試資源庫,精心匯編了大量企業(yè)面試真題,是求職面試的絕佳指南。
(8)教學PPT。本書配備了精美的教學PPT,可供高校教師和培訓機構講師備課使用,也可供讀者做知識梳理。
(9)學習答疑。在學習過程中,讀者難免會遇到各種疑難問題。本書配有完善的新媒體學習矩陣,可為讀者提供專業(yè)的知識拓展與答疑服務。
致讀者
在編寫本書的過程中,我們始終本著科學、嚴謹的態(tài)度,力求精益求精,但疏漏之處在所難免,敬請廣大讀者批評指正。
感謝您選擇本書,希望本書能成為您的良師益友,成為您步入編程高手之路的踏腳石。
寶劍鋒從磨礪出,梅花香自苦寒來。祝讀書快樂!
明日科技,全稱是吉林省明日科技有限公司,是一家專業(yè)從事軟件開發(fā)、教育培訓以及軟件開發(fā)教育資源整合的高科技公司,其編寫的教材非常注重選取軟件開發(fā)中的必需、常用內容,同時也很注重內容的易學、方便性以及相關知識的拓展性,深受讀者喜愛。其教材多次榮獲全行業(yè)優(yōu)秀暢銷品種全國高校出版社優(yōu)秀暢銷書等獎項,多個品種長期位居同類圖書銷售排行榜的前列。
第1章 熱銷產品銷售數據統計分析 1
pandas numpy matplotlib ABC分類法
1.1 開發(fā)背景 1
1.2 系統設計 2
1.2.1 開發(fā)環(huán)境 2
1.2.2 分析流程 2
1.2.3 功能結構 2
1.3 技術準備 3
1.3.1 技術概覽 3
1.3.2 ABC分類法 3
1.4 前期工作 4
1.4.1 開發(fā)環(huán)境設置 4
1.4.2 安裝第三方模塊 5
1.4.3 新建項目目錄 5
1.4.4 數據準備 5
1.5 數據預處理 6
1.5.1 查看數據信息 6
1.5.2 缺失性分析 8
1.5.3 描述性統計分析 9
1.6 數據統計分析 10
1.6.1 月銷售趨勢分析 10
1.6.2 熱銷產品分析(ABC分類法) 12
1.6.3 熱銷單品環(huán)比增長情況分析 14
1.6.4 加購人數和購買數量分析 16
1.6.5 不同種類產品的銷量占比情況分析 17
1.6.6 工作日與周末銷量對比分析 19
1.7 項目運行 21
1.8 源碼下載 22
第2章 籃壇薪酬揭秘:球員位置與薪資數據的深度分析 23
pandas numpy matplotlib seaborn
2.1 開發(fā)背景 24
2.2 系統設計 24
2.2.1 開發(fā)環(huán)境 24
2.2.2 分析流程 24
2.2.3 功能結構 25
2.3 技術準備 25
2.3.1 技術概覽 25
2.3.2 詳解read_htlm()獲取網頁數據全過程 25
2.3.3 應用lambda函數快速處理數據 26
2.4 數據準備 27
2.4.1 數據集介紹 27
2.4.2 確定網頁數據的結構 28
2.4.3 獲取當前數據 29
2.5 數據預處理 30
2.5.1 查看數據 30
2.5.2 數據清洗 31
2.5.3 獲取并處理歷史數據 33
2.6 基本統計分析 34
2.6.1 2024賽季球員的薪資排行TOP10 34
2.6.2 統計分析各個球隊的薪資狀況 36
2.6.3 勇士隊球員的薪資狀況分析 37
2.6.4 箱形圖分析實力和戰(zhàn)績TOP5球隊的薪資狀況 39
2.6.5 對比分析20232024賽季各球隊薪資變化 41
2.7 深度分析 42
2.7.1 球員薪資分布密度圖 42
2.7.2 分析不同位置球員的薪資狀況 43
2.7.3 分析球員位置和薪資的關系 45
2.8 項目運行 46
2.9 源碼下載 47
第3章 股海秘籍:股票行情數據分析之旅 48
tushare pandas matplotlib numpy mplfinance
3.1 開發(fā)背景 49
3.2 系統設計 49
3.2.1 開發(fā)環(huán)境 49
3.2.2 分析流程 49
3.2.3 功能結構 50
3.3 技術準備 50
3.3.1 技術概覽 50
3.3.2 詳解tushare模塊獲取股票數據 50
3.3.3 mplfinance模塊的應用 53
3.4 前期準備 56
3.4.1 新建Jupyter Notebook文件 56
3.4.2 導入必要的庫 58
3.4.3 獲取股票行情數據 58
3.5 數據加載與預處理 59
3.5.1 數據加載與處理 59
3.5.2 數據查看與缺失性分析 59
3.5.3 描述性統計分析 60
3.5.4 抽取特征數據 61
3.5.5 異常值分析 61
3.5.6 數據歸一化處理 61
3.6 數據統計分析 63
3.6.1 可視化股票走勢圖 63
3.6.2 股票成交量時間序列圖 63
3.6.3 股票收盤價與成交量分析 64
3.6.4 股票漲跌情況分析 65
3.6.5 股票k線走勢圖 66
3.7 股票指標相關性分析 67
3.7.1 散點圖矩陣分析 67
3.7.2 相關系數分析 68
3.8 項目運行 70
3.9 源碼下載 71
第4章 京東某商家的銷售評價數據分析 72
pandas numpy jieba matplotlib pyecharts snownlp
4.1 開發(fā)背景 72
4.2 系統設計 73
4.2.1 開發(fā)環(huán)境 73
4.2.2 分析流程 73
4.2.3 功能結構 73
4.3 技術準備 74
4.3.1 技術概覽 74
4.3.2 詳解jieba模塊 74
4.3.3 繪制詞云圖 78
4.3.4 snownlp模塊的應用 80
4.4 前期準備 82
4.4.1 安裝第三方模塊 82
4.4.2 新建Jupyter Notebook文件 82
4.4.3 導入必要的庫 84
4.4.4 數據加載 84
4.5 數據預處理 84
4.5.1 查看數據 84
4.5.2 缺失性分析 85
4.5.3 數據處理 86
4.5.4 缺失值處理 87
4.5.5 數據類型轉換 87
4.6 用戶維度分析 88
4.6.1 總體評價狀況分析 88
4.6.2 詞云圖分析差評用戶 89
4.6.3 正負面情感對比分析 90
4.6.4 評價數量和評價時間的關系分析 91
4.7 商品維度分析 93
4.7.1 差評商品分析 93
4.7.2 各評價級別商品件數分析 93
4.8 項目運行 94
4.9 源碼下載 95
第5章 商城注冊用戶數據探索分析 96
MySQL sqlalchemy pandas matplotlib
5.1 開發(fā)背景 97
5.2 系統設計 97
5.2.1 開發(fā)環(huán)境 97
5.2.2 分析流程 97
5.2.3 功能結構 97
5.3 技術準備 98
5.3.1 技術概覽 98
5.3.2 詳解sqlalchemy模塊 98
5.3.3 數據類型轉換兩個核心方法 102
5.3.4 fill_between()函數的應用 102
5.4 導入MySQL數據 103
5.5 數據預處理 105
5.5.1 數據準備 105
5.5.2 sqlalchemy連接MySQL數據庫 105
5.5.3 數據檢測與處理 106
5.6 用戶注冊情況分析 107
5.6.1 年度注冊用戶分析 107
5.6.2 月度注冊用戶分析 109
5.6.3 小時注冊用戶分析 110
5.6.4 新注冊用戶分析 112
5.7 用戶活躍情況分析 113
5.7.1 用戶登錄情況分析 113
5.7.2 用戶登錄周情況分析 114
5.7.3 用戶登錄時段分析(工作日) 116
5.7.4 用戶登錄時段分析(非工作日) 117
5.8 項目運行 118
5.9 源碼下載 119
第6章 自媒體賬號內容數據分析 120
pandas matplotlib plotly
6.1 開發(fā)背景 120
6.2 系統設計 121
6.2.1 開發(fā)環(huán)境 121
6.2.2 分析流程 121
6.2.3 功能結構 121
6.3 技術準備 122
6.3.1 技術概覽 122
6.3.2 pandas查看數據類型 122
6.3.3 詳解to_datetime()函數轉換時間序列數據 123
6.4 前期準備 125
6.4.1 安裝第三方模塊 125
6.4.2 新建Jupyter Notebook文件 126
6.4.3 導入必要的庫 127
6.4.4 數據準備 127
6.4.5 數據預覽 128
6.5 數據預處理 129
6.5.1 數據合并 129
6.5.2 查看數據 130
6.5.3 數據類型轉換 130
6.5.4 描述性統計分析 131
6.6 數據統計分析 133
6.6.1 各類別內容閱讀人數的集中趨勢分析 133
6.6.2 各類別內容數量占比分析 134
6.6.3 箱形圖分析各類別內容的閱讀人數 135
6.6.4 水平柱形圖分析平均展現量 136
6.6.5 箱形圖分析內容展現量 137
6.6.6 內容展現量和閱讀量的相關性分析 138
6.7 項目運行 139
6.8 源碼下載 140
第7章 汽車數據可視化與相關性分析 141
pandas matplotlib seaborn
7.1 開發(fā)背景 141
7.2 系統設計 142
7.2.1 開發(fā)環(huán)境 142
7.2.2 分析流程 142
7.2.3 功能結構 142
7.3 技術準備 143
7.3.1 技術概覽 143
7.3.2 盤點seaborn自帶的數據集 143
7.3.3 value_counts()方法的應用 147
7.3.4 詳解pairplot()函數 147
7.4 前期準備 153
7.4.1 新建項目目錄 153
7.4.2 數據準備 153
7.5 數據預處理 154
7.5.1 查看數據 154
7.5.2 缺失值查看與處理 155
7.5.3 描述性統計分析 156
7.6 數據統計分析 156
7.6.1 汽車產地占比情況分析 156
7.6.2 品牌旗下汽車差異情況分析 157
7.7 相關性分析 159
7.7.1 矩陣圖分析相關性 159
7.7.2 相關系數分析相關性 160
7.7.3 散點圖分析氣缸數和馬力之間的關系 160
7.7.4 折線圖分析氣缸數和油耗之間的關系 161
7.7.5 產地和油耗之間的關系 162
7.7.6 車型生產年份和油耗之間的關系 163
7.7.7 油耗、馬力和重量之間的關系 164
7.8 項目運行 165
7.9 源碼下載 166
第8章 抖音電商數據分析系統 167
pandas numpy pyecharts
8.1 開發(fā)背景 168
8.2 系統設計 168
8.2.1 開發(fā)環(huán)境 168
8.2.2 分析流程 168
8.2.3 功能結構 169
8.3 技術準備 169
8.3.1 技術概覽 169
8.3.2 pandas數據美化樣式匯總 169
8.3.3 eq()方法詳解 172
8.4 前期準備 173
8.4.1 數據準備 173
8.4.2 新建Jupyter Notebook文件 173
8.4.3 導入必要的庫 175
8.5 數據預處理 176
8.5.1 查看數據 176
8.5.2 突出顯示數據 176
8.5.3 0值檢測與處理 177
8.5.4 數據類型轉換 177
8.5.5 描述性統計分析 178
8.6 成交數據分析 179
8.6.1 整體情況分析 179
8.6.2 自營/帶貨訂單量分析 179
8.6.3 不同載體訂單量分析 180
8.6.4 每日訂單量分析 181
8.6.5 商品成交金額分析 182
8.6.6 新老客戶成交額對比分析 183
8.7 主播數據分析 184
8.7.1 引流能力分析 184
8.7.2 互動能力分析 185
8.7.3 吸粉能力分析 186
8.7.4 UV價值分析 186
8.8 項目運行 187
8.9 源碼下載 188
第9章 會員數據化運營RFM分析實戰(zhàn) 189
RFM模型 pandas matplotlib seaborn
9.1 開發(fā)背景 189
9.2 系統設計 190
9.2.1 開發(fā)環(huán)境 190
9.2.2 分析流程 190
9.2.3 功能結構 190
9.3 技術準備 191
9.3.1 技術概覽 191
9.3.2 RFM模型 191
9.3.3 隨機抽取數據的sample()方法 192
9.3.4 深度解讀直方圖(histplot()函數) 193
9.4 前期工作 200
9.4.1 新建項目目錄 200
9.4.2 數據準備 200
9.5 數據預處理 201
9.5.1 數據預覽 201
9.5.2 缺失性分析 202
9.5.3 描述性統計分析 202
9.5.4 數據處理 203
9.5.5 計算RFM值 204
9.6 數據統計分析 205
9.6.1 消費周期分析 205
9.6.2 消費頻次分析 206
9.6.3 消費金額分析 206
9.7 會員群體分析 208
9.7.1 RFM模型指標打分 208
9.7.2 會員群體劃分 209
9.8 項目運行 210
9.9 源碼下載 211
第10章 商超購物Apriori關聯分析 212
pandas matplotlib Apriori關聯分析 mlxtend
10.1 開發(fā)背景 212
10.2 系統設計 213
10.2.1 開發(fā)環(huán)境 213
10.2.2 分析流程 213
10.2.3 功能結構 213
10.3 技術準備 214
10.3.1 技術概覽 214
10.3.2 Apriori關聯分析 214
10.3.3 詳解mlxtend模塊 215
10.4 前期工作 220
10.4.1 新建項目目錄 220
10.4.2 數據準備 221
10.5 數據預處理 221
10.5.1 查看數據 221
10.5.2 轉換交易日期類型 222
10.5.3 重復值檢測與處理 223
10.6 數據統計分析 223
10.6.1 上半年成交金額分析 223
10.6.2 上半年客單價分析 225
10.6.3 顧客客單價占比分析 226
10.7 購物關聯分析 227
10.7.1 統計顧客所購買的商品 227
10.7.2 數據one-hot編碼 228
10.7.3 Apriori關聯分析 229
10.8 項目運行 230
10.9 源碼下載 231
第11章 基于K-Means算法實現鳶尾花聚類分析 232
seaborn pandas matplotlib numpy scikit-learn 232
11.1 開發(fā)背景 233
11.2 系統設計 233
11.2.1 開發(fā)環(huán)境 233
11.2.2 分析流程 233
11.2.3 功能結構 234
11.3 技術準備 234
11.3.1 技術概覽 234
11.3.2 numpy模塊補充知識點 234
11.3.3 深入了解機器學習sklearn模塊 237
11.3.4 訓練集和測試集劃分函數train_test_split()的全面解讀 240
11.3.5 模型評估(calinski_harabasz_score()方法) 242
11.4 前期工作 242
11.4.1 安裝第三方庫 242
11.4.2 新建項目目錄 243
11.4.3 認識鳶尾花 243
11.4.4 了解鳶尾花數據集iris 244
11.5 數據預處理 244
11.5.1 加載數據 244
11.5.2 查看數據 245
11.5.3 查看鳶尾花種類 245
11.5.4 描述性統計分析 245
11.5.5 隨機抽樣 246
11.6 數據統計分析 247
11.6.1 鳶尾花花瓣長度TOP10 247
11.6.2 使用箱形圖分析鳶尾花花瓣的長度 248
11.6.3 最常見的鳶尾花花瓣長度 249
11.6.4 直方圖分析鳶尾花花瓣長度 250
11.7 相關性分析 251
11.7.1 相關系數分析 251
11.7.2 各特征之間關系矩陣圖 252
11.7.3 散點圖分析鳶尾花花瓣長度和寬度的關系 253
11.7.4 散點圖分析鳶尾花花萼長度和寬度的關系 254
11.7.5 鳶尾花的線性關系分析 255
11.8 鳶尾花聚類分析 256
11.8.1 抽取特征數據 256
11.8.2 劃分訓練集和測試集 256
11.8.3 基于K-Means算法創(chuàng)建聚類模型 256
11.8.4 聚類模型評估 258
11.8.5 預測鳶尾花種類 258
11.9 項目運行 258
11.10 源碼下載 259
第12章 電視節(jié)目數據分析系統 260
Qt Designer PyQt5 pandas pyecharts
12.1 開發(fā)背景 260
12.2 系統設計 261
12.2.1 開發(fā)環(huán)境 261
12.2.2 分析流程 261
12.2.3 功能結構 261
12.3 技術準備 262
12.3.1 技術概覽 262
12.3.2 可視化設計環(huán)境安裝與配置 262
12.3.3 Qt Designer入門 264
12.3.4 PyQt5入門知識點總結 267
12.4 前期工作 272
12.4.1 新建項目目錄 272
12.4.2 數據準備 273
12.5 主窗體界面 274
12.5.1 功能草圖 274
12.5.2 創(chuàng)建主窗體 274
12.5.3 工具欄 275
12.5.4 其他控件 277
12.5.5 將.ui文件轉換為.py文件 278
12.6 數據預處理 279
12.6.1 數據預覽 279
12.6.2 查看數據 280
12.6.3 描述性統計分析 280
12.7 數據統計分析 281
12.7.1 數據連接模塊 281
12.7.2 數據分析及可視化模塊 281
12.7.3 顯示主窗體模塊 284
12.8 項目運行 286
12.9 源碼下載 286