如何從數據中挖掘價值?一是要鍛煉數據思維;二是需要選擇一個便利快捷的工具。R語言在數據分析方面有著靈活、高效的優(yōu)勢。本書以R語言為基礎,深度講解從數據思維到實戰(zhàn)的全過程。在章節(jié)組織上,本從R語言簡介及優(yōu)勢入手,再到數據讀取、清洗、描述、建模等數據分析的各個環(huán)節(jié),由淺入深逐個講解,是一本實務分析中的“R語言指南”。同時,本書采用大量實際案例輔以說明,既有助于上手分析,也可用于教學使用。
本書所有代碼、數據可在狗熊會官網(http://www.xiong99.com.cn/create.php)免費下載。同時,關注狗熊會微信公眾號,可獲取更多擴展資源。
朱雪寧 復旦大學大數據學院助理教授。博士畢業(yè)于北京大學光華管理學院商務統(tǒng)計系,后于賓州州立大學(Pennsylvania State University)從事博士后研究工作。狗熊會創(chuàng)始團隊成員、《R語千尋》專欄負責人;統(tǒng)計之都核心成員、編輯部主編。研究上關注社交網絡數據分析、高維數據分析等問題。
第1章初識R語言
1.1初識R語言
1.2安裝R語言
1.3獲取R幫助文檔
第2章R語言數據操作
2.1R中的數據類型
2.2數據讀入
第3章R語言與統(tǒng)計分析
3.1描述分析及可視化
3.2統(tǒng)計檢驗
3.3回歸分析
3.4代碼規(guī)范與文檔撰寫
第4章R語言與非結構化數據分析
4.1文本分析
4.2圖像分析
第5章R語言與機器學習
5.1機器學習概述
5.2數據預處理
5.3模型訓練與調參
5.4模型訓練與集成
第6章R語言爬蟲初介
6.1HTML基礎與R語言解析
6.2XML與XPath表達式以及R爬蟲應用
6.3HTTP協(xié)議
6.4AJAX與網頁動態(tài)加載
6.5正則表達式與字符串處理函數
6.6R語言爬蟲實戰(zhàn)