本書共分8章,主要內(nèi)容如下:
第1章介紹數(shù)據(jù)的認知與研究任務,大數(shù)據(jù)概念特征及技術挑戰(zhàn)等。
第2章介紹大數(shù)據(jù)內(nèi)容、知識和結果表達概念,以及元數(shù)據(jù)和知識圖譜技術。
第3章介紹數(shù)據(jù)存儲基礎、大數(shù)據(jù)存儲要求以及應對技術和典型系統(tǒng)。
第4章介紹數(shù)據(jù)管理基礎,新型數(shù)據(jù)管理模型及其相應大數(shù)據(jù)管理系統(tǒng)。
第5章介紹數(shù)據(jù)計算基礎,大數(shù)據(jù)計算特點,大數(shù)據(jù)的批量、流、圖等新計算模型和特點,以及計算引擎的工作原理等。
第6章介紹大數(shù)據(jù)分析概念、分類聚類等數(shù)據(jù)分析的基本方法,以及深度學習等數(shù)據(jù)分析的高級方法。
第7章介紹數(shù)據(jù)可視化概念、可視化方法與常用工具,以及大數(shù)據(jù)可視化面臨的問題及相應方法。
第8章介紹大數(shù)據(jù)面臨的安全威脅和安全需求,以及針對大數(shù)據(jù)全生命周期不同階段的大數(shù)據(jù)安全技術。
更多科學出版社服務,請掃碼獲取。
戰(zhàn)略支援部隊信息工程大學教授。長期從事網(wǎng)絡數(shù)據(jù)分析方向的研究工作。
目錄
第1章 大數(shù)據(jù)概述1
1.1 認知數(shù)據(jù)1
1.1.1 數(shù)據(jù)概念1
1.1.2 數(shù)據(jù)研究內(nèi)容2
1.2 認知大數(shù)據(jù)5
1.2.1 大數(shù)據(jù)形成6
1.2.2 大數(shù)據(jù)概念7
1.2.3 大數(shù)據(jù)技術9
1.3 大數(shù)據(jù)表達12
1.4 大數(shù)據(jù)面臨的挑戰(zhàn)14
1.4.1 數(shù)據(jù)復雜性帶來的挑戰(zhàn)14
1.4.2 計算復雜性帶來的挑戰(zhàn)15
1.4.3 系統(tǒng)復雜性帶來的挑戰(zhàn)15
思考題16
第2章 大數(shù)據(jù)表達方法17
2.1 元數(shù)據(jù)17
2.1.1 元數(shù)據(jù)形成18
2.1.2 元數(shù)據(jù)概念20
2.1.3 元數(shù)據(jù)體系22
2.2 大數(shù)據(jù)的元數(shù)據(jù)24
2.2.1 大數(shù)據(jù)的元數(shù)據(jù)標準24
2.2.2 元數(shù)據(jù)管理25
2.3 知識表示26
2.3.1 知識的概念26
2.3.2 知識表示的概念26
2.3.3 命題邏輯與謂詞邏輯29
2.3.4 語義網(wǎng)絡32
2.3.5 本體33
2.3.6 語義Web35
2.4 知識圖譜39
2.4.1 知識圖譜概念40
2.4.2 知識圖譜的數(shù)據(jù)模型40
2.4.3 知識圖譜的向量表示43
思考題45
第3章 大數(shù)據(jù)存儲46
3.1 數(shù)據(jù)存儲基礎46
3.1.1 數(shù)據(jù)存儲概念46
3.1.2 磁盤存儲原理48
3.1.3 磁盤陣列52
3.1.4 磁盤卷58
3.1.5 存儲空間59
3.2 數(shù)據(jù)存儲系統(tǒng)62
3.2.1 基于數(shù)據(jù)塊的存儲系統(tǒng)62
3.2.2 基于文件的存儲系統(tǒng)64
3.2.3 基于對象的存儲系統(tǒng)69
3.3 大數(shù)據(jù)存儲現(xiàn)狀69
3.3.1 大數(shù)據(jù)存儲面對的挑戰(zhàn)70
3.3.2 云存儲71
思考題72
第4章 大數(shù)據(jù)管理73
4.1 數(shù)據(jù)管理相關知識73
4.1.1 數(shù)據(jù)管理概念73
4.1.2 數(shù)據(jù)管理模型75
4.1.3 數(shù)據(jù)管理系統(tǒng)76
4.2 大數(shù)據(jù)管理面臨的主要問題79
4.3 分布式文件系統(tǒng)80
4.3.1 文件管理系統(tǒng)原理概述81
4.3.2 分布式文件管理系統(tǒng)原理85
4.3.3 典型的HDFS分布式文件系統(tǒng)90
4.4 NoSQL數(shù)據(jù)庫系統(tǒng)96
4.4.1 關系模型98
4.4.2 非關系模型99
4.4.3 NoSQL數(shù)據(jù)存儲109
4.4.4 NoSQL基本理論111
4.4.5 NoSQL體系框架112
思考題113
第5章 大數(shù)據(jù)計算115
5.1 計算系統(tǒng)及其體系結構115
5.2 計算服務系統(tǒng)及其體系結構118
5.3 大數(shù)據(jù)的計算類型及特點121
5.4 大數(shù)據(jù)的批量計算123
5.4.1 MapReduce及其計算123
5.4.2 Spark及其計算127
5.5 大數(shù)據(jù)的流式計算133
5.5.1 流數(shù)據(jù)概念及特點133
5.5.2 Spark Streaming及其流計算134
5.5.3 Storm及其流計算138
5.6 大數(shù)據(jù)的圖計算141
5.6.1 BSP模型142
5.6.2 圖計算系統(tǒng)Pregel145
思考題146
第6章 大數(shù)據(jù)分析148
6.1 大數(shù)據(jù)分析概念148
6.2 數(shù)據(jù)分析的基本方法149
6.2.1 數(shù)據(jù)分類算法149
6.2.2 數(shù)據(jù)聚類方法157
6.2.3 關聯(lián)規(guī)則算法163
6.2.4 圖數(shù)據(jù)分析168
6.3 數(shù)據(jù)分析的高級方法173
6.3.1 深度學習173
6.3.2 強化學習178
6.3.3 遷移學習180
思考題181
第7章 大數(shù)據(jù)可視化182
7.1 數(shù)據(jù)可視化概述182
7.1.1 可視化與可視化技術182
7.1.2 數(shù)據(jù)可視化概念183
7.1.3 數(shù)據(jù)可視化作用184
7.2 數(shù)據(jù)可視化技術186
7.2.1 數(shù)據(jù)基本統(tǒng)計特征的可視化186
7.2.2 高維數(shù)據(jù)的可視化189
7.2.3 面向大數(shù)據(jù)主流應用的信息可視化192
7.3 常用數(shù)據(jù)可視化工具198
7.3.1 基于Excel的數(shù)據(jù)可視化198
7.3.2 基于Tableau的數(shù)據(jù)可視化201
7.3.3 基于JavaScript開發(fā)的數(shù)據(jù)可視分析205
7.4 大數(shù)據(jù)可視化面臨問題與挑戰(zhàn)211
思考題212
第8章 大數(shù)據(jù)安全213
8.1 大數(shù)據(jù)安全概覽213
8.1.1 大數(shù)據(jù)安全形勢213
8.1.2 大數(shù)據(jù)安全威脅214
8.1.3 大數(shù)據(jù)安全需求214
8.2 大數(shù)據(jù)安全技術215
8.2.1 匿名認證技術215
8.2.2 訪問控制安全技術220
8.2.3 數(shù)據(jù)存儲完整性證明技術225
8.2.4 數(shù)據(jù)處理安全技術228
8.2.5 數(shù)據(jù)發(fā)布隱私保護技術234
思考題238
參考文獻239