數據治理與認知安全在推動國家發(fā)展、保障國家安全、維護社會穩(wěn)定和促進經濟高質量發(fā)展等方面具有不可替代的重要作用。本書覆蓋數據治理與認知安全兩部分內容。數據治理包含數據治理體系、數據處理方法和數據合規(guī)審計三方面內容,主要關注數據的采集、清洗、集成、標注、增強和分析等規(guī)范化的管理過程,確保數據在整個生命周期中保持高質量、一致性、準確性和合規(guī)性,使得數據能被正確利用,有序釋放數據價值。認知安全包含數據建模的基礎理論、認知安全威脅和認知安全防御的理論與方法三方面內容,主要強調在數據驅動的人工智能應用范式下,確保數據的機密性、完整性、可用性、責任性和不可抵賴性,以及數據驅動的算法模型的可解釋性、魯棒性和穩(wěn)定性。
更多科學出版社服務,請掃碼獲取。
在西安電子科技大學通信工程專業(yè)攻讀學士、碩士和博士學位。1995年5月后進復旦大學計算機科學與技術博士后流動站
目錄
第1章 緒論 1
1.1 數據治理概述 1
1.1.1 數據的概念 1
1.1.2 數據治理的內涵與目標 7
1.2 認知安全概述 11
1.2.1 認知的概念 11
1.2.2 認知安全的內涵 13
1.3 從數據治理到認知安全 15
1.3.1 數據治理支撐認知安全 15
1.3.2 認知安全促進數據治理 16
1.3.3 大模型時代的數據治理與認知安全 16
1.4 本章小結 17
1.5 習題 18
第2章 數據治理體系 19
2.1 數據治理標準 19
2.1.1 數據質量標準 19
2.1.2 數據安全標準 20
2.1.3 數據共享與交換標準 22
2.2 數據治理框架 23
2.2.1 數據治理的主體 23
2.2.2 數據治理的目標 25
2.2.3 數據治理的對象 27
2.2.4 數據治理的手段 28
2.2.5 數據治理的過程 31
2.3 數據治理制度 32
2.3.1 集中式數據治理 32
2.3.2 分散式數據治理 33
2.3.3 混合式數據治理 34
2.4 數據治理平臺 36
2.4.1 平臺架構 36
2.4.2 平臺功能 38
2.4.3 案例分析 39
2.5 本章小結 41
2.6 習題 42
第3章 數據處理 43
3.1 數據采集 43
3.1.1 自動采集 43
3.1.2 人工采集 44
3.2 數據清洗 45
3.2.1 數據問題 45
3.2.2 清洗方法 46
3.3 數據集成 51
3.3.1 數據提取 52
3.3.2 數據轉換 53
3.3.3 數據加載 55
3.4 數據標注 56
3.4.1 手動標注 57
3.4.2 半自動標注 58
3.4.3 自動標注 58
3.5 數據增強 59
3.5.1 增強方法 60
3.5.2 增強策略 67
3.6 數據分析 70
3.6.1 統(tǒng)計學角度 70
3.6.2 決策進程角度 71
3.6.3 數據可視化 73
3.7 本章小結 75
3.8 習題 75
第4章 數據合規(guī) 76
4.1 法律法規(guī)和標準規(guī)范 76
4.1.1 法律法規(guī) 76
4.1.2 標準規(guī)范 83
4.2 數據安全風險評估 85
4.2.1 數據安全風險類型 85
4.2.2 數據生命周期中的風險 86
4.2.3 風險評估方法 87
4.3 數據隱私保護 89
4.3.1 數據隱私保護的作用 89
4.3.2 數據隱私保護技術發(fā)展歷程 90
4.3.3 數據隱私保護技術及其應用 91
4.4 監(jiān)督與審計 94
4.4.1 監(jiān)督與審計方案制定 94
4.4.2 數據合規(guī)監(jiān)督手段 95
4.4.3 審計分析與持續(xù)優(yōu)化 96
4.4.4 響應與應急處理 96
4.5 本章小結 97
4.6 習題 97
第5章 數據建模 99
5.1 機器學習 99
5.1.1 基本概念 99
5.1.2 學習范式 100
5.1.3 損失函數與優(yōu)化算法 105
5.1.4 正則化和標準化 107
5.2 深度學習 108
5.2.1 深度學習基礎 109
5.2.2 卷積神經網絡 113
5.2.3 循環(huán)神經網絡 118
5.2.4 深度生成模型 121
5.3 大語言模型 124
5.3.1 大語言模型基礎 124
5.3.2 預訓練 126
5.3.3 指令微調 127
5.3.4 基于人類反饋的強化學習 129
5.4 多模態(tài)大語言模型 132
5.4.1 模型架構設計 132
5.4.2 模型訓練與微調 133
5.5 本章小結 134
5.6 習題 134
第6章 認知安全威脅 136
6.1 數據安全威脅 136
6.1.1 數據投毒攻擊 137
6.1.2 數據對抗攻擊 141
6.1.3 數據偽造攻擊 144
6.1.4 數據隱私攻擊 147
6.1.5 數據竊取攻擊 151
6.2 模型安全威脅 153
6.2.1 模型擾動攻擊 154
6.2.2 模型拓展攻擊 156
6.2.3 方程求解攻擊 159
6.2.4 替代模型攻擊 160
6.2.5 元模型攻擊 161
6.3 本章小結 164
6.4 習題 164
第7章 認知安全防御 166
7.1 數據安全防御 166
7.1.1 偽造與篡改數據檢測 166
7.1.2 差分隱私 170
7.1.3 同態(tài)加密 173
7.1.4 聯(lián)邦學習 178
7.2 模型安全防御 180
7.2.1 針對對抗樣本攻擊的防御 180
7.2.2 模型遺忘 190
7.2.3 針對模型竊取的防御 192
7.3 本章小結 194
7.4 習題 195
參考文獻 196
附錄 常用符號表 202