本書系統(tǒng)深入地論述了機器學習與水聲目標識別的理論和方法,內容從基礎理論到實際應用,涵蓋了復雜海洋環(huán)境下水聲目標特性、機器學習與水聲目標識別的基本理論、經典機器學習算法在水聲目標識別中的應用、專用深度學習水聲目標識別方法、類腦聽覺深度學習水聲目標識別方法及水聲目標深度識別網絡的可視化與可解釋;并詳細論述了面向邊緣設備的水聲目標深度學習識別系統(tǒng)的設計、部署與優(yōu)化策略。本書還提供了豐富的實戰(zhàn)算法與工程實踐案例。 本書可作為高等院校人工智能、水聲工程等專業(yè)的課程參考書,也可供計算機信息處理、水聲信號處理等領域從事人工智能、模式識別、機器學習、數據挖掘工作的學者、工程師等參考。
楊宏暉,博士學位,西北工業(yè)大學副教授,博士生導師。分別于1992年、1998年和2006年在西北工業(yè)大學獲得本科學位、碩士學位和博士學位。2000—2003年在英國XN有限公司新加坡研發(fā)中心從事計算機系統(tǒng)設計。2009年在美國著名大腦神經影像研究所The Mind Research Network任訪問學者。二十年來圍繞人工智能、機器學習、深度學習與大數據分析、水聲目標識別、工業(yè)圖像識別等方向開展研究工作,突破類腦智能+水聲目標感知與認知關鍵技術,突破工業(yè)圖像極微弱缺陷檢測技術。主持國家級、省部級、地市級項目近30項。發(fā)表高水平學術論文60余篇,出版著作6部。主講工信部碩博士特色優(yōu)質課程“機器學習與聲信號處理”。
第1章 水聲目標識別基本原理 1
1.1 水聲目標識別系統(tǒng) 1
1.2 基于機器學習的水聲目標識別系統(tǒng)的工作原理 2
1.3 水聲目標特征提取 2
1.3.1 時域波形結構特征提取 2
1.3.2 頻域譜特征提取 2
1.3.3 時頻分析特征提取 2
1.3.4 聽覺感知特征提取 3
1.4 水聲目標特征選擇 3
1.5 水聲目標識別的分類器設計 3
1.6 基于深度學習的水聲目標識別 4
1.7 基于類腦智能的水聲目標識別 4
1.8 本章小結 4
參考文獻 5
第2章 海洋中的聲音 7
2.1 聲音的基本概念 7
2.1.1 聲音 7
2.1.2 聲音的基本參量 7
2.2 海洋噪聲綜述 8
2.2.1 海洋中的聲音類型 8
2.2.2 艦船輻射噪聲 9
2.2.3 海洋哺乳動物叫聲 10
2.3 船舶類型及分類規(guī)則 14
2.3.1 勞埃德船級社船舶類型劃分方法 14
2.3.2 按照國際海事組織規(guī)定進行船舶類型劃分 16
2.4 海洋聲環(huán)境特性 22
2.4.1 海洋聲傳播損失 22
2.4.2 海洋聲傳播理論 23
2.4.3 海洋聲信道特性 24
2.5 海洋環(huán)境噪聲特性 28
2.6 艦船輻射噪聲特性 29
2.6.1 艦船輻射噪聲的組成及特性 29
2.6.2 船舶工況對艦船輻射噪聲特性的影響 31
2.6.3 基于特征分析的艦船輻射噪聲特性分析 33
2.7 海洋哺乳動物叫聲特性 41
2.8 本書使用的水聲目標數據 42
2.8.1 艦船輻射噪聲數據 42
2.8.2 海洋哺乳動物叫聲數據 43
2.9 本章小結 44
參考文獻 44
第3章 機器學習基礎 46
3.1 機器學習的概念 46
3.1.1 機器學習問題 46
3.1.2 機器學習算法的分類 46
3.2 回歸分析的含義、分類及應用 46
3.3 一元線性回歸算法 47
3.3.1 一元線性回歸模型 47
3.3.2 損失函數 47
3.3.3 一元線性回歸應用實例 48
3.4 一元線性回歸梯度下降求解方法 49
3.4.1 隨機梯度下降法 50
3.4.2 批量梯度下降法 50
3.4.3 小批量梯度下降法 50
3.5 多元線性回歸算法 51
3.5.1 多元線性回歸原理 51
3.5.2 多元線性回歸應用實例 52
3.6 邏輯回歸算法 53
3.6.1 邏輯回歸原理 53
3.6.2 邏輯回歸應用實例 55
3.7 常用的機器學習算法評價指標 55
3.7.1 欠擬合與過擬合 55
3.7.2 機器學習模型的性能評價指標 56
3.8 本章小結 60
第4章 水聲目標特征提取 61
4.1 水聲目標時頻域特征提取方法 61
4.1.1 波形結構特征 61
4.1.2 小波變換特征 61
4.2 水聲目標聽覺特征提取方法 63
4.2.1 心理聲學參數特征 63
4.2.2 聽覺譜特征 64
4.3 水聲目標特征提取實驗 65
4.4 本章小結 65
第5章 水聲目標特征選擇與壓縮 66
5.1 水聲目標特征選擇定義 66
5.1.1 特征相關性定義 66
5.1.2 特征選擇定義 67
5.2 特征選擇過程 67
5.2.1 特征子集生成 67
5.2.2 特征子集評價 69
5.2.3 特征子集搜索的終止 70
5.2.4 選擇結果確認 70
5.3 特征選擇方法及算法實現 70
5.3.1 濾波式 70
5.3.2 封裝式 71
5.3.3 混合式 72
5.3.4 嵌入式 73
5.4 特征選擇算法的評價指標 73
5.4.1 特征選擇算法的兩個重要參數 73
5.4.2 特征選擇算法的穩(wěn)定性評價指標 73
5.5 本章小結 75
第6章 基于支持向量機的水聲目標分類 76
6.1 統(tǒng)計學習理論 76
6.1.1 統(tǒng)計學習理論的研究背景 76
6.1.2 機器學習模型 77
6.1.3 經驗風險最小化原則 77
6.1.4 統(tǒng)計學習理論的核心內容 78
6.2 支持向量機水聲目標識別原理 80
6.2.1 線性支持向量機 80
6.2.2 非線性支持向量機 82
6.2.3 SVM多類分類算法 83
6.3 支持向量機分類器的分類性能估計 83
6.4 支持向量機核函數及其參數選擇與實驗 84
6.4.1 SVM核函數及其參數的選擇算法 84
6.4.2 水聲目標數據的SVM核函數及其參數選擇實驗 85
6.5 水聲目標識別實驗 90
6.5.1 水聲目標數據的分類識別實驗 90
6.5.2 公共數據集SVM分類識別實驗 91
6.5.3 實驗結論 92
6.6 本章小結 93
第7章 基于單類分類支持向量機的水聲目標半監(jiān)督識別方法 94
7.1 單類分類支持向量機原理與算法實現 94
7.1.1 單類分類支持向量機算法 94
7.1.2 支持向量數據描述算法 96
7.1.3 等價條件分析 97
7.2 參數C、σ對分界面的影響 98
7.2.1 錯分懲罰因子C對分界面的影響 98
7.2.2 RBF核函數參數σ對分界面的影響 99
7.2.3 SVDD參數選擇實驗 100
7.3 基于Tri-training的半監(jiān)督SVDD算法與實驗 102
7.3.1 Tri-SVDDE算法 102
7.3.2 基于Tri-SVDDE算法的水聲目標識別實驗 103
7.4 本章小結 105
第8章 水聲目標集成學習識別方法 106
8.1 分類器集成概述 106
8.2 經典分類器集成方法 107
8.2.1 個體分類器構成 107
8.2.2 個體分類器集成 109
8.3 用于水聲目標識別的分類器選擇性集成算法及實驗 110
8.4 基于SVDD集成的水下目標識別 112
8.4.1 SVDD分類器的Bagging集成 113
8.4.2 基于SVDD的多類水下目標識別算法 115
8.5 本章小結 119
第9章 深度學習識別模型基礎 120
9.1 深度神經網絡基本算法模塊 120
9.1.1 人工神經元 120
9.1.2 全連接神經網絡 120
9.1.3 自編碼器 121
9.1.4 受限玻耳茲曼機 121
9.1.5 循環(huán)神經網絡及其變體 123
9.1.6 卷積層及其變體 127
9.1.7 池化層 130
9.1.8 全局池化層 131
9.1.9 注意力模塊 131
9.1.10 生成對抗網絡 133
9.1.11 批量歸一化 137
9.1.12 隨機失活 138
9.2 經典激活函數的功能與特點 138
9.2.1 Sigmoid激活函數 138
9.2.2 tanh激活函數 138
9.2.3 ReLU激活函數及其變體 139
9.2.4 Softmax激活函數 140
9.3 經典損失函數構建方法與性能 141
9.3.1 平方損失 141
9.3.2 均方誤差 141
9.3.3 絕對誤差 141
9.3.4 平均絕對誤差 141
9.3.5 平均絕對百分比誤差 141
9.3.6 對數損失函數 142
9.3.7 交叉熵 142
9.4 深度神經網絡的優(yōu)化算法 142
9.4.1 梯度下降算法 142
9.4.2 批量梯度下降算法 143
9.4.3 隨機梯度下降算法 143
9.4.4 小批量梯度下降算法 143
9.4.5 動量梯度下降算法 144
9.4.6 涅斯捷羅夫梯度加速算法 144
9.4.7 自適應的梯度下降算法 145
9.4.8 均方根傳遞 145
9.4.9 自適應矩估計算法 146
9.5 深度學習識別算法的評價指標 147
9.5.1 混淆矩陣 147
9.5.2 P-R曲線 147
9.5.3 F1分數 147
9.5.4 ROC曲線 148
9.5.5 AUC 149
參考文獻 149
第10章 用于水聲目標識別的深度學習方法、算法及實驗 150
10.1 基于深度置信網絡的水聲目標識別 150
10.1.1 基于深度置信網絡的水聲目標識別原理 150
10.1.2 競爭深度置信水聲目標識別原理 156
10.1.3 實驗結果及分析 159
10.2 基于深度卷積神經網絡的水聲目標識別 160
10.2.1 基于深度卷積神經網絡的水聲目標識別原理 160
10.2.2 艦船個體識別實驗 162
10.2.3 艦船個體識別實驗結果及分析 163
10.2.4 水聲通信調制識別實驗 164
10.2.5 水聲通信調制識別實驗結果及分析 166
10.3 用于水聲目標識別的時、頻、空域注意力深度學習 167
10.3.1 基于通道注意力的水聲目標識別原理 167
10.3.2 基于空間注意力的水聲目標識別原理 169
10.3.3 基于頻率注意力的水聲目標識別原理 170
10.3.4 基于倍頻注意力的水聲目標識別原理 171
10.3.5 實驗數據及實驗設置 173
10.3.6 實驗結果及分析 174
10.4 用于水聲目標識別的時、頻、空域自注意深度學習 180
10.4.1 基于水聲特征通道自注意力機制的水聲目標識別原理 180
10.4.2 基于水聲特征時頻自注意力機制的水聲目標識別原理 182
10.4.3 基于水聲特征頻率自注意力機制的水聲目標識別原理 182
10.4.4 實驗數據及實驗設置 183
10.4.5 實驗結果及分析 184
10.5 基于深度遞歸神經網絡的水聲目標識別 189
10.5.1 基于深度遞歸神經網絡的水聲目標識別原理 189
10.5.2 水聲目標識別實驗 192
10.5.3 實驗結果及分析 192
10.6 本章小結 193
第11章 基于深度集成學習的水聲目標識別方法 194
11.1 深度神經網絡集成學習理論和方法 194
11.1.1 機器學習集成學習方法 194
11.1.2 結合方法 194
11.1.3 集成模型的性能影響因素 195
11.2 深度神經網絡集成學習的評價準則 196
11.3 基于多樣性度量選擇性集成的深度水聲目標識別方法 197
11.3.1 選擇性集成學習方法 197
11.3.2 基于多樣性度量的識別模型子集選擇算法 198
11.4 基于多樣性度量選擇性集成的深度水聲目標識別實驗 199
11.4.1 實驗方法 199
11.4.2 實驗結果及分析 199
11.5 本章小結 203
參考文獻 203
第12章 基于圖神經網絡的水聲目標識別方法 204
12.1 圖神經網絡基本原理 204
12.1.1 圖的表示和性質 204
12.1.2 基于譜的圖卷積方法 206
12.2 水聲目標特征圖構建 209
12.2.1 水聲目標識別深度特征提取 209
12.2.2 水聲目標識別人工提取特征 210
12.2.3 水聲目標識別特征圖的構建方法 212
12.3 基于圖神經網絡的水聲目標識別多特征融合及識別系統(tǒng) 213
12.3.1 圖神經網絡結構及參數設置 213
12.3.2 構建圖神經網絡的輸入 214
12.3.3 多特征融合及調制方式識別 215
12.4 基于圖神經網絡的水聲目標識別實驗 215
12.4.1 不同特征子集對識別性能的影響分析實驗 215
12.4.2 特征圖邊關系對識別性能的影響分析實驗 218
12.4.3 實測數據上的調制識別實驗 219
12.5 本章小結 220
參考文獻 220
第13章 水聲目標深度識別網絡可視化與可解釋 222
13.1 水聲目標深度識別網絡的可視化與可解釋概述 222
13.1.1 深度學習可視化與可解釋的目的及意義 222
13.1.2 深度學習可視化與可解釋的原理 222
13.2 水聲目標深度識別網絡可視化與可解釋方法和實驗 223
13.2.1 加權梯度類激活映射方法 225
13.2.2 最大激活方法 228
13.2.3 反卷積方法 231
13.2.4 基于特征降維t-SNE可視化方法 235
13.3 本章小結 237
參考文獻 237
第14章 腦聽覺感知及機制 238
14.1 人類大腦基本概念 238
14.2 人腦聽覺系統(tǒng) 238
14.2.1 聽覺外周 238
14.2.2 聽覺中樞 239
14.3 腦聽覺機制 240
14.3.1 聽覺頻率感知機制 240
14.3.2 音色感知機制 241
14.3.3 被動注意機制 242
14.3.4 主動選擇性注意機制 244
14.4 本章小結 245
參考文獻 245
第15章 基于類腦聽覺深度學習的水聲目標識別方法、算法及實驗 246
15.1 基于神經競爭機制的深度水聲目標識別 246
15.1.1 基于神經競爭機制的深度水聲目標識別的原理 246
15.1.2 水聲目標識別實驗設計 249
15.1.3 水聲目標識別實驗結果及分析 249
15.2 基于聽覺濾波機制的深度水聲目標識別 253
15.2.1 基于聽覺濾波機制的深度水聲目標識別的原理 253
15.2.2 水聲目標識別實驗設計 255
15.2.3 水聲目標識別實驗結果及分析 256
15.3 基于深度頻率分解機制的深度水聲目標識別 258
15.3.1 基于深度頻率分解機制的深度水聲目標識別原理 258
15.3.2 水聲目標識別實驗設計 260
15.3.3 水聲目標識別實驗結果及分析 260
15.4 基于音色感知的深度水聲目標識別 262
15.4.1 基于音色感知的深度水聲目標識別原理 262
15.4.2 水聲目標識別實驗設計 263
15.4.3 水聲目標識別實驗結果及分析 264
15.5 基于多屬性協(xié)同感知的深度水聲目標識別 266
15.5.1 基于多屬性協(xié)同感知的深度水聲目標識別原理 266
15.5.2 水聲目標識別實驗設計 268
15.5.3 水聲目標多屬性協(xié)同感知實驗結果及分析 269
15.6 類腦水聲目標識別極深模型構建與優(yōu)化 273
15.6.1 類腦水聲目標識別極深模型原理 273
15.6.2 水聲目標識別實驗設計 275
15.6.3 水聲目標識別實驗結果及分析 276
15.7 基于聽覺被動注意機制的水聲目標識別 278
15.7.1 水聲目標聽覺被動注意理論與方法 278
15.7.2 水聲目標聽覺被動注意模型的損失函數構建及優(yōu)化方法 279
15.7.3 單目標干擾條件下的水聲目標識別實驗設計 283
15.7.4 單目標干擾條件下的水聲目標識別實驗結果及分析 286
15.8 基于聽覺主/被動融合注意的深度水聲目標識別 295
15.8.1 多目標干擾條件下的水聲目標識別問題 295
15.8.2 基于深度學習的水聲目標聽覺主/被動融合注意識別框架 296
15.8.3 水聲目標聽覺主動注意算法 298
15.8.4 多目標干擾條件下的決策方法 300
15.8.5 多目標干擾條件下的水聲目標實驗數據及模型 302
15.8.6 多目標干擾條件下的水聲目標識別實驗結果及分析 304
15.9 本章小結 307
第16章 面向邊緣設備的水聲目標深度學習識別 308
16.1 用于水聲目標識別的邊緣計算平臺 308
16.2 輕量化水聲目標識別深度學習模型 308
16.2.1 深度神經網絡輕量化 309
16.2.2 輕量化網絡結構設計 309
16.2.3 神經網絡模型壓縮 310
16.2.4 輕量化水聲目標感知方法 314
16.3 水聲目標深度識別網絡模型網絡剪枝方法 318
16.3.1 水聲目標深度識別網絡模型的權重剪枝與卷積核剪枝 318
16.3.2 剪枝識別模型的測試與評價 320
16.4 基于邊緣計算平臺的深度學習網絡能耗剪枝方法 323
16.4.1 Jetson AGX Xavier計算平臺 323
16.4.2 識別模型的推理速度 324
16.4.3 識別模型的推理能耗 327
16.4.4 基于推理能耗的識別模型卷積核剪枝方法 329
16.5 基于邊緣計算平臺的水聲目標識別系統(tǒng) 331
16.5.1 硬件系統(tǒng) 331
16.5.2 軟件系統(tǒng) 332
16.6 本章小結 334
參考文獻 334