醫(yī)療大數(shù)據是大數(shù)據在醫(yī)療領域的一個分支,處理的是在與人類健康相關的活動中產生的與生命健康和醫(yī)療有關的數(shù)據。本書將對醫(yī)療大數(shù)據進行全面、透徹的分析,從醫(yī)療大數(shù)據的現(xiàn)狀開始,介紹醫(yī)療大數(shù)據方向的統(tǒng)計、數(shù)據挖掘、數(shù)據預處理、建模以及可視化等技術與應用。此外,還介紹了醫(yī)療領域的圖像處理和自然語言處理等人工智能技術。在本書的末尾,還討論了這個領域普遍關注的一個問題——醫(yī)療數(shù)據隱私保護,介紹了潛在的隱私風險和隱私保護方法等,并關注了醫(yī)療經濟的概況與前景。
通過閱讀本書,你將了解:
醫(yī)療大數(shù)據的現(xiàn)狀及產業(yè)劃分等;
如何統(tǒng)計挖掘和處理醫(yī)療領域的數(shù)據以方便分析;
醫(yī)學數(shù)據可視化如何提升醫(yī)療人員診斷病情的效率;
人工智能技術在醫(yī)療領域的應用;
如何對醫(yī)療數(shù)據進行隱私保護。
前言
第1章 醫(yī)療大數(shù)據概述 1
1.1 全球大數(shù)據現(xiàn)狀與特點 2
1.2 醫(yī)療大數(shù)據簡介 8
1.3 醫(yī)療大數(shù)據分析 11
1.4 醫(yī)療大數(shù)據產業(yè)劃分 13
1.4.1 基礎層 13
1.4.2 數(shù)據層 14
1.4.3 應用層 14
1.5 醫(yī)療大數(shù)據的挑戰(zhàn) 15
1.6 大數(shù)據在醫(yī)療中的實例 17
參考文獻 18
第2章 數(shù)據預處理 19
2.1 數(shù)據清洗 19
2.1.1 處理缺失值 20
2.1.2 處理異常值 21
2.1.3 處理噪聲 22
2.2 大規(guī)模計算系統(tǒng)搭建 24
2.2.1 Hadoop 24
2.2.2 MapReduce 26
第3章 統(tǒng)計學在醫(yī)療領域的應用 29
3.1 回歸模型 29
3.1.1 一元線性回歸 29
3.1.2 多元線性回歸 30
3.1.3 邏輯回歸 32
3.2 假設檢驗 33
3.2.1 基本步驟 33
3.2.2 檢驗方法 37
3.3 統(tǒng)計軟件概述 38
3.3.1 SPSS 39
3.3.2 SAS 44
3.3.3 R 45
第4章 經典傳染病模型 49
4.1 傳染病模型概述 49
4.1.1 傳染病倉室模型 50
4.1.2 微分方程描述下的傳染病倉室模型 53
4.1.3 傳染病倉室模型的簡單仿真 55
4.2 復雜網絡傳染病模型 58
4.2.1 網絡的基本概念及度量 58
4.2.2 復雜網絡上的傳染病模型 63
參考文獻 65
第5章 醫(yī)療數(shù)據挖掘 67
5.1 醫(yī)療數(shù)據挖掘的應用類型和過程 68
5.1.1 數(shù)據挖掘的應用類型 68
5.1.2 數(shù)據挖掘的過程 73
5.2 數(shù)據挖掘中的常用技術 75
5.2.1 聚類分析 75
5.2.2 K-means 層次聚類 76
5.2.3 主成分分析的數(shù)據降維 77
5.2.4 隨機鄰域嵌入原理及優(yōu)化 78
5.2.5 t分布隨機鄰域嵌入原理及優(yōu)化 79
5.2.6 t分布隨機鄰域嵌入示例 80
5.3 數(shù)據挖掘中需要注意的問題 81
參考文獻 85
第6章 醫(yī)療數(shù)據可視化 87
6.1 數(shù)據可視化概述 87
6.1.1 數(shù)據可視化的概念 87
6.1.2 數(shù)據可視化的目的 88
6.1.3 數(shù)據可視化的分類 89
6.2 醫(yī)療數(shù)據可視化技術 94
6.2.1 科學可視化應用 94
6.2.2 信息可視化應用 97
參考文獻 112
第7章 大數(shù)據和醫(yī)學影像 113
7.1 影像大數(shù)據中的5個V 113
7.2 影像數(shù)據的使用 114
7.3 深度學習過程所需的要素 120
7.4 在醫(yī)學影像上開展深度學習研究 122
7.4.1 深度學習的幾個步驟 122
7.4.2 如何衡量深度學習的成功 125
7.4.3 深度學習在醫(yī)學影像上的應用 126
參考文獻 134
第8章 醫(yī)療領域的自然語言處理 137
8.1 自然語言 137
8.2 自然語言處理概述 138
8.3 數(shù)據集的預處理 139
8.3.1 句法分析 139
8.3.2 語義分析 143
8.4 常見的自然語言處理技術 145
8.4.1 文本向量化 145
8.4.2 詞云 146
8.4.3 知識圖譜 147
8.4.4 自動文摘 147
8.4.5 情感分析 149
8.4.6 谷歌BERT技術 149
8.5 自然語言處理在醫(yī)療領域的應用 152
8.5.1 生物醫(yī)學文本挖掘 152
8.5.2 臨床決策支持系統(tǒng) 154
8.5.3 自動問答系統(tǒng) 154
參考文獻 156
第9章 醫(yī)療數(shù)據隱私保護 159
9.1 醫(yī)療數(shù)據隱私保護概述 159
9.1.1 醫(yī)療大數(shù)據的來源及潛在的隱私風險 160
9.1.2 全流程的醫(yī)療大數(shù)據隱私保護 161
9.2 匿名隱私保護 163
9.3 差分隱私及其應用 165
9.3.1 差分隱私的定義及相關概念 166
9.3.2 差分隱私的實現(xiàn)機制 169
9.4 其他隱私保護方法 171
9.4.1 機密計算 171
9.4.2 模型隱私 174
參考文獻 175
第10章 醫(yī)療經濟概況與前景 179
10.1 醫(yī)療經濟概況 179
10.2 醫(yī)療經濟的市場分析 181
10.3 醫(yī)療大數(shù)據現(xiàn)狀 190
10.4 醫(yī)療經濟的前景 190