本書(shū)面向政務(wù)服務(wù)精準(zhǔn)化,以政策內(nèi)容挖掘與價(jià)值作用發(fā)揮的研究脈絡(luò)為主線,基于深度學(xué)習(xí)和自然語(yǔ)言理解等技術(shù),從政策文本結(jié)構(gòu)化解析、自動(dòng)摘要生成以及政策文本精準(zhǔn)推送三個(gè)層面,系統(tǒng)研究了其中的理論基礎(chǔ)、技術(shù)方案和實(shí)證優(yōu)化策略。本書(shū)研究探索了從“政策文本信息處理”到“政策主旨內(nèi)涵把握”的理論框架和技術(shù)方案,拓展了政策文本挖掘與理解研究的深度和范疇,創(chuàng)新了政策文本研究的理論與方法體系。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
200309-200706 武漢大學(xué) 電子商務(wù) 本科、學(xué)士
200709-201206 武漢大學(xué) 信息資源管理(碩博連讀) 研究生、博士201206-201408 武漢大學(xué) 師資博士后
201211-201602 武漢大學(xué) 講師
201508-201608 美國(guó)肯特州立大學(xué) 訪問(wèn)學(xué)者
201602-202111 武漢大學(xué) 副教授
202111-至今 武漢大學(xué) 教授
202303-至今 國(guó)家自然科學(xué)基金委員會(huì) 流動(dòng)項(xiàng)目主任信息資源管理1. 作為通訊作者、第一作者發(fā)表論文99篇,其中SCI檢索10篇、SSCI檢索18篇、EI檢索1篇,CSSCI檢索61篇、其他核心期刊檢索4篇。
2. 代表性論文
Hu Jiming, Yang Zexian, Wang JiaMin, et al. Examining the Structure of MPs in the UK-China Relationship using Speech-Word Pair Bipartite Networks[J]. Aslib Journal of Information Management, 2024.3(SCI/SSCI ,IF:2.5,JCR2區(qū))
Yang Jinqing, Lu Wei, Hu Jiming*, et al. A novel emerging topic detection method: A knowledge ecology perspectives[J]. Information Processing & Management, 2022,59(2):102843.(SCI/SSCI,IF:7.3,JCR1區(qū))
Lu Wei,
目錄
第1章 政策文本研究進(jìn)展與挖掘方案設(shè)計(jì) 1
1.1 政策文本研究的脈絡(luò)梳理 1
1.2 政策文本深度挖掘與應(yīng)用研究方案 12
1.3 政策文本深度挖掘與應(yīng)用研究的價(jià)值 15
第2章 面向主題挖掘的政策文本結(jié)構(gòu)化解析 16
2.1 跨學(xué)科支撐下的政策文本結(jié)構(gòu)化分析 16
2.2 政策文本結(jié)構(gòu)化解析的研究方案 33
2.3 政策文本結(jié)構(gòu)化解析框架與技術(shù)路線 36
2.4 政策文本結(jié)構(gòu)化解析的技術(shù)應(yīng)用 46
2.5 總結(jié)與展望 60
第3章 基于多維特征融合的政策文本語(yǔ)義增強(qiáng)表示 63
3.1 融合多維特征的政策文本表示方案 63
3.2 政策主題挖掘與文本向量生成 65
3.3 政策文本中的實(shí)體特征提取 68
3.4 基于預(yù)訓(xùn)練語(yǔ)言模型的政策文本增強(qiáng)表示 77
3.5 總結(jié)與展望 83
第4章 政策文本生成式摘要模型構(gòu)建與技術(shù)實(shí)現(xiàn) 86
4.1 面向深層次挖掘的政策文本摘要生成研究 86
4.2 政策文本摘要生成的研究方案 97
4.3 面向摘要生成的政策文本關(guān)鍵語(yǔ)句抽取 105
4.4 基于依存句法的政策文本摘要生成模型 112
4.5 融合PGN 的政策文本摘要生成優(yōu)化 122
4.6 領(lǐng)域政策文本摘要生成實(shí)證研究 128
4.7 總結(jié)與展望 141
第5章 政策文本精準(zhǔn)推送模型構(gòu)建與技術(shù)實(shí)現(xiàn) 145
5.1 政府文本精準(zhǔn)推送研究的背景與價(jià)值 145
5.2 政策文本推送研究的發(fā)展趨勢(shì) 149
5.3 政策文本精準(zhǔn)推送的研究方案 157
5.4 基于多維特征的政策用戶(hù)畫(huà)像生成 162
5.5 基于特征聚類(lèi)的政策推送關(guān)系標(biāo)注 167
5.6 基于特征注意力的政策文本精準(zhǔn)推送模型 171
5.7 政策精準(zhǔn)推送實(shí)證研究 173
5.8 總結(jié)與展望 194
圖目錄
圖1-1 研究?jī)?nèi)容設(shè)計(jì) 12
圖2-1 政策文本結(jié)構(gòu)化解析研究方案 33
圖2-2 基于框架語(yǔ)義的結(jié)構(gòu)化語(yǔ)義框架 40
圖2-3 結(jié)構(gòu)化解析框架搭建思路 41
圖2-4 LDA2Vec主題抽取模型 44
圖2-5 LDA主題模型 45
圖2-6 政策發(fā)文機(jī)構(gòu)統(tǒng)計(jì) 55
圖2-7 政策主題統(tǒng)計(jì) 56
圖2-8 典型案例政策引用關(guān)系圖 57
圖3-1 融合多維特征的政策文本向量表示方案 64
圖3-2 政策主題挖掘與文本向量生成框架 65
圖3-3 基于LDA模型的政策文本主題挖掘結(jié)構(gòu) 66
圖3-4 基于主題分布的文本向量生成 68
圖3-5 BiLSTM-CRF政策實(shí)體識(shí)別模型 72
圖3-6 LSTM單元結(jié)構(gòu) 72
圖3-7 LSTM鏈?zhǔn)浇Y(jié)構(gòu) 74
圖3-8 BiLSTM網(wǎng)絡(luò)結(jié)構(gòu) 74
圖3-9 CRF模型 74
圖3-10 BERT模型結(jié)構(gòu)圖 78
圖3-11 無(wú)監(jiān)督的SimCSE模型 81
圖3-12 PV-DM 結(jié)構(gòu) 82
圖4-1 政策文本摘要生成研究?jī)?nèi)容 100
圖4-2 政策文本摘要生成研究策略 103
圖4-3 基于深度學(xué)習(xí)的政策文本摘要生成研究框架 104
圖4-4 基于句向量改進(jìn)的政策文本關(guān)鍵句子抽取策略 106
圖4-5 基于句子重要性分?jǐn)?shù)計(jì)算的政策文本關(guān)鍵句子抽取流程 106
圖4-6 基于依存句法的生成式政策文本自動(dòng)摘要模型 113
圖4-7 政策文本依存句法樹(shù)示例 115
圖4-8 依存句法樹(shù)對(duì)應(yīng)的鄰接矩陣 116
圖4-9 圖卷積操作示例 118
圖4-10 基于Seq2Seq的政策文本自動(dòng)摘要模型 121
圖4-11 融合PGN的政策文本自動(dòng)摘要模型 124
圖4-12 政策文本摘要評(píng)分模型 126
圖4-13 政策文本采集結(jié)果示例 130
圖4-14 政策文本摘要數(shù)據(jù)集平均字?jǐn)?shù)分布情況 133
圖4-15 不同政策文本摘要生成模型ROUGE 指標(biāo)分?jǐn)?shù)柱狀圖 137
圖5-1 政策文本精準(zhǔn)推送研究框架 161
圖5-2 政策用戶(hù)畫(huà)像的指標(biāo)體系結(jié)構(gòu)圖 165
圖5-3 政策用戶(hù)特征交集 169
圖5-4 政策及用戶(hù)推送關(guān)系標(biāo)注 170
圖5-5 基于深度神經(jīng)網(wǎng)絡(luò)的政策推送模型 172
圖5-6 YEDDA標(biāo)注示例 178
圖5-7 助殘政策詞向量 184
圖5-8 助殘政策用戶(hù)畫(huà)像指標(biāo)體系結(jié)構(gòu)圖 186
圖5-9 基于殘疾人特征的用戶(hù)聚類(lèi) 189
表目錄
表2-1 政策文本通用特征 42
表2-2 政策主題-詞分布 46
表2-3 政策文本結(jié)構(gòu)化解析通用框架 46
表2-4 “互聯(lián)網(wǎng)+”政策外部屬性特征表 49
表2-5 LDA主題抽取詞組表 50
表2-6 Doc2Vec模型參數(shù)設(shè)置 50
表2-7 “互聯(lián)網(wǎng)+”政策文本結(jié)構(gòu)化解析框架 51
表2-8 案例文本主題-文檔距離值表 52
表2-9 《國(guó)務(wù)院辦公廳關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見(jiàn)》結(jié)構(gòu)化解析框架 52
表2-10 被引用政策數(shù)量統(tǒng)計(jì)(部分) 58
表3-1 政策實(shí)體類(lèi)別 71
表3-2 實(shí)體標(biāo)簽概率分布 75
表4-1 政策文本線索詞表 110
表4-2 LTP 句法依存關(guān)系類(lèi)型 115
表4-3 政策文本數(shù)據(jù)采集信息 129
表4-4 不同的政策文本關(guān)鍵句子抽取方法結(jié)果對(duì)比 131
表4-5 政策文本摘要數(shù)據(jù)集單條數(shù)據(jù)示例 132
表4-6 本地機(jī)器與Mist 服務(wù)器環(huán)境配置 135
表4-7 摘要生成模型參數(shù)設(shè)置 135
表4-8 不同政策文本摘要生成模型結(jié)果對(duì)比 136
表4-9 不同政策文本摘要生成模型結(jié)果呈現(xiàn) 139
表5-1 殘疾人政策來(lái)源(1952 年至2021 年) 175
表5-2 殘疾人數(shù)據(jù)字段及描述說(shuō)明 177
表5-3 助殘政策中五類(lèi)實(shí)體統(tǒng)計(jì) 179
表5-4 命名實(shí)體識(shí)別模型參數(shù)設(shè)置 179
表5-5 不同類(lèi)型實(shí)體識(shí)別評(píng)價(jià)結(jié)果 180
表5-6 不同模型識(shí)別結(jié)果對(duì)比 181
表5-7 助殘政策實(shí)體信息表(節(jié)選) 181
表5-8 助殘政策主題 182
表5-9 助殘政策文本基礎(chǔ)向量 183
表5-10 殘疾人用戶(hù)向量化示例 187
表5-11 助殘政策推送關(guān)系表 190
表5-12 助殘政策推送模型推送準(zhǔn)確率 192
表5-13 助殘政策推送結(jié)果(政策-用戶(hù)向) 193
表5-14 助殘政策推送結(jié)果(用戶(hù)-政策向) 193