本書對話題發(fā)現(xiàn)與追蹤中的話題關聯(lián)識別和話題追蹤兩個任務進行了較為深入的研究,在新聞表示模型和關聯(lián)追蹤方法上提出了效果較為明顯的改進技術! ”緯卜譃樗拇蟛糠郑旱谝徊糠种饕獙υ掝}發(fā)現(xiàn)與追蹤領域的國內外研究現(xiàn)狀進行闡述(第1章);第二部分對新聞話題的表示模型進行較為細致的分析,并對話題關聯(lián)識別過程中的信息動態(tài)漂移問題進行動態(tài)信息擴充研究(第2、3章);第三部分對話題追蹤研究中的話題漂移現(xiàn)象和起始已知信息較少的問題進行研究并提出相應的解決方法(第4、5章);最后一部分對 本書的工作以及下一步延續(xù)做出總結和展望(第6章)。
第1章緒論
1.1背景
1.1.1問題來源
1.1.2發(fā)展歷史
1.2重要概念
1.3研究任務
1.4評價方法
1.5研究現(xiàn)狀分析
1.5.1表示模型
1.5.2相似度計算
1.5.3相似度整合
1.5.4關鍵問題和難點
1.6本書主要工作
1.7本書結構
第2章話題關聯(lián)識別中的表示模型分析
第1章緒論
1.1背景
1.1.1問題來源
1.1.2發(fā)展歷史
1.2重要概念
1.3研究任務
1.4評價方法
1.5研究現(xiàn)狀分析
1.5.1表示模型
1.5.2相似度計算
1.5.3相似度整合
1.5.4關鍵問題和難點
1.6本書主要工作
1.7本書結構
第2章話題關聯(lián)識別中的表示模型分析
2.1新聞報道分析
2.2多向量表示模型的構建
2.2.1預處理
2.2.2特征選取
2.2.3特征權重計算
2.3多向量表示模型的使用
2.3.1相似度計算
2.3.2模糊匹配
2.3.3多個相似度整合
2.4實驗及討論
2.4.1話題關聯(lián)識別流程
2.4.2實驗數據
2.4.3實驗結果及分析
2.5小結
第3章話題關聯(lián)識別中的信息擴充技術
3.1問題描述
3.2相關工作
3.3動態(tài)擴充技術
3.4動態(tài)擴充信息
3.4.1摘要信息
3.4.2名實體
3.4.3依存信息
3.4.4精化策略
3.5實驗及討論
3.5.1實驗數據
3.5.2實驗結果及分析
3.6小結
第4章基于動態(tài)話題模型的話題追蹤
4.1話題漂移實例分析
4.2相關工作
4.3基于話題的權重計算方法
4.4動態(tài)話題模型
4.4.1基于相關樣本更新
4.4.2基于無關樣本更新
4.5實驗及討論
4.5.1話題追蹤流程
4.5.2實驗數據
4.5.3實驗結果及分析
4.6小結
第5章基于聯(lián)合追蹤方法的話題追蹤
5.1問題描述
5.2相關工作
5.3聯(lián)合追蹤
5.3.1基于關聯(lián)特征的追蹤方法
5.3.2基于已知相關信息的追蹤方法
5.3.3聯(lián)合追蹤方法
5.4實驗及討論
5.4.1實驗數據
5.4.2實驗結果及分析
5.5小結
第6章結論與展望
6.1全書總結
6.2下一步展望
附錄1作者著書期間的成果
附錄2 ICTCLAS詞性標注集
附錄3停用詞集
參考文獻