由于推薦系統(tǒng)開(kāi)放性的特點(diǎn),惡意用戶可以通過(guò)注入偽造的用戶概貌以改變目標(biāo)項(xiàng)目在推薦系統(tǒng)中的排名,托攻擊行為干擾了推薦系統(tǒng)的正常運(yùn)行,阻礙推薦系統(tǒng)的應(yīng)用和推廣。
《推薦系統(tǒng)中基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究》提出了幾種托攻擊監(jiān)測(cè)的方法:提出一種基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架;在基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架基礎(chǔ)上提出了兩種托攻擊檢測(cè)算法;提出了一種結(jié)合目標(biāo)項(xiàng)目分析和支持向量機(jī)的檢測(cè)方法;提出了一種基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)算法。
個(gè)性化推薦技術(shù)作為一種解決信息超載問(wèn)題最有效的工具,但是由于推薦系統(tǒng)開(kāi)放性的特點(diǎn),惡意用戶可以通過(guò)注入偽造的用戶概貌以改變目標(biāo)項(xiàng)目在推薦系統(tǒng)中的排名,此類現(xiàn)象稱為托攻擊。托攻擊行為使推薦系統(tǒng)向用戶推薦被操縱的商品或信息,干擾了推薦系統(tǒng)的正常運(yùn)行,阻礙推薦系統(tǒng)的應(yīng)用和推廣。本書(shū)的主要內(nèi)容如下:
分析了推薦系統(tǒng)國(guó)內(nèi)外研究現(xiàn)狀和面臨的主要挑戰(zhàn);分析推薦系統(tǒng)中相似度計(jì)算方法、托攻擊檢測(cè)評(píng)價(jià)指標(biāo)和現(xiàn)有的用于托攻擊檢測(cè)的概貌屬性,并對(duì)推薦系統(tǒng)中概貌屬性提取技術(shù)進(jìn)行分析。
針對(duì)托攻擊群體性特征以及用戶評(píng)分矩陣稀疏性的特點(diǎn),提出一種基于目標(biāo)項(xiàng)目分析(TIA)的托攻擊檢測(cè)框架。首先,找出有攻擊嫌疑的疑似托攻擊用戶集合;其次,構(gòu)建由這些疑似托攻擊用戶概貌組成的評(píng)分矩陣;最后,通過(guò)目標(biāo)項(xiàng)目分析方法得到攻擊意圖和目標(biāo)項(xiàng)目,檢索出托攻擊用戶。
通過(guò)分析真實(shí)用戶概貌和托攻擊用戶概貌屬性值的分布,在基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架基礎(chǔ)上提出了兩種托攻擊檢測(cè)算法,基于RDMA和DegSim概貌屬性的方法(RD-TIA)和基于一種新的概貌屬性DegSim‘的檢測(cè)方法(DeR-TIA)。
針對(duì)現(xiàn)有的SVM托攻擊檢測(cè)算法存在的缺陷以及推薦系統(tǒng)托攻擊檢測(cè)中存在的類不均衡問(wèn)題,本書(shū)提出了使用自適應(yīng)人工合成樣本方法Borderline-SMOTE來(lái)緩解類不均衡問(wèn)題。提出了一種結(jié)合目標(biāo)項(xiàng)目分析和支持向量機(jī)(SVM)的檢測(cè)方法(SVM~TIA)。
根據(jù)虛假用戶惡意注入的評(píng)分信息在時(shí)間節(jié)點(diǎn)上具有集中性的特點(diǎn),以及真實(shí)評(píng)分與托攻擊評(píng)分在統(tǒng)計(jì)學(xué)上呈現(xiàn)的不同分布特征,提出了一種基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)算法(TS-TIA)。
本書(shū)受國(guó)家自然科學(xué)基金面上項(xiàng)目“基于異構(gòu)服務(wù)網(wǎng)絡(luò)分析的Web服務(wù)推薦研究”(No.61379158),國(guó)家自然科學(xué)基金青年基金項(xiàng)目“基于用戶生成信息分析和異常群組發(fā)現(xiàn)的推薦系統(tǒng)托攻擊檢測(cè)研究”(No.61602070)等項(xiàng)目的資助。
本書(shū)的編寫(xiě)和出版受到了重慶大學(xué)軟件學(xué)院的大力支持,在此表示衷心的感謝。
限于本書(shū)作者的學(xué)識(shí)水平,書(shū)中疏漏之處在所難免,懇請(qǐng)讀者批評(píng)指正。
周魏,男,工學(xué)博士。國(guó)家建設(shè)高水平大學(xué)公派研究生項(xiàng)目-聯(lián)合培養(yǎng)博士研究生。香港理工大學(xué)博士后。主要研究方向?yàn)橥扑]系統(tǒng)和數(shù)據(jù)挖掘。近年來(lái)。主持國(guó)家自然科學(xué)基金1項(xiàng),參研國(guó)家自然科學(xué)基金3項(xiàng)。博士后基金1項(xiàng),國(guó)家科技支撐計(jì)劃課題1項(xiàng),中央高校科研業(yè)務(wù)專項(xiàng)基金各1項(xiàng),重慶市自然科學(xué)基金1項(xiàng)。以第1作者發(fā)表學(xué)術(shù)論文9篇,其中SCI檢索期刊4篇。El檢索8篇,計(jì)算機(jī)領(lǐng)域國(guó)際知名會(huì)議4篇,其中5篇為CCF推薦會(huì)議和期刊。文俊浩,男,重慶大學(xué)軟件學(xué)院教授、博士生導(dǎo)師。近年來(lái)主要從事服務(wù)計(jì)算、數(shù)據(jù)挖掘等方面的研究。主持國(guó)家自然科學(xué)基金面上項(xiàng)目2項(xiàng),主持國(guó)家“十一五”科技支撐計(jì)劃項(xiàng)目1項(xiàng),主研國(guó)家自然科學(xué)基金2項(xiàng),主持并參與省部級(jí)項(xiàng)目10余項(xiàng)。2015年獲國(guó)家教學(xué)成果二等獎(jiǎng)(排名第2)。2014年獲國(guó)家教學(xué)成果二等獎(jiǎng)(排名第1),2013年獲重慶市教學(xué)成果一等獎(jiǎng)(排名第1),2011年獲重慶市科技進(jìn)步二等獎(jiǎng)(排名第1)。近年來(lái)。發(fā)表學(xué)術(shù)論文70余篇,其中SCI檢索20余篇,EI檢索30余篇。
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.4 本書(shū)組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 推薦系統(tǒng)與推薦系統(tǒng)托攻擊檢測(cè)綜述
2.1 推薦系統(tǒng)綜述
2.2 推薦系統(tǒng)托攻擊
2.3 推薦系統(tǒng)托攻擊檢測(cè)
2.4 概貌屬性綜述
2.5 本章小結(jié)
第3章 基于目標(biāo)項(xiàng)目分析的推薦系統(tǒng)托攻擊檢測(cè)框架
3.1 問(wèn)題的提出
3.2 推薦系統(tǒng)魯棒性分析
3.3 目標(biāo)項(xiàng)目分析方法
3.4 基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架TIAF
3.5 本章小結(jié)
第4章 基于概貌屬性和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
4.1 基于概貌屬性和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架
4.2 RD-TIA托攻擊檢測(cè)方法
4.3 DeR-TIA托攻擊檢測(cè)方法
4.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
4.5 本章小結(jié)
第5章 基于支持向量機(jī)和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
5.1 問(wèn)題的提出
5.2 相關(guān)理論
5.3 基于支持向量機(jī)和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)
5.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
5.5 本章小結(jié)
第6章 基于時(shí)間序列和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
6.1 問(wèn)題的提出
6.2 時(shí)間序列建模
6.3 基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)框架
6.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
6.5 本章小結(jié)
第7章 結(jié)論與展望
7.1 主要結(jié)論
7.2 后續(xù)工作展望
參考文獻(xiàn)
《推薦系統(tǒng)中基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究》:
、偎阉饕媸侵高\(yùn)用一定的策略,使用特定的程序?qū)ヂ?lián)網(wǎng)上的信息資源搜集整理,對(duì)信息組織和處理后,供用戶輸入關(guān)鍵詞查詢的系統(tǒng)。它搜集并整理互聯(lián)網(wǎng)上的信息并根據(jù)用戶的查詢關(guān)鍵詞返回相應(yīng)結(jié)果。搜索引擎不僅能夠滿足人們絕大多數(shù)的搜索需求,還可以按照用戶的方式對(duì)搜索結(jié)果進(jìn)行個(gè)性化排序。根據(jù)有關(guān)調(diào)查報(bào)告顯示,截至2014年6月,中國(guó)搜索引擎用戶數(shù)達(dá)到50749萬(wàn)人,較去年同期增長(zhǎng)3711萬(wàn)人,增長(zhǎng)率為7.9%。這表明搜索引擎已經(jīng)逐漸融人人們的日常生活之中。
搜索引擎雖然在用戶能提供明確需求時(shí)功能強(qiáng)大,但是它只能被動(dòng)地向用戶展示信息,無(wú)法主動(dòng)地向用戶提供服務(wù),具有一定的局限性。同時(shí)對(duì)用戶而言,將需求表達(dá)成一個(gè)或者幾個(gè)合適的關(guān)鍵詞是一個(gè)較大的挑戰(zhàn)。例如,用戶面對(duì)成千上萬(wàn)的音樂(lè)專輯時(shí),往往難以找出符合自己興趣音樂(lè)的關(guān)鍵詞。此時(shí)搜索引擎難以提供有效的幫助,這就需要一個(gè)更為自動(dòng)化的信息過(guò)濾工具幫助用戶從龐大的音樂(lè)庫(kù)中找到其感興趣的音樂(lè)。另外,搜索結(jié)果的排序受到用戶越來(lái)越多的關(guān)注,如何對(duì)搜索結(jié)果進(jìn)行排序顯得尤為重要,而競(jìng)價(jià)排名的出現(xiàn),也成為搜索引擎被人詬病的原因之一。
、谕扑]系統(tǒng)是一種通過(guò)分析用戶的歷史行為信息、使用習(xí)慣等向用戶主動(dòng)推送信息的工具。電子商務(wù)是推薦系統(tǒng)的主要應(yīng)用領(lǐng)域,在電子商務(wù)不斷發(fā)展壯大的今天,各種商品信息在電子商務(wù)網(wǎng)站上不斷涌現(xiàn),用戶往往需要花費(fèi)大量的時(shí)間在各類商品信息中尋找自己想要的商品。推薦系統(tǒng)通過(guò)對(duì)用戶的歷史消費(fèi)習(xí)慣、點(diǎn)擊情況等信息進(jìn)行分析,向用戶呈現(xiàn)感興趣的甚至是潛在感興趣的商品,從而減少用戶瀏覽無(wú)用信息的時(shí)間以幫助用戶獲得更好的購(gòu)物體驗(yàn),并且能夠?yàn)殡娮由虅?wù)站點(diǎn)帶來(lái)更多的營(yíng)業(yè)額。
推薦系統(tǒng)促進(jìn)了電子商務(wù)的發(fā)展,同時(shí)電子商務(wù)的進(jìn)一步發(fā)展依賴于推薦系統(tǒng)自身功能的完善。推薦系統(tǒng)需要用戶大量的歷史記錄作為預(yù)測(cè)的依據(jù),一般來(lái)說(shuō),用戶提供的歷史數(shù)據(jù)越多,推薦系統(tǒng)向用戶推薦的結(jié)果就越準(zhǔn)確。推薦系統(tǒng)管理者希望用戶能夠提供對(duì)項(xiàng)目真實(shí)的評(píng)價(jià)從而使推薦系統(tǒng)能夠產(chǎn)生高質(zhì)量的推薦服務(wù),然而在現(xiàn)實(shí)中,惡意用戶利用推薦系統(tǒng)評(píng)分驅(qū)動(dòng)的工作機(jī)制與開(kāi)放性的特點(diǎn)來(lái)謀求不正當(dāng)利益。惡意用戶向推薦系統(tǒng)中注入虛假評(píng)價(jià)信息以達(dá)到干擾推薦系統(tǒng)正常推薦的目的,其結(jié)果是損害正常用戶的利益和推薦系統(tǒng)的信譽(yù)。例如在電子商務(wù)平臺(tái)中,部分廠商為了銷售更多的商品,向推薦系統(tǒng)注入虛假的評(píng)分信息或評(píng)論信息來(lái)提高商品在推薦系統(tǒng)中的排名;或者使用類似的方法打壓競(jìng)爭(zhēng)對(duì)手銷售的產(chǎn)品,以此來(lái)提高自己商品的銷量。現(xiàn)實(shí)生活中也不乏這樣的例子:索尼影業(yè)公司就曾經(jīng)偽造電影評(píng)論信息來(lái)宣傳正在發(fā)行的電影;亞馬遜網(wǎng)站曾遭到外來(lái)的攻擊,當(dāng)用戶瀏覽與宗教相關(guān)的書(shū)籍時(shí),系統(tǒng)會(huì)向用戶推薦有關(guān)性方面的書(shū)籍。
為了減少虛假信息對(duì)于推薦系統(tǒng)的影響,推薦系統(tǒng)管理者探討使用各種技術(shù)防御惡意程序的攻擊。例如,實(shí)行實(shí)名制,審核系統(tǒng)用戶信息,增加惡意用戶向推薦系統(tǒng)中注入托攻擊概貌的難度;使用驗(yàn)證碼,增加惡意程序的攻擊成本。然而,這些方法能阻止部分惡意程序,但同時(shí)也增加了正常用戶使用推薦系統(tǒng)的難度,不利于推薦系統(tǒng)的擴(kuò)展。
除了惡意程序?qū)ν扑]系統(tǒng)的攻擊之外,現(xiàn)實(shí)中還有專門提供托攻擊服務(wù)的人群,被稱為“網(wǎng)絡(luò)水軍”。例如手機(jī)軟件公司為了推廣自己開(kāi)發(fā)的軟件,通過(guò)雇傭網(wǎng)絡(luò)水軍來(lái)下載使用自己的軟件,使得軟件在軟件排行榜上的名次上升,吸引更多的用戶下載使用。網(wǎng)絡(luò)水軍的出現(xiàn)造成部分公司通過(guò)人為操縱下載量的方式長(zhǎng)期占據(jù)軟件排行榜前列導(dǎo)致了不公平競(jìng)爭(zhēng)。
……