使用Python和JAX構(gòu)建推薦系統(tǒng)
定 價:128 元
當(dāng)前圖書已被 1 所學(xué)校薦購過!
查看明細
- 作者:[美]布萊恩 比肖夫(Bryan Bischof) [美]余養(yǎng)勵(Hector Yee) 著
- 出版時間:2025/6/1
- ISBN:9787523900529
- 出 版 社:中國電力出版社
- 中圖法分類:TP393.072
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
實現(xiàn)和設(shè)計向用戶提供建議的系統(tǒng)是當(dāng)前 且最重要的機器學(xué)習(xí)應(yīng)用之一.無論是希望客戶在你的在線商店中找到擁有吸引力的商品、獲取豐富且有趣的視頻,還是獲取他們需要了解的新聞,推薦系統(tǒng)(RecSys)都能提供解決方案.在這本實用指南中,本書作者闡述了核心概念,并提供示例,幫助你構(gòu)建適用于任何行業(yè)或規(guī)模的推薦系統(tǒng).你將學(xué)習(xí)構(gòu)建成功推薦系統(tǒng)所需的數(shù)學(xué)知識、基本理念,以及具體的實現(xiàn)細節(jié).本書涵蓋推薦系統(tǒng)平臺的核心組件、MLOps相關(guān)工具,以及PySpark、SparkSQL、FastAPI和Weights&Biases中的代碼示例和實用建議.你將學(xué)習(xí):·構(gòu)建推薦系統(tǒng)所需的數(shù)據(jù).·如何將你的數(shù)據(jù)和業(yè)務(wù)問題框定為推薦系統(tǒng)問題.·適用于你的系統(tǒng)的模型評估方法.選擇、實現(xiàn)、訓(xùn)練、測試和部署模型的方法.·需要跟蹤的關(guān)鍵指標,以確保系統(tǒng)按預(yù)期運行.·隨著對用戶、產(chǎn)品和業(yè)務(wù)的深入了解,如何不斷改進你的系統(tǒng).
編輯推薦實現(xiàn)和設(shè)計向用戶提供建議的系統(tǒng)是當(dāng)前最Z流行且最Z重要的機器學(xué)習(xí)應(yīng)用之一。無論是希望客戶在你的在線商店中找到最Z具吸引力的商品、獲取豐富且有趣的視頻,還是獲取他們需要了解的新聞,推薦系統(tǒng)(RecSys)都能提供解決方案。在這本實用指南中,本書作者闡述了核心概念,并提供示例,幫助你構(gòu)建適用于任何行業(yè)或規(guī)模的推薦系統(tǒng)。你將學(xué)習(xí)構(gòu)建成功推薦系統(tǒng)所需的數(shù)學(xué)知識、基本理念,以及具體的實現(xiàn)細節(jié)。本書涵蓋推薦系統(tǒng)平臺的核心組件、MLOps相關(guān)工具,以及PySpark、SparkSQL、FastAPI和Weights&Biases中的代碼示例和實用建議。專家推薦對于希望構(gòu)建真實世界系統(tǒng),而不僅僅是訓(xùn)練模型的從業(yè)者來說,這是一本必B讀之作。Jacopo TagliabueBauplan聯(lián)合創(chuàng)始人,RecList和evalRS共同創(chuàng)作者從現(xiàn)在起,這本書將成為我書架上該主題的標準參考書。 Will KurtAI工程師,《Bayesian Statistics the Fun Way》和《Get Programming with Haskell》作者
前言你是如何找到這本書的?是在網(wǎng)站上看到的廣告嗎?也許是朋友或?qū)熗扑]的,或是在社交媒體上看到的相關(guān)帖子。也有可能是在書店的書架上發(fā)現(xiàn)的,一家你通過地圖應(yīng)用找到的書店。無論你是如何找到它的,你幾乎可以肯定是通過某種推薦系統(tǒng)來到這本書的。實現(xiàn)和設(shè)計為用戶提供建議的系統(tǒng)是機器學(xué)習(xí)(ML)在任何業(yè)務(wù)中最流行和最重要的應(yīng)用之一。無論你是希望幫助用戶找到最符合他們品味的衣服,還是從網(wǎng)上商店中購買最吸引人的商品,或是提供豐富娛樂的視頻,從他們的網(wǎng)絡(luò)中呈現(xiàn)出最具吸引力的內(nèi)容,或者是他們當(dāng)天需要知道的新聞亮點,推薦系統(tǒng)都是實現(xiàn)這些目標的方式,F(xiàn)代推薦系統(tǒng)的設(shè)計與它們所服務(wù)的領(lǐng)域一樣多樣化。這些系統(tǒng)不僅包括實現(xiàn)和執(zhí)行產(chǎn)品目標的計算機軟件架構(gòu),還包括排序的算法組件。推薦排名的方法可以來自傳統(tǒng)的統(tǒng)計學(xué)習(xí)算法、線性代數(shù)的啟發(fā)、幾何考慮,當(dāng)然還有基于梯度的方法。正如算法方法的多樣性一樣,推薦的建模和評估考慮也同樣多樣化:個性化排名、搜索推薦、序列建模,以及這些方法的評分現(xiàn)在都是從事推薦系統(tǒng)工作的機器學(xué)習(xí)工程師需要了解的內(nèi)容。如果你是一名機器學(xué)習(xí)從業(yè)者,你可能已經(jīng)了解推薦系統(tǒng),并且可能知道一兩種最簡單的建模方法,并能夠?qū)I(yè)地談?wù)撓嚓P(guān)的數(shù)據(jù)結(jié)構(gòu)和模型架構(gòu)。然而,RecSys 常常超出數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的核心課程。許多擁有多年行業(yè)經(jīng)驗的高級數(shù)據(jù)科學(xué)家對實際構(gòu)建推薦系統(tǒng)知之甚少,當(dāng)談及此話題時可能會感到不安。盡管RecSys 與其他機器學(xué)習(xí)問題有著相似的基礎(chǔ)和技能,但其活躍的社區(qū)和快速發(fā)展的重點使得構(gòu)建推薦系統(tǒng)容易被那些已經(jīng)投入時間或愿意保持最新信息的其他數(shù)據(jù)科學(xué)家所忽略。這本書的存在正是為了突破這些感知的障礙。理解推薦系統(tǒng)在實際層面上的應(yīng)用不僅對需要向用戶提供內(nèi)容的商業(yè)案例有用,RecSys 的基本理念通常還能彌合其他類型機器學(xué)習(xí)之間的巨大差距。例如,一個文章推薦系統(tǒng)可能會利用自然語言處理(NLP)來找到文章的表示,使用序列建模來促進更長時間的參與,并使用上下文組件來允許用戶查詢引導(dǎo)結(jié)果。如果你純粹是出于學(xué)術(shù)興趣進入這一領(lǐng)域,無論你對數(shù)學(xué)的哪個方面感興趣,遲早都會在RecSys 中找到聯(lián)系或應(yīng)用!最后,如果與其他領(lǐng)域的聯(lián)系、幾乎所有數(shù)學(xué)的應(yīng)用或明顯的商業(yè)實用性還不足以讓你對RecSys 感興趣,那么令人驚嘆的尖端技術(shù)可能會達到這個效果。RecSys 始終處于甚至超越了機器學(xué)習(xí)的前沿。擁有顯著的收入影響的一個好處是,公司和從業(yè)者需要不斷推動可能性的邊界以及他們的實現(xiàn)方式。當(dāng)你考慮到FAANG[ 即Meta(前Facebook)、Apple、Amazon、Netflix 和Google] 的五個字母中有四個的核心在于一個或多個推薦系統(tǒng)時,這并不奇怪。有人可能會爭論說Apple 的核心也有推薦系統(tǒng)。盡管確實如此,App Store 是公司至關(guān)重要的戰(zhàn)略產(chǎn)品,但我們保守地認為五個中的四個,認為推薦系統(tǒng)并不是Apple的主要收入來源。作為從業(yè)者,你需要了解如何:? 將你的數(shù)據(jù)和業(yè)務(wù)問題框架化為RecSys 問題。? 確定開始構(gòu)建RecSys 所需的基本數(shù)據(jù)。? 確定適合你的RecSys 問題的模型以及如何評估它們。? 實現(xiàn)、訓(xùn)練、測試和部署上述模型。? 跟蹤指標以確保系統(tǒng)按計劃運行。? 隨著你對用戶、產(chǎn)品和業(yè)務(wù)案例的了解不斷改進系統(tǒng)。本書展示了完成這些步驟所需的核心概念和示例,無論行業(yè)或規(guī)模如何。我們將引導(dǎo)你通過數(shù)學(xué)、思想和實現(xiàn)細節(jié)來構(gòu)建推薦系統(tǒng),無論這是你的第一個還是第五十個推薦系統(tǒng)。我們將向你展示如何使用Python 和JAX 構(gòu)建這些系統(tǒng)。如果你還不熟悉,JAX 是Google 推出的一個Python 框架,旨在使自動微分和函數(shù)式編程范式成為一等對象。此外,它使用特別方便于來自各種背景的機器學(xué)習(xí)從業(yè)者的NumPy API 風(fēng)格。我們將展示必要核心概念的代碼示例和架構(gòu)模型,并提供將這些系統(tǒng)擴展到生產(chǎn)應(yīng)用的方法。排版約定本書采用以下排版約定。斜體(Italic)表示新術(shù)語、URL、電子郵件地址、文件名和文件擴展名。等寬字體(Constant width)表示程序清單,在段落內(nèi)表示程序元素,例如變量、函數(shù)名稱、數(shù)據(jù)庫、數(shù)據(jù)類型、環(huán)境變量、語句和關(guān)鍵字。粗體等寬字體(Constant width bold)表示應(yīng)由用戶原封不動輸入的命令或其他文本。斜體等寬字體(Constant width italic)表示應(yīng)該替換成用戶提供值的文本,或者由上下文決定的值。使用代碼示例所包含的代碼片段引用了將在中等規(guī)模且大多數(shù)情況下免費的資源上運行的筆記本。為了便于實驗和探索,我們通過Google Colab 筆記本提供代碼。補充材料(代碼示例、練習(xí)等)可在GitHub 上的ESRecsys 下載(https://github.com/BBischof/ESRecsys/)。與本書相關(guān)的技術(shù)問題,或者在使用代碼示例上有疑問,請發(fā)電子郵件到bookquestions@oreilly.com。本書是要幫你完成工作的。一般來說,如果本書提供了示例代碼,你可以把它用在你的程序或文檔中。除非你使用了很大一部分代碼,否則無需聯(lián)系我們獲得許可。比如,用本書的幾個代碼片段寫一個程序就無需獲得許可,銷售或分發(fā)OReilly 圖書的示例集則需要獲得許可;引用本書中的示例代碼回答問題無需獲得許可,將書中大量的代碼放到你的產(chǎn)品文檔中則需要獲得許可。我們很希望但并不強制要求你在引用本書內(nèi)容時加上引用說明。引用說明一般包括書名、作者、出版社和ISBN,例如:Building Recommendation Systems in Python and JAX by Bryan Bischof and Hector Yee. Copyright 2024 Bryan Bischof and Resonant Intelligence LLC, 978-1-492-09799-0 。如果你覺得自己對示例代碼的使用超出了上述許可范圍,請通過permissions@oreilly.com 與我們聯(lián)系。OReilly 在線學(xué)習(xí)平臺(OReilly Online Learning)近40 年來,OReilly Media 致力于提供技術(shù)和商業(yè)培訓(xùn)、知識和卓越見解,來幫助眾多公司取得成功。公司獨有的專家和改革創(chuàng)新者網(wǎng)絡(luò)通過OReilly 書籍、文章以及在線學(xué)習(xí)平臺,分享他們的專業(yè)知識和實踐經(jīng)驗。OReilly 在線學(xué)習(xí)平臺按照您的需要提供實時培訓(xùn)課程、深入學(xué)習(xí)渠道、交互式編程環(huán)境以及來自O(shè)Reilly 和其他200 多家出版商的大量書籍與視頻資料。更多信息,請訪問網(wǎng)站:https://www.oreilly.com/。聯(lián)系我們?nèi)魏斡嘘P(guān)本書的意見或疑問,請按照以下地址聯(lián)系出版社。美國:OReilly Media, Inc.1005 Gravenstein Highway NorthSebastopol, CA 95472中國:北京市西城區(qū)西直門南大街2 號成銘大廈C 座807 室(100035)奧萊利技術(shù)咨詢(北京)有限公司我們?yōu)楸緯⒘艘粋網(wǎng)頁,列出了勘誤表、示例和任何附加信息。您可以訪問https://oreil.ly/build_rec_sys_python_jax 查看該頁面。欲了解本社圖書和課程的新聞和信息,請訪問我們的網(wǎng)站http://oreilly.com。我們的LinkedIn:https://linkedin.com/company/oreilly-media。我們的Twitter:https://twitter.com/oreillymedia。我們的YouTube:http://youtube.com/oreillymedia。致謝Hector 想感謝她的丈夫Donald 在本書寫作期間給予的愛與支持,以及姐姐Serena 一直送來的零食。她還想把這本書獻給已經(jīng)去世的親人。特別感謝Google 評審員Ed Chi、Courtney Hohne、Sally Goldman、Richa Nigam、Mingliang Jiang 和Anselm Levskaya。感謝Bryan Hughes 審閱Wikipedia 代碼。Bryan 想感謝他在Stitch Fix 的同事們,在那里他學(xué)到了本書中的許多關(guān)鍵理念,特別是Ian Horn 對遷移學(xué)習(xí)的耐心指導(dǎo),Dr. Molly Davies 對實驗和效應(yīng)估計的指導(dǎo),Mark Weiss 對可用性和推薦之間關(guān)系的深度合作,Dr. Reza Sohrabi對Transformers 模型的介紹,Dr. Xi Chen 對推薦系統(tǒng)中圖神經(jīng)網(wǎng)絡(luò)的鼓勵,以及Dr. Leland McInnes 對降維和近似最近鄰的細心建議。Bryan 從與Dr.Natalia Gardiol、Dr. Daniel Fleischman、Dr. Andrew Ho、Jason Liu、Dr. Dan Marthaler、Dr. Chris Moody、Oz Raza、Dr. Anna Schneider、Ujjwal Sarin、Agnieszka Szefer、Dr. Daniel Tasse、Diyang Tang、Zach Winston 等人的對話中受益匪淺。除了他在Stitch Fix 的出色同事,他特別想感謝Dr. Eric Bunch、Dr. Lee Goerl、Dr. Will Chernoff、Leo Rosenberg 和Janu Verma 多年來的合作。Dr.Brian Amadio 作為出色的同事,最初建議他寫這本書。Dr. Even Oldridge 鼓勵他嘗試寫作。Eugene Yan 和Karl Higley,盡管他從未見過他們,但受到了他們的巨大啟發(fā)。他還想感謝Dr. Zhongzhu Lin 和Dr. Alexander Rosenberg,他們對他的職業(yè)生涯產(chǎn)生了深遠的影響。Cianna Salvatora 協(xié)助了早期的文獻回顧,Valentina Besprozvannykh 在閱讀早期草稿和提供指導(dǎo)方面提供了極大的幫助。兩位作者感謝Tobias Zwingmann、Ted Dunning、Vicki Boykis、Eric Schles、Shaked Zychlinski 和Will Kurt,他們花了大量時間對書稿進行細致的技術(shù)反饋,沒有他們,這本書將難以理解。感謝Rebecca Novack 不斷督促我們簽約這個項目。感謝Jill Leonard 刪除了書稿中近100 個錯誤使用的utilize一詞,并在書籍文本方面提供了極大的耐心合作。
前言 1
第一部分 熱身
第1章 概述 11
1.1 推薦系統(tǒng)的核心組件 12
1.1.1 收集器 12
1.1.2 排序器 12
1.1.3 服務(wù)器 12
1.2 最簡單的推薦器 13
1.2.1 簡單推薦器 13
1.2.2 很受歡迎的條目推薦器 14
1.3 JAX 的簡要介紹 16
1.3.1 基礎(chǔ)類型,初始化和不可變性 16
1.3.2 索引和切片 17
1.3.3 廣播 18
1.3.4 隨機數(shù) 19
1.3.5 即時編譯 20
1.4 總結(jié) 21
第2章 用戶-物品項評分與問題構(gòu)建 23
2.1 用戶-物品項矩陣 23
2.2 用戶-用戶協(xié)同過濾vs 物品項-物品項協(xié)同過濾 27
2.3 Netflix 挑戰(zhàn) 28
2.4 隱式評分29
2.5 數(shù)據(jù)收集與用戶日志記錄 30
2.5.1 日志記錄的內(nèi)容 30
2.5.2 數(shù)據(jù)收集與事件記錄.34
2.5.3 漏斗分析 35
2.6 業(yè)務(wù)洞察與用戶偏好 37
2.7 總結(jié) 38
第3章 數(shù)學(xué)基礎(chǔ) 41
3.1 齊夫定律與馬太效應(yīng)在推薦系統(tǒng)中的應(yīng)用 41
3.2 稀疏性 44
3.3 用戶相似性在協(xié)同過濾中的應(yīng)用 46
3.3.1 皮爾遜相關(guān)系數(shù) 47
3.3.2 基于相似性的評分 48
3.4 探索-利用作為推薦系統(tǒng) 49
3.4.1 - 貪婪算法50
3.4.2 應(yīng)該設(shè)為多少 52
3.5 自然語言處理(NLP)與推薦系統(tǒng)的關(guān)系 52
3.5.1 向量搜索 53
3.5.2 最近鄰搜索 55
3.6 總結(jié) 55
第4章 推薦系統(tǒng)設(shè)計 57
4.1 離線vs 在線 57
4.2 收集器 59
4.2.1 離線收集器 59
4.2.2 在線收集器 59
4.3 排序器 60
4.3.1 離線排序器 60
4.3.2 在線排序器 60
4.4 服務(wù)器 61
4.4.1 離線服務(wù)器 61
4.4.2 在線服務(wù)器 61
4.5 總結(jié) 62
第5章 綜合實踐:基于內(nèi)容的推薦系統(tǒng) 63
5.1 版本控制軟件 64
5.2 Python 構(gòu)建系統(tǒng) 65
5.3 隨機物品推薦器 66
5.4 獲取STL 數(shù)據(jù)集圖像 69
5.5 卷積神經(jīng)網(wǎng)絡(luò)定義 70
5.6 在JAX、Flax 和Optax 中訓(xùn)練模型 71
5.7 輸入管道73
5.8 總結(jié) 87
第二部分 檢索
第6章 數(shù)據(jù)處理 91
6.1 給系統(tǒng)注入數(shù)據(jù) 91
6.1.1 PySpark 91
6.1.2 例子:使用PySpark 構(gòu)建用戶相似度 96
6.1.3 DataLoaders 101
6.1.4 數(shù)據(jù)庫快照 104
6.2 用于學(xué)習(xí)和推理的數(shù)據(jù)結(jié)構(gòu) 105
6.2.1 向量搜索 106
6.2.2 近似最近鄰(ANN) 107
6.2.3 布隆過濾器 108
6.2.4 有趣的分支:將布隆過濾器作為推薦系統(tǒng) 110
6.2.5 特征庫 111
6.3 總結(jié) 115
第7章 服務(wù)模型和架構(gòu) 117
7.1 推薦系統(tǒng)的架構(gòu)設(shè)計 117
7.1.1 物品到用戶的推薦 118
7.1.2 基于查詢的推薦 118
7.1.3 基于上下文的推薦 120
7.1.4 基于序列的推薦 121
7.1.5 為什么需要額外特征121
7.2 編碼器架構(gòu)與冷啟動 122
7.3 部署 125
7.3.1 模型作為API 125
7.3.2 啟動模型服務(wù) 126
7.3.3 工作流編排 128
7.4 警報和監(jiān)控 130
7.4.1 模式和先驗 130
7.4.2 集成測試 132
7.4.3 可觀察性 133
7.5 生產(chǎn)環(huán)境中的評估 134
7.5.1 慢反饋 134
7.5.2 模型指標 135
7.6 持續(xù)訓(xùn)練和部署 136
7.6.1 模型漂移 136
7.6.2 部署拓撲 137
7.7 評估飛輪.140
7.7.1 每日熱啟動 140
7.7.2 Lamada 架構(gòu)和編排 141
7.7.3 日志記錄 142
7.7.4 主動學(xué)習(xí) 146
7.8 總結(jié) 150
第8章 綜合實踐:數(shù)據(jù)處理和計數(shù)推薦器 151
8.1 技術(shù)棧 152
8.2 數(shù)據(jù)的表現(xiàn)形式 153
8.3 大數(shù)據(jù)框架 155
8.3.1 集群框架 156
8.3.2 PySpark 示例 157
8.4 GloVE 模型定義 168
8.4.1 在JAX 和Flax 中的GloVE 模型規(guī)范 169
8.4.2 使用Optax 進行GloVE 模型訓(xùn)練171
8.5 總結(jié) 173
第三部分 排序
第9章 基于特征和基于計數(shù)的推薦 177
9.1 雙線性因子模型(指標學(xué)習(xí)) 177
9.2 基于特征的熱啟動 181
9.3 分段模型和混合模型 183
9.3.1 基于標簽的推薦系統(tǒng)184
9.3.2 混合模型 185
9.4 雙線性模型的局限性 186
9.5 計算推薦系統(tǒng)數(shù)量 188
9.5.1 返回最熱門物品的推薦器(MPIR) 188
9.5.2 關(guān)聯(lián)挖掘 189
9.5.3 通過共現(xiàn)計算點互信息 192
9.5.4 基于共現(xiàn)的相似性度量 193
9.5.5 基于相似度的推薦 194
9.6 總結(jié) 195
第10章 低秩方法 197
10.1 潛在空間 197
10.2 點積相似度 199
10.3 共現(xiàn)模型 201
10.4 減少推薦系統(tǒng)排名的問題203
10.4.1 利用ALS 優(yōu)化矩陣分解(MF) 205
10.4.2 矩陣分解的正則化 207
10.4.3 正則化的矩陣因子分解實現(xiàn) 208
10.4.4 WSABIE 233
10.5 降低維度 234
10.5.1 等距嵌入 238
10.5.2 非線性局部可度量化的嵌入 239
10.5.3 中心核對齊241
10.6 親和力和銷售估計器 241
10.7 用于推薦系統(tǒng)評估的傾向性加權(quán) 243
10.7.1 傾向 244
10.7.2 辛普森悖論與降低混雜因素的影響 246
10.8 總結(jié) 247
第11章 個性化推薦度量指標 249
11.1 環(huán)境 250
11.1.1 在線與離線 250
11.1.2 用戶vs 物品度量指標 251
11.1.3 A/B 測試 252
11.2 召回率和準確率 253
11.2.1 @k 254
11.2.2 在k 的精準率 255
11.2.3 在k 的召回率 256
11.2.4 r- 精準率 256
11.3 mAP, MMR, NDCG 256
11.3.1 mAP 257
11.3.2 MRR 258
11.3.3 NDCG 258
11.3.4 mAP 與NDCG 的對比 260
11.3.5 相關(guān)性系數(shù) 260
11.4 用RMSE 考慮親和度 261
11.5 積分形式的指標:AUC 和cAUC 262
11.5.1 推薦概率與AUC-ROC 262
11.5.2 與其他度量指標比較 263
11.6 BPR 263
11.7 總結(jié) 264
第12章 排名訓(xùn)練 265
12.1 排名在推薦系統(tǒng)中的作用是什么 265
12.2 排序?qū)W習(xí) 266
12.3 訓(xùn)練一個LTR 模型.267
12.3.1 用于排名的分類 267
12.3.2 用于排名的回歸 268
12.3.3 用于排名的分類和回歸 269
12.4 加權(quán)近似排名對(WARP) 269
12.5 k 階統(tǒng)計量 271
12.6 很好匹配25(BM25) 272
12.7 多模態(tài)檢索 275
12.8 總結(jié) 276
第13章 綜合實踐:實驗與排序 277
13.1 實驗提示 277
13.1.1 保持簡單 278
13.1.2 調(diào)試打印語句 278
13.1.3 推遲優(yōu)化 279
13.1.4 記錄變更 280
13.1.5 使用特征工程 280
13.1.6 理解模型指標與業(yè)務(wù)指標的區(qū)別 281
13.1.7 快速迭代 281
13.2 Spotify 百萬播放列表數(shù)據(jù)集 282
13.2.1 構(gòu)建URI 字典 284
13.2.2 構(gòu)建訓(xùn)練數(shù)據(jù) 286
13.2.3 讀取輸入 289
13.2.4 建模問題 292
13.2.5 構(gòu)建損失函數(shù) 295
13.3 練習(xí) 300
13.4 總結(jié) 301
第四部分 服務(wù)
第14章 業(yè)務(wù)邏輯 305
14.1 硬排序 306
14.2 學(xué)習(xí)避開項 307
14.3 手工調(diào)整權(quán)重 308
14.4 庫存健康 308
14.5 實現(xiàn)避開項 309
14.6 基于模型的避開項 311
14.7 總結(jié) 312
第15章 推薦系統(tǒng)中的偏見 313
15.1 推薦的多樣化 314
15.1.1 提高多樣性314
15.1.2 應(yīng)用組合優(yōu)化 316
15.2 多目標函數(shù) 317
15.3 謂詞下推 318
15.4 公平性 319
15.5 總結(jié) 320
第16章 加速結(jié)構(gòu) 321
16.1 分片 322
16.2 局部敏感哈希(LSH) 322
16.3 k-d 樹 325
16.4 分層k-means 328
16.5 更低成本的檢索方法 330
16.6 總結(jié) 331
第五部分 推薦系統(tǒng)的未來
第17章 序列推薦系統(tǒng) 335
17.1 馬爾可夫鏈 336
17.1.1 二階馬爾可夫鏈 337
17.1.2 其他馬爾可夫模型 338
17.2 RNN 和CNN 架構(gòu) 339
17.3 注意力架構(gòu) 341
17.3.1 自注意力序列推薦 343
17.3.2 BERT4Rec 343
17.3.3 時效性采樣344
17.3.4 合并靜態(tài)與序列數(shù)據(jù) 344
17.4 總結(jié) 346
第18章 推薦系統(tǒng)的下一步發(fā)展 347
18.1 多模態(tài)推薦 348
18.2 基于圖的推薦系統(tǒng) 350
18.2.1 神經(jīng)消息傳遞 351
18.2.2 應(yīng)用 353
18.2.3 隨機游走 354
18.2.4 元路徑與異構(gòu)性 355
18.3 LLM 的應(yīng)用 356
18.3.1 LLM 推薦系統(tǒng) 357
18.3.2 LLM 訓(xùn)練 357
18.3.3 推薦系統(tǒng)的指令調(diào)優(yōu) 360
18.3.4 LLM 排名器 360
18.3.5 推薦系統(tǒng)對AI 的幫助 361
18.4 總結(jié) 362