書單推薦
更多
新書推薦
更多

從零開始寫大模型

從零開始寫大模型

定  價:69.8 元

        

  • 作者:王雙、牟晨、王昊怡
  • 出版時間:2024/12/1
  • ISBN:9787302695080
  • 出 版 社:清華大學出版社
  • 中圖法分類:TP18 
  • 頁碼:
  • 紙張:
  • 版次:
  • 開本:
9
7
6
8
9
7
5
3
0
0
8
2
0
"《從零開始寫大模型:從神經網絡到Transformer》結合豐富的圖示和程序示例,全面、系統(tǒng)地介紹大模型的基本原理,并通過一個極簡大語言模型構建案例帶領讀者上手實踐。本書學習門檻極低,即便零基礎的讀者,也能在本書的引領下比較輕松地掌握大模型的基本知識體系,并理解大模型的基本原理,從而為日后進一步學習打好基礎!稄牧汩_始寫大模型:從神經網絡到Transformer》提供配套教學視頻、源代碼和教學PPT等超值配套資源,以方便讀者高效、直觀地學習。 《從零開始寫大模型:從神經網絡到Transformer》共20章,分為5篇。第1篇神經網絡快速入門,介紹神經網絡的基礎和結構;第2篇Transformer架構基礎,介紹幾種經典的編解碼架構、Tokenization基礎知識、Transformer架構涉及的數(shù)學概念;第3篇Transformer模型剖析,首先介紹大語言模型的概念和參數(shù)規(guī)模,然后介紹Transformer的詞匯輸入模塊、注意力機制模塊和輸出模塊,最后介紹基于Transformer架構的模型訓練過程、推理過程、優(yōu)化方法和超參數(shù);第4篇Transformer進階,首先介紹如何使用Python實現(xiàn)一個簡單的Transformer架構,然后介紹BERT和GPT兩種經典大語言模型,最后給出國內一些大公司的高頻面試題;第5篇GPT模型完全體驗之MiniMind,詳細介紹一個開源極簡大語言模型MiniMind的項目情況、代碼結構,以及安裝、訓練、微調與推理過程等,帶領讀者體驗大語言模型的完整構建過程。 《從零開始寫大模型:從神經網絡到Transformer》內容豐富,通俗易懂,案例典型,講解深入淺出,特別適合零基礎學習大模型的讀者閱讀,也適合IT領域或其他領域向AI轉型但缺乏基礎的程序員、工程師等相關從業(yè)人員閱讀,還適合高等院校和培訓機構作為大模型的入門教材或教學參考書。"
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容