本書共12章,圍繞大語(yǔ)言模型基礎(chǔ)理論、預(yù)訓(xùn)練、指令理解、模型增強(qiáng)和模型應(yīng)用五個(gè)部分展開:第一部分介紹大語(yǔ)言模型的基礎(chǔ)理論;第二部分介紹大語(yǔ)言模型的預(yù)訓(xùn)練,包括大語(yǔ)言模型預(yù)訓(xùn)練數(shù)據(jù)和分布式訓(xùn)練;第三部分介紹大語(yǔ)言模型如何理解并服從人類指令,包括有監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí);第四部分介紹大語(yǔ)言模型增強(qiáng)技術(shù),包括多模態(tài)語(yǔ)言模型、大模型智能體和檢索增強(qiáng)生成;第五部分介紹大模型應(yīng)用,包括大模型效率優(yōu)化、模型評(píng)估和應(yīng)用開發(fā)。
適讀人群 :AI從業(yè)者、高年級(jí)本科生和研究生、對(duì)大模型感興趣的讀者
復(fù)旦NLP團(tuán)隊(duì)2025年新作
新增內(nèi)容超過(guò)50%
詳解MOE、多模態(tài)、智能體、RAG、大模型效率優(yōu)化、預(yù)訓(xùn)練、指令微調(diào)、強(qiáng)化學(xué)習(xí)、對(duì)齊、評(píng)估、應(yīng)用開發(fā)
深入探討LLM的實(shí)際應(yīng)用場(chǎng)景和評(píng)價(jià)方法,為讀者提供理論指導(dǎo)與實(shí)踐經(jīng)驗(yàn)
構(gòu)建LLM的每個(gè)階段都有算法、數(shù)據(jù)來(lái)源、代碼、難點(diǎn)及實(shí)踐經(jīng)驗(yàn)的詳細(xì)討論
配代碼
本書封底含有wispaper.ai科研助手智能體(預(yù)計(jì)2025年6月上線)邀請(qǐng)碼,憑邀請(qǐng)碼可免費(fèi)使用。
本書共分為12章,圍繞大語(yǔ)言模型基礎(chǔ)理論、預(yù)訓(xùn)練、指令理解、大模型增強(qiáng)和大模型應(yīng)用五個(gè)部分展開:第1部分介紹大語(yǔ)言模型的基礎(chǔ)理論;第2部分介紹大語(yǔ)言模型的預(yù)訓(xùn)練,包括大語(yǔ)言模型預(yù)訓(xùn)練數(shù)據(jù)和分布式訓(xùn)練;第3部分介紹大語(yǔ)言模型如何理解并服從人類指令,包括指令微調(diào)和強(qiáng)化學(xué)習(xí);第4部分介紹大語(yǔ)言模型增強(qiáng)技術(shù),包括多模態(tài)大語(yǔ)言模型、大模型智能體和檢索增強(qiáng)生成;第5部分介紹大模型應(yīng)用,包括大語(yǔ)言模型效率優(yōu)化、大語(yǔ)言模型評(píng)估和大語(yǔ)言模型應(yīng)用開發(fā)。
第2章介紹大語(yǔ)言模型的基礎(chǔ)理論知識(shí),包括語(yǔ)言模型的定義、Transformer結(jié)構(gòu)、大語(yǔ)言模型框架等內(nèi)容,并以LLaMA使用的模型結(jié)構(gòu)為例介紹代碼實(shí)例。
第3章和第4章圍繞大語(yǔ)言模型預(yù)訓(xùn)練階段的主要研究?jī)?nèi)容展開介紹,包括模型分布式訓(xùn)練中需要掌握的數(shù)據(jù)并行、流水線并行、張量并行及ZeRO系列優(yōu)化方法。除此之外,還將介紹預(yù)訓(xùn)練需要使用的數(shù)據(jù)分布和數(shù)據(jù)預(yù)處理方法,并以DeepSpeed為例介紹如何進(jìn)行大語(yǔ)言模型預(yù)訓(xùn)練。
第5章和第6章聚焦于大語(yǔ)言模型指令理解階段的核心研究?jī)?nèi)容,探討如何通過(guò)指令微調(diào)和強(qiáng)化學(xué)習(xí)方法,使模型能夠理解指令并生成類人回答。第5章重點(diǎn)介紹模型微調(diào)技術(shù)、指令微調(diào)數(shù)據(jù)的構(gòu)造策略以及高效微調(diào)方法,如LoRA、Delta Tuning等方法,第6章則圍繞強(qiáng)化學(xué)習(xí)展開,講解其基礎(chǔ)理論與近端策略優(yōu)化(PPO)技術(shù),并結(jié)合實(shí)際案例,以DeepSpeed-Chat和verl框架為例,詳細(xì)說(shuō)明如何訓(xùn)練類ChatGPT系統(tǒng)。
第7章、第8章和第9章圍繞提升大語(yǔ)言模型的能力展開詳細(xì)探討,內(nèi)容涵蓋多模態(tài)大語(yǔ)言模型、大模型智能體和檢索增強(qiáng)生成。第7章重點(diǎn)介紹多模態(tài)大語(yǔ)言模型的基礎(chǔ)理論、架構(gòu)設(shè)計(jì)與訓(xùn)練策略,并探討其在實(shí)際場(chǎng)景中的應(yīng)用實(shí)踐;第8章聚焦于智能體的發(fā)展歷程與大語(yǔ)言模型智能體的架構(gòu)設(shè)計(jì),深入分析智能體的實(shí)現(xiàn)原理,并以LangChain為例詳細(xì)闡述具體實(shí)踐;第9章則圍繞檢索增強(qiáng)生成展開討論,介紹其核心思想與實(shí)現(xiàn)方式,涵蓋檢索增強(qiáng)框架的設(shè)計(jì)、檢索模塊與生成模塊的協(xié)作機(jī)制,以及其在具體任務(wù)場(chǎng)景中的應(yīng)用方法與實(shí)踐。
第10章、第11章和第12章主要圍繞如何應(yīng)用大語(yǔ)言模型展開討論,內(nèi)容涵蓋提升模型效率的方法、大語(yǔ)言模型評(píng)估,以及大語(yǔ)言模型典型應(yīng)用的開發(fā)與部署。第10章重點(diǎn)介紹模型壓縮與優(yōu)化、訓(xùn)練效率優(yōu)化和推理效率優(yōu)化等提升模型效率的關(guān)鍵技術(shù);第11章聚焦于大語(yǔ)言模型評(píng)估,探討其基本概念和難點(diǎn),闡述評(píng)估體系的構(gòu)建、評(píng)估方法的設(shè)計(jì)及實(shí)際評(píng)估的實(shí)施;第12章則基于典型的大語(yǔ)言模型應(yīng)用場(chǎng)景,詳細(xì)介紹其開發(fā)流程、開發(fā)工具及本地部署的實(shí)踐方法。
張奇
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師。兼任上海市智能信息處理實(shí)驗(yàn)室副主任,中國(guó)中文信息學(xué)會(huì)理事、CCF大模型論壇常務(wù)委員、CIPS信息檢索專委會(huì)常務(wù)委員、CIPS大模型專委會(huì)委員。多次擔(dān)任ACL、EMNLP、COLING、全國(guó)信息檢索大會(huì)等重要國(guó)際和國(guó)內(nèi)會(huì)議的程序委員會(huì)主席、領(lǐng)域主席、講習(xí)班主席等職務(wù)。近年來(lái),承擔(dān)了國(guó)家重點(diǎn)研發(fā)計(jì)劃課題、國(guó)家自然科學(xué)基金、上海市科委等的多個(gè)項(xiàng)目,在國(guó)際重要學(xué)術(shù)期刊和會(huì)議上發(fā)表論文200余篇。獲得WSDM 2014最佳論文提名獎(jiǎng)、COLING 2018 領(lǐng)域主席推薦獎(jiǎng)、NLPCC 2019杰出論文獎(jiǎng)、COLING 2022杰出論文獎(jiǎng)。獲得上海市晨光計(jì)劃人才計(jì)劃、復(fù)旦大學(xué)卓越2025人才培育計(jì)劃等支持,獲得錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)一等獎(jiǎng)、漢王青年創(chuàng)新一等獎(jiǎng)、上海市科技進(jìn)步二等獎(jiǎng)、IBM Faculty Award等獎(jiǎng)項(xiàng)。
桂韜
復(fù)旦大學(xué)副研究員。研究領(lǐng)域?yàn)轭A(yù)訓(xùn)練模型、類人對(duì)齊和智能體交互。在國(guó)際重要學(xué)術(shù)期刊和會(huì)議上發(fā)表論文50余篇,主持國(guó)家自然科學(xué)基金、計(jì)算機(jī)學(xué)會(huì)和人工智能學(xué)會(huì)的多個(gè)人才項(xiàng)目。獲得錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)一等獎(jiǎng)、NeurIPS 2023大模型對(duì)齊 Track最佳論文獎(jiǎng),入選第七屆中國(guó)科協(xié)青年人才托舉工程、上海市啟明星計(jì)劃。
鄭銳
博士畢業(yè)于復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,師從張奇教授。曾任字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)算法工程師,現(xiàn)就職于某前沿科技公司,研究方向?yàn)榇竽P蛯?duì)齊、復(fù)雜推理能力提升。獲得NeurIPS Workshop on Instruction Following 2024最佳論文獎(jiǎng)。MOSS-RLHF開源項(xiàng)目負(fù)責(zé)人,開源了RLHF代碼庫(kù)及技術(shù)文檔,推動(dòng)大模型對(duì)齊技術(shù)發(fā)展。在ICLR、ICML、NeurIPS、ACL等國(guó)際會(huì)議上發(fā)表多篇論文。
黃萱菁
復(fù)旦大學(xué)特聘教授、博士生導(dǎo)師。主要從事人工智能、自然語(yǔ)言處理和大語(yǔ)言模型研究。兼任中國(guó)計(jì)算機(jī)學(xué)會(huì)理事、自然語(yǔ)言處理專委會(huì)主任、中國(guó)中文信息學(xué)會(huì)理事、計(jì)算語(yǔ)言學(xué)學(xué)會(huì)亞太分會(huì)主席。在國(guó)際重要學(xué)術(shù)期刊和會(huì)議上發(fā)表論文200余篇,獲優(yōu)秀論文獎(jiǎng)8項(xiàng)。獲得錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)一等獎(jiǎng)、上海市育才獎(jiǎng),以及人工智能全球女性學(xué)者、福布斯中國(guó)科技女性等多項(xiàng)榮譽(yù)。