這就是DeepSeek:DeepSeek從原理到實(shí)踐
定 價(jià):69 元
- 作者:王卓,薛棟,隆建 著
- 出版時(shí)間:2025/10/1
- ISBN:9787301361696
- 出 版 社:北京大學(xué)出版社
- 中圖法分類(lèi):TP18
- 頁(yè)碼:236
- 紙張:
- 版次:1
- 開(kāi)本:16開(kāi)
這是一本系統(tǒng)講解DeepSeek大模型的技術(shù)指南,它全面覆蓋DeepSeek的底層架構(gòu)、核心原理及實(shí)際應(yīng)用。本書(shū)從人工智能基礎(chǔ)、DeepSeek的技術(shù)架構(gòu),到多模態(tài)模型的訓(xùn)練與優(yōu)化,幫助讀者深入理解DeepSeek的工作機(jī)制,并掌握DeepSeek在大規(guī)模預(yù)訓(xùn)練、推理優(yōu)化及應(yīng)用部署中的關(guān)鍵技術(shù)。全書(shū)共有12章,主要包括DeepSeek的使命與愿景、人工智能與大模型、DeepSeek底層架構(gòu)解密、DeepSeek的工作原理、DeepSeek的內(nèi)部機(jī)制、DeepSeek的架構(gòu)揭秘、DeepSeek的訓(xùn)練過(guò)程、DeepSeek的訓(xùn)練優(yōu)化與成本控制、DeepSeek-R1、稀疏矩陣技術(shù)、DeepSeek部署實(shí)戰(zhàn),以及DeepSeek接入實(shí)戰(zhàn)。
本書(shū)全面而深入的技術(shù)解讀,不僅適用于對(duì)大模型感興趣的技術(shù)人員,還適合人工智能研究者、開(kāi)發(fā)者及行業(yè)從業(yè)者。同時(shí),書(shū)中結(jié)合實(shí)戰(zhàn)案例和對(duì)比分析,幫助讀者理解DeepSeek的獨(dú)特優(yōu)勢(shì)及未來(lái)的發(fā)展方向。
王卓
華中科技大學(xué)計(jì)算機(jī)碩士,精通C、C++、C#、Python等語(yǔ)言。曾任阿里達(dá)摩院資深算法工程師,參與Qwen1/Qwen1.5大模型落地工作,擅長(zhǎng)人工智能算法原理、大模型開(kāi)發(fā)、計(jì)算機(jī)視覺(jué)及自然語(yǔ)言處理。目前專(zhuān)注于電商預(yù)訓(xùn)練語(yǔ)言模型和輿情風(fēng)險(xiǎn)監(jiān)控大模型的研發(fā)。
薛棟
華東理工大學(xué)信息科學(xué)與技術(shù)學(xué)院副教授/碩士生導(dǎo)師,德國(guó)慕尼黑工業(yè)大學(xué)博士,榮獲上海市高層次青年人才計(jì)劃等稱(chēng)號(hào)。曾在荷蘭格羅寧根大學(xué)(RUG)、德國(guó)卡爾斯魯厄理工學(xué)院(KIT)任教,長(zhǎng)期從事人工智能與大數(shù)據(jù)研究,發(fā)表SCI論文30余篇,主持多項(xiàng)國(guó)家及企業(yè)科研項(xiàng)目。所在X-D Lab已推出MindChat、Sunsimiao、GradChat等垂直領(lǐng)域大模型項(xiàng)目。
隆建
華東理工大學(xué)副教授/博導(dǎo),主要研究人工智能方法及工業(yè)應(yīng)用,發(fā)表論文60余篇,擁有50余項(xiàng)專(zhuān)利。主持20余項(xiàng)國(guó)家及企業(yè)科研項(xiàng)目,榮獲多項(xiàng)國(guó)家/省部級(jí)科技獎(jiǎng)項(xiàng),并指導(dǎo)學(xué)生獲得20余項(xiàng)獎(jiǎng)項(xiàng)。
第1章 DeepSeek的使命與愿景:開(kāi)辟AI應(yīng)用新紀(jì)元
1.1 DeepSeek的由來(lái)
1.2 DeepSeek的主要產(chǎn)品和應(yīng)用場(chǎng)景
1.3 DeepSeek與其他模型的性能對(duì)比
1.4 DeepSeek初體驗(yàn)
1.5 DeepSeek API
第2章 人工智能與大模型:智能時(shí)代的核心引擎
2.1 人工智能基礎(chǔ)介紹
2.2 什么是大模型
2.3 神經(jīng)網(wǎng)絡(luò)
2.4 網(wǎng)絡(luò)模型
第3章 DeepSeek 底層架構(gòu)解密:探尋大模型的基石
3.1 基于 Transformer架構(gòu)
3.2 動(dòng)態(tài)任務(wù)分配:智能計(jì)算的自適應(yīng)引擎
3.3 稀疏激活機(jī)制:動(dòng)態(tài)結(jié)構(gòu)感知的高效優(yōu)化范式
3.4 MoE架構(gòu):基于稀疏專(zhuān)家的動(dòng)態(tài)路由系統(tǒng)
3.5 歸一化技術(shù):穩(wěn)定性與效率的平衡術(shù)
3.6 多令牌預(yù)測(cè)技術(shù):增強(qiáng)推理能力的新途徑
3.7 高效并行策略:性能極限的系統(tǒng)設(shè)計(jì)
3.8 混合精度與量化:訓(xùn)練效率的加速器
3.9 顯存優(yōu)化與結(jié)構(gòu)共享:資源利用的范式創(chuàng)新
第4章 DeepSeek 的工作原理:從生成到模型安全的全面解析
4.1 逐詞生成:DeepSeek的輸出過(guò)程
4.2 概率模型:如何生成有意義的文本
4.3 性能優(yōu)化與效率提升
4.4 模型的安全性與可靠性
第5章 DeepSeek 的內(nèi)部機(jī)制:智能思維的發(fā)動(dòng)機(jī)
5.1 “嵌入”與向量空間
5.2 語(yǔ)義理解與生成
5.3 模型的決策過(guò)程
第6章 DeepSeek 的架構(gòu)揭秘:駕馭大模型的核心
6.1 探索模型網(wǎng)絡(luò):基礎(chǔ)DeepSeekMoE架構(gòu)剖析
6.2 升級(jí)進(jìn)化:DeepSeek-V3模型全景
6.3 多模態(tài)大模型:DeepSeek的跨感知融合
6.4 升級(jí)版Janus-Pro:多模態(tài)進(jìn)階的實(shí)踐與優(yōu)化
第7章 DeepSeek 的訓(xùn)練過(guò)程:從數(shù)據(jù)到微調(diào)的全流程揭秘
7.1 數(shù)據(jù)準(zhǔn)備與預(yù)處理
7.2 基礎(chǔ)訓(xùn)練:從無(wú)到有
7.3 微調(diào)與優(yōu)化:提升性能
第8章 DeepSeek 的訓(xùn)練優(yōu)化與成本控制:效率與經(jīng)濟(jì)性的雙重探索
8.1 數(shù)據(jù)規(guī)模、訓(xùn)練策略與低成本秘訣
8.2 鏈?zhǔn)剿伎寂c可解釋推理:DeepSeek的獨(dú)到之處
8.3 開(kāi)源策略:如何用開(kāi)放共享降低壁壘
第9章 DeepSeek-R1:推理模型的革新之旅
9.1 DeepSeek-R1全景探秘
9.2 DeepSeek-R1開(kāi)源信息概覽
9.3 DeepSeek-R1-Zero自進(jìn)化訓(xùn)練體系揭秘
9.4 全場(chǎng)景強(qiáng)化學(xué)習(xí):分析完整的訓(xùn)練策略
9.5 蒸餾處理
第10章 稀疏矩陣技術(shù):計(jì)算效率的新型加速利器
10.1 稀疏矩陣技術(shù)概述
10.2 稀疏矩陣技術(shù)在DeepSeek中的應(yīng)用
10.3 稀疏矩陣技術(shù)的前沿探索
第11章 DeepSeek 部署實(shí)戰(zhàn):從本地到云端的一體化落地
11.1 基于Ollama的本地部署
11.2 基于Chatbox的本地部署
11.3 基于LM Studio的本地部署
11.4 基于Ollama+Docker+Open WebUI的本地部署
11.5 DeepSeek的遠(yuǎn)程和云端部署
第12章 DeepSeek 接入實(shí)戰(zhàn):無(wú)縫集成與多平臺(tái)落地指南
12.1 Chatbox接入實(shí)戰(zhàn)
12.2 NextChat接入實(shí)戰(zhàn)
12.3 通過(guò)OfficeAI將DeepSeek接入Office
12.4 將DeepSeek接入VS Code
12.5 將DeepSeek接入PyCharm
12.6 基于茴香豆+DeepSeek的微信聊天機(jī)器人