書單推薦 新書推薦 |
DeepSeek硬核技術(shù)解讀
全書分為兩大部分,第一部分介紹DeepSeek學(xué)習(xí)的前置知識(shí),包括Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)基礎(chǔ)、大語言模型量化、大語言模型分布式訓(xùn)練等內(nèi)容,幫助讀者建立扎實(shí)的理論基礎(chǔ)。第二部分聚焦DeepSeek核心技術(shù),主要介紹MoE架構(gòu)負(fù)載均衡、基礎(chǔ)設(shè)施層的優(yōu)化、數(shù)據(jù)處理、訓(xùn)練邏輯、推理優(yōu)化等內(nèi)容。通過本書的學(xué)習(xí),讀者可以系統(tǒng)地理解DeepSeek的技術(shù)原理,并掌握大模型優(yōu)化的前沿方法。
你還可能感興趣
我要評論
|