書(shū)單推薦 新書(shū)推薦 |
DeepSeek硬核技術(shù)解讀
全書(shū)分為兩大部分,第一部分介紹DeepSeek學(xué)習(xí)的前置知識(shí),包括Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)基礎(chǔ)、大語(yǔ)言模型量化、大語(yǔ)言模型分布式訓(xùn)練等內(nèi)容,幫助讀者建立扎實(shí)的理論基礎(chǔ)。第二部分聚焦DeepSeek核心技術(shù),主要介紹MoE架構(gòu)負(fù)載均衡、基礎(chǔ)設(shè)施層的優(yōu)化、數(shù)據(jù)處理、訓(xùn)練邏輯、推理優(yōu)化等內(nèi)容。通過(guò)本書(shū)的學(xué)習(xí),讀者可以系統(tǒng)地理解DeepSeek的技術(shù)原理,并掌握大模型優(yōu)化的前沿方法。
你還可能感興趣
我要評(píng)論
|