![]() ![]() |
大模型核心原理與企業(yè)落地實踐
本書分兩大篇。第1篇原理篇 (第1、2章); 嘗試引導讀者共同探索和揭秘研發(fā)領域大模型背后的核心原理, 以使讀者“既知其然, 又知其所以然”, 并為后續(xù)章節(jié)的學習打下堅實的基礎。從概率、最優(yōu)化等基礎理論入手, 進而深入淺出地闡述Transformer、神經(jīng)元等大模型的核心組成元素, 以及評估方法、數(shù)據(jù)工程建設等通用能力的建設。針對技術細節(jié), 采用通俗易懂的行文風格, 并輔以大量的圖表和數(shù)據(jù), “零基礎”的讀者也可以高效地學習。第2篇應用實踐篇 (第3-8章), 產(chǎn)業(yè)界最新實踐成果的總結。選取代碼生成、代碼轉換、知識問答、推理加速、運維運營等研發(fā)大模型領域的高頻業(yè)務作為剖析對象, 詳細展示作者在針對這些問題時的端到端思考, 包括設計理念、關鍵技術瓶頸、解決方案及落地結果等。
你還可能感興趣
我要評論
|