書單推薦 新書推薦 |
生成與推理:DeepSeek的對話原則與思維方法 肖睿 吳寒 ![]()
本書作為專門討論大模型提示詞的一本書,主要包含四部分內(nèi)容:第1章介紹基于對話方式的大模型工具的原理和分類;第2章和第3章分別介紹生成模型和推理模型的提示詞技巧和差異;第4章介紹提示詞在5個行業(yè)的應用案例,并討論讀者應該如何運用AI思維有效使用AI技術和工具;第5章展望AI生成與推理能力的深層次融合以及AI可能帶來的革命性變革。
本書作為系列圖書中專門討論大模型提示詞的一本書,系統(tǒng)地揭示了提示詞技術的設計邏輯與實踐方法,聚焦生成模型與推理模型的差異化能力與應用場景,為讀者提供從理論到實戰(zhàn)的全方位指導。
前 言工具和火的使用讓人類成為高級生物,語言和文字為人類形成社會組織和社會文化提供了支撐。之后,人類歷經(jīng)農(nóng)業(yè)革命、工業(yè)革命、能源革命、信息革命,終于走到今天的“智能革命”。薛定諤認為熵減是生命的本質(zhì),而第二熱力學定律認為熵增是時間的本質(zhì)。宇宙中生命的意義之一就是和時間對抗,而對抗的工具就是智能,智能的基礎就是信息和信息熵。智能可以分為生物智能、工具自動化、人工智能等。其中人工智能(Artificial Intelligence,AI)主要是指機器智能,從早年基于知識工程和符號系統(tǒng)的傳統(tǒng)人工智能(AI 1.0)已經(jīng)進化到當今基于數(shù)據(jù)和統(tǒng)計學習的現(xiàn)代人工智能(AI 2.0),包括機器學習、深度學習,以及以ChatGPT和DeepSeek為代表的大模型技術(大模型也是本書討論的主要內(nèi)容),F(xiàn)代人工智能的本質(zhì)是數(shù)據(jù)智能,基于數(shù)據(jù)模型來提供分析能力和預測能力,主要適用于三種問題場景,或者說基于三個假設才能發(fā)揮作用:一是研究對象在問題領域的描述數(shù)據(jù)或觀測數(shù)據(jù)要足夠豐富和完備;二是研究對象在時間變化中存在內(nèi)在規(guī)律;三是過去的數(shù)據(jù)和未來的數(shù)據(jù)是同構的,可以以古鑒今。根據(jù)以上對人工智能的理解,我們能夠清晰地判斷當前人工智能能做什么、不能做什么,既不忽視其技術潛力,也不盲目將其神化。很多人會把人工智能技術歸屬為計算機技術,但我認為計算機技術僅僅是人工智能的工具,而人工智能技術的核心在于問題抽象和數(shù)據(jù)建模。若將人工智能技術比作天文學,那么計算機技術則可比作望遠鏡,兩者之間關系緊密,卻又不盡相同。至于其他計算機應用技術,例如手機應用、網(wǎng)絡游戲、計算機動畫等技術,則可以類比為望遠鏡在軍事、航海等領域的應用。如果將傳統(tǒng)的計算機應用技術稱為軟件1.0,現(xiàn)代人工智能技術則可以稱為軟件2.0。軟件1.0的核心是代碼,解決的是確定性問題,對于問題解決方案的機制和原理是可以解釋的、可以重復的;軟件2.0的核心是數(shù)據(jù),解決的是非確定性問題,對于問題解決方案的機制和原理缺乏可解釋性和可重復性。用通俗的話來講,軟件1.0要求人們首先給出問題解決方案,然后用代碼的方式告訴計算機如何去按照方案和步驟解決問題;軟件2.0則只給出該問題的相關數(shù)據(jù),然后讓計算機自己學習這些數(shù)據(jù),最后找出問題的解決方案,這個方案可以解決問題,但可能和人類自己的解決方案不同,人類可能也看不懂軟件2.0的解決方案的原理,即“知其然不知其所以然”。但軟件2.0非常適合解決復雜問題和混沌問題,例如計算機視覺、語音處理、機器翻譯、藝術創(chuàng)作、數(shù)據(jù)洞察等。這類問題依賴于直覺和經(jīng)驗,人類可能也說不清是怎么解決的,所以無法給出明確的解決方案和解決步驟,從而無法采用軟件1.0的方式讓計算機解決這些問題。至于簡單問題和繁雜問題,因為規(guī)則明確,更適合采用自動化工具(如軟件1.0)來解決。如今,基于數(shù)據(jù)智能的人工智能技術已然邁入大模型時代。隨著ChatGPT的橫空出世和DeepSeek的快速出圈,人工智能正逐漸演變?yōu)橐环N通用技術,這種無形卻廣泛應用的技術,其影響力堪比30年前計算機對各行業(yè)的深遠變革,亦如15年前互聯(lián)網(wǎng)對各行業(yè)的深刻滲透。人工智能技術在產(chǎn)業(yè)中有五個重要的工作環(huán)節(jié):一是算法和模型研究,二是問題抽象和場景分析,三是數(shù)據(jù)采集和處理,四是模型訓練、推理和算力支持,五是應用場景的軟硬件工程。(1)算法和模型研究。數(shù)據(jù)智能的本質(zhì)是從過去的數(shù)據(jù)中發(fā)現(xiàn)固定的模式和規(guī)律,假設數(shù)據(jù)是獨立同分布的,其核心工作就是用一個數(shù)學函數(shù)來模擬現(xiàn)實世界中的事物。而如何選擇合適的模型框架,并計算出模型參數(shù),讓模型代表的數(shù)學函數(shù)盡可能穩(wěn)定地逼近現(xiàn)實世界,就是算法和模型研究的核心。在實踐中,機器學習一般采用數(shù)學公式來表示函數(shù),深度學習則通過深度神經(jīng)網(wǎng)絡來表示函數(shù),雖然在可解釋性上會趨向于黑盒,但在對數(shù)學函數(shù)的表達能力上往往優(yōu)于機器學習。當前主流的大模型技術,主要依托于Transformer和Diffusion這兩大深度學習框架,其顯著特征在于參數(shù)量龐大、算力需求極高以及數(shù)據(jù)消耗巨大。從數(shù)學和理論復雜度上,大模型技術低于深度學習,深度學習技術低于機器學習;從工程復雜度上,大模型技術高于深度學習,深度學習技術高于機器學習。(2)問題抽象和場景分析。在人工智能的視角下,世界是數(shù)字化的、模型化的。如何把現(xiàn)實世界中的問題找出來,并將其轉(zhuǎn)化為抽象的數(shù)學問題,是模型訓練和算法研究的第一步,也是人工智能技術應用的基礎環(huán)節(jié),往往還是最關鍵的步驟,這一過程需要深度結合業(yè)務理解和場景分析方能實現(xiàn)。(3)數(shù)據(jù)采集和處理。在大模型技術中,數(shù)據(jù)種類繁多,數(shù)據(jù)數(shù)量十分龐大。如何以低成本獲取海量的數(shù)據(jù)樣本并進行標注,往往是決定一種算法能否成功、一種模型能否順利訓練、一個應用能否滿足落地要求的關鍵因素。因此,針對海量數(shù)據(jù),如何高效地進行采集、清洗、存儲、交易、融合及分析,變得至關重要,而這些環(huán)節(jié)往往伴隨著巨大的資金投入。這有時成為人工智能研究和應用機構之間的競爭壁壘,甚至催生了專門進行數(shù)據(jù)采集、處理、標注的數(shù)據(jù)工程服務行業(yè)。(4)模型訓練、推理和算力支持。在大模型技術中,深度神經(jīng)網(wǎng)絡的參數(shù)量高達數(shù)十億,其訓練、測試和驗證所依賴的數(shù)據(jù)集亦是以十億token計算的海量規(guī)模,參數(shù)迭代計算主要采用梯度優(yōu)化的數(shù)值計算方法和反向傳播策略,且尚未涵蓋模型訓練過程中可能遭遇的系統(tǒng)中斷和模型不收斂問題。因此,整個預訓練、后訓練和推理過程對算力的性能和穩(wěn)定性均提出了極高的要求。當前,專為神經(jīng)網(wǎng)絡訓練而設計的計算機模型尚未成熟,工程實踐中普遍采用的是傳統(tǒng)的馮·諾依曼架構計算機。這需要在計算機體系結構設計(包括并行計算與局部組件優(yōu)化)、專用計算芯片及集群(包括GPU、TPU等)以及計算成本規(guī)劃(包括計算機、通信、存儲和云平臺等)方面進行持續(xù)優(yōu)化與強化。這一過程涉及解決大規(guī)模算力支持和復雜的工程挑戰(zhàn)。(5)應用場景的軟硬件工程。數(shù)據(jù)模型在具體場景中如何應用,涉及大量的軟件工程、硬件工程、產(chǎn)品設計和提示詞優(yōu)化等工作。在這個工作環(huán)節(jié)中,工程設計人員主要負責把已經(jīng)訓練好的數(shù)據(jù)模型應用到具體的產(chǎn)品和服務中,重點考慮大模型的推理成本和響應效率、軟硬件的設計和制造的成本與質(zhì)量,以及用戶體驗等。這類工作的重點在于對大模型進行微調(diào)或數(shù)據(jù)增強,隨后通過軟件工程、硬件工程、產(chǎn)品設計和提示詞優(yōu)化工作來完成具體的智能產(chǎn)品或提供專業(yè)的智能服務。本系列圖書的主題是以DeepSeek為代表的大模型技術的認知、原理和應用,既不包含傳統(tǒng)的符號系統(tǒng)和知識工程,也不包含機器學習和傳統(tǒng)深度學習的詳細內(nèi)容。傳統(tǒng)的符號系統(tǒng)和知識工程屬于傳統(tǒng)人工智能(AI 1.0)的范疇,對于理解和掌握以數(shù)據(jù)智能為核心的現(xiàn)代人工智能(AI 2.0)幾乎毫無幫助。而現(xiàn)代人工智能中的機器學習和深度學習的知識和理論內(nèi)容,主要是數(shù)據(jù)建模的邏輯和流程,以及神經(jīng)網(wǎng)絡的反向傳播策略和梯度下降算法,對于理解大模型技術的原理、工程和應用非常關鍵,其他的具體模型(例如隨機森林、SVM、CNN、RNN等)沒有必要花費時間和精力去系統(tǒng)全面地學習和掌握。我們試圖利用前言讓第一次接觸人工智能大模型技術的讀者能夠理解基本的數(shù)據(jù)智能、機器學習、深度學習概念,從而快速進入以DeepSeek為代表的大模型技術和應用領域。為了便于讀者系統(tǒng)全面地掌握大模型和DeepSeek技術和應用,我們規(guī)劃了“大模型技術與應用叢書”系列圖書。本系列圖書采用三層知識結構,每一層都包含數(shù)本著作。第一層是人工智能通識和導論,對人工智能的本質(zhì)原理、技術體系、行業(yè)應用、未來發(fā)展做一個整體的介紹和討論。第二層是大模型和DeepSeek原理、生成模型和推理模型的提示詞工程、大模型應用開發(fā)和部署、大模型訓練和微調(diào)、大模型智能體(包括Agent和Agentic AI)、數(shù)據(jù)工程等技術內(nèi)容的講解。第三層是大模型和DeepSeek在各行業(yè)的應用框架和案例,包括教育、金融、醫(yī)療、商業(yè)、安防、軟件開發(fā)、新媒體、影視娛樂、政企辦公管理等行業(yè)。距離ChatGPT發(fā)布已經(jīng)有兩年,大模型的語言能力和知識儲備已經(jīng)超過了人類平均水平,隨著今年年初DeepSeek的快速出圈和廣泛應用,大模型的思考和推理能力也在逐漸達到甚至超越人類平均水平。對于廣大的AI應用者來說,AI思維和提示詞方法已經(jīng)成為使用AI工具的有效手段。從本質(zhì)上來說,提示詞方法是一種大模型學習方法,也是一種大模型能力控制和激發(fā)方法,是普通讀者與大模型溝通的主要方法。隨著大模型的智能化程度不斷提升,人們所使用的提示詞已從難以理解的咒語式字符串,逐步演變?yōu)橐匀祟愖匀徽Z言為核心的表達方式。如今,人類需要像對待同事、專家以及合作伙伴一樣對待大模型,與之協(xié)同工作,共同生活。隨著DeepSeek-R1的發(fā)布,大模型技術全面進入推理模型階段,大模型具備了長鏈推理和深度思考的能力。在Agent和Agentic AI的場景中,提示詞越來越復雜,越來越代碼化和程序化。但是在與人類直接進行對話交互的場景中,提示詞技巧(尤其是結構公式和提示詞模板)日益簡潔和直接,從原來的面向模型逐漸變成面向人類,其主要作用已經(jīng)從幫助大模型理解人類的任務背景信息和命令意圖,轉(zhuǎn)變?yōu)閹椭祟愖陨硎崂硭季S邏輯、明晰問題思路、提高語言組織和表達水平。本書作為專門討論大模型提示詞的一本書,主要包含四部分內(nèi)容:第1章介紹基于對話方式的大模型工具的原理和分類;第2章和第3章分別介紹生成模型和推理模型的提示詞技巧和差異;第4章介紹提示詞在5個行業(yè)的應用案例,并討論讀者應該如何運用AI思維有效使用AI技術和工具;第5章展望AI生成與推理能力的深層次融合以及AI可能帶來的革命性變革。隨著AI應用的不斷發(fā)展,Agent技術的應用日益普及。近期,“提示詞工程”(Prompt Engineering)正在向“上下文工程”(Context Engineering)延伸。上下文工程研究的是如何為AI設計和構建動態(tài)上下文,致力于在恰當?shù)臅r機、以恰當?shù)母袷,為大語言模型提供恰當?shù)男畔⒑凸ぞ,確保模型具備完成任務所需的一切條件。我們可以用一個比喻來理解提示詞工程與上下文工程的關系:如果說提示詞就像一套小學一年級教材,那么上下文則是小學一年級教室里的所有東西—不僅包括教材,還涵蓋黑板、桌椅、學習用品、環(huán)境氛圍等一切影響學習效果的因素。從視角上看,提示詞是從用戶角度看問題,關注如何清晰地表達需求和指令;而上下文則是從模型角度看問題,關注模型在生成回答前所能獲取和處理的全部信息,即關注模型在決策前需要獲得哪些信息才能達到最佳表現(xiàn)。與傳統(tǒng)的提示詞工程不同,上下文工程不僅僅關注發(fā)送給模型的單一提示詞文本,而是關注模型在生成回答前所接觸到的一切信息,包括系統(tǒng)提示詞、用戶輸入、對話歷史以及工具返回信息等,從而為AI構建一個高效的“工作環(huán)境”。上下文工程強調(diào)動態(tài)性和系統(tǒng)性:它是一個動態(tài)系統(tǒng)的交互,能夠根據(jù)當前任務即時生成量身定制的上下文,而非靜態(tài)的提示詞模板。在AI Agent背景下,單純的提示詞工程已經(jīng)無法滿足復雜應用的需求,上下文工程正在成為構建高效智能體的關鍵思路。人工智能作為新時代最具潛力和生命力的技術之一,得到了國家和社會的廣泛支持與重點發(fā)展。這一領域人才儲備相對匱乏,但需求旺盛,職業(yè)發(fā)展空間廣闊,就業(yè)前景樂觀。這一輪以ChatGPT和DeepSeek為代表的大模型浪潮,并非一場簡單的競賽,而是一場殘酷的淘汰賽。掌握大模型技術的個人、企業(yè)和國家將占得先機。能與此次人工智能技術崛起相提并論的,或許僅有30年前計算機行業(yè)的騰飛,以及15年前互聯(lián)網(wǎng)行業(yè)的崛起。最后,真心祝愿各位讀者能夠在本系列圖書的幫助下,抓住技術升級的機遇,順利踏入人工智能技術領域,更好地應用人工智能工具和技術,抓住人工智能時代紅利,成為人生贏家。北大青鳥人工智能研究院院長 肖睿2025年3月于北大燕北園
北大青鳥人工智能研究院院長,向量智能創(chuàng)始人兼CEO,課工場創(chuàng)始人兼CEO,北京大學AI肖睿團隊負責人研究方向是機器學習與大模型技術。著有《人工智能通識課》、《機器學習實戰(zhàn)》、《Keras神經(jīng)網(wǎng)絡與深度學習》等69本高校教材。其中三本教材連續(xù)入選“十三五”、“十四五”國家規(guī)劃教材書目。
目 錄前言第1章 對話系統(tǒng)的演進11.1 從規(guī)則系統(tǒng)到神經(jīng)網(wǎng)絡21.2 傳統(tǒng)對話系統(tǒng)與現(xiàn)代AI對話系統(tǒng)的對比31.2.1 傳統(tǒng)對話系統(tǒng):規(guī)則與統(tǒng)計的時代41.2.2 現(xiàn)代AI對話系統(tǒng):深度學習的崛起71.2.3 現(xiàn)代AI對話系統(tǒng)的優(yōu)勢與挑戰(zhàn)91.2.4 現(xiàn)代AI對對話系統(tǒng)設計的影響111.3 生成式人工智能與推理式人工智能131.3.1 生成式人工智能131.3.2 推理式人工智能141.4 DeepSeek:人工智能對話領域的新生力量161.4.1 DeepSeek的核心技術與創(chuàng)新171.4.2 性能對比與行業(yè)影響181.4.3 市場競爭與未來展望19本章總結19第2章 生成式對話的原理與技巧202.1 生成式對話的原理202.2 生成模型的優(yōu)勢與局限242.2.1 生成模型的核心優(yōu)勢242.2.2 生成模型的技術局限252.2.3 可控生成的技術演進262.2.4 應用場景的適應性邊界262.3 生成模型的提示詞策略272.3.1 傳統(tǒng)提示詞工程的核心原則272.3.2 OpenAI給出的寫好提示詞的六大原則272.3.3 結構化提示詞422.3.4 多步驟指令與任務分解方法452.3.5 溫度與采樣參數(shù)對輸出的影響472.3.6 DeepSeek-V3版提示詞技巧472.4 生成任務的最佳實踐512.4.1 內(nèi)容創(chuàng)作:如何生成高質(zhì)量內(nèi)容512.4.2 全能客服:提高客戶滿意度562.4.3 虛擬IP:敘事驅(qū)動的文本冒險/角色扮演游戲592.4.4 生成任務常見問題解決方案62本章總結63第3章 推理式對話的原理與技巧653.1 推理模型對話的原理653.1.1 推理的本質(zhì):從已知到未知653.1.2 推理模型的核心機制663.1.3 知識表示與推理:模型智能的基石793.2 推理模型的優(yōu)勢與局限813.2.1 解決復雜問題與進行多步推理的能力813.2.2 推理過程的透明度與可解釋性813.2.3 專業(yè)領域知識應用與局限823.2.4 推理深度與計算效率的權衡823.3 提升推理模型性能的提示詞策略823.3.1 提示詞工程在駕馭人工智能推理能力中的關鍵作用833.3.2 構建推理模型提示詞的基本原則833.3.3 簡潔直接提問的重要性863.3.4 避免冗余指令的具體方法873.3.5 結構化輸出的引導技巧883.3.6 運用高級提示詞工程策略以提升推理模型的性能893.4 推理任務的最佳實踐1033.4.1 數(shù)學問題求解與推理過程1033.4.2 法律文本分析與邏輯推導1053.4.3 科學研究與假設驗證方法1073.4.4 多步驟決策與復雜規(guī)劃案例1093.4.5 問答系統(tǒng):提供準確的答案1123.4.6 決策支持系統(tǒng):輔助決策1133.4.7 智能搜索:提高搜索效率115本章總結117第4章 行業(yè)應用案例研究1184.1 AI全面賦能新媒體1184.1.1 市場洞察與賬號定位1184.1.2 生成智能內(nèi)容與運營1254.1.3 AI助力智能運營1384.2 教育領域的應用與優(yōu)化1504.2.1 智能教學準備:精準規(guī)劃與設計1504.2.2 個性化學習與輔導:因材施教的AI伙伴1534.2.3 高效資源生成:豐富教學素材庫1534.2.4 智能評估與反饋:促進深度學習1544.2.5 學術研究支持:賦能高等教育與科研1564.2.6 優(yōu)化策略與倫理考量1604.3 軟件開發(fā)與自動化測試1604.3.1 AI賦能軟件工程新可能1614.3.2 提示詞在軟件開發(fā)關鍵環(huán)節(jié)的應用1614.3.3 提示詞在自動化測試提速中的應用1694.3.4 實踐要點與提示詞優(yōu)化思路1724.4 金融分析與決策支持系統(tǒng)1744.4.1 智能研報生成與解讀1754.4.2 風險評估與管理1774.4.3 智能投資顧問1784.4.4 交易策略開發(fā)與回測1824.5 醫(yī)療健康領域的應用挑戰(zhàn)1844.5.1 醫(yī)療行業(yè)的需求背景和潛在機會1844.5.2 醫(yī)療健康領域的提示詞應用1844.5.3 典型應用場景1884.5.4 醫(yī)療健康領域的應用挑戰(zhàn)191本章總結193第5章 未來展望1945.1 生成與推理的互補與共生1955.2 多模態(tài)能力的深度融合1975.3 AI思維的進化:從工具到伙伴,再到自主智能體1985.4 技術發(fā)展趨勢預測:未來的星辰大海2005.5 結語:擁抱變革,與智能共舞205參考文獻207
你還可能感興趣
我要評論
|







