AIGC基礎(chǔ)、應(yīng)用與展望
定 價:59.8 元
叢書名:高等學(xué)校數(shù)智人才培養(yǎng)AI通識精品系列
AI是近年來炙手可熱的前沿技術(shù)。隨著越來越多的AI應(yīng)用進入人們的視野,AI技術(shù)也贏得了國內(nèi)外社會公眾、專家、學(xué)者和開發(fā)者的廣泛關(guān)注。 自2022年ChatGPT橫空出世以來,AIGC迅速成為極其火爆的AI發(fā)展方向。近年來,各種AIGC大模型層出不窮,AIGC大模型生成的內(nèi)容也日臻完善,并且已經(jīng)達到可以落地應(yīng)用的程度,因此可能創(chuàng)造大量的就業(yè)機會。 本書概述了AIGC的基礎(chǔ)技術(shù),從機器學(xué)習(xí)、深度學(xué)習(xí)的基本概念和基礎(chǔ)算法,到生成模型、自然語言處理和計算機視覺的相關(guān)技術(shù),即使是沒有學(xué)過 AI 基礎(chǔ)知識的讀者,也可以輕松入門。本書還從眾多AIGC大模型中選擇了具有代表性的大模型進行解讀,使讀者能夠輕松理解其工作原理,內(nèi)容涵蓋代碼生成、圖像生成、語音生成和視頻生成等諸多應(yīng)用領(lǐng)域。在此基礎(chǔ)上,本書還將帶領(lǐng)讀者一起試用各種類型的AIGC大模型,使讀者能夠直觀體驗AIGC大模型落地應(yīng)用的效果。 本書既可作為高校人工智能通識課程或AIGC相關(guān)課程的教材,也可作為相關(guān)領(lǐng)域的從業(yè)人員入門了解AI的參考用書。
1.面向通識教育,構(gòu)建知識體系 本書從最基礎(chǔ)的 AI 概念入手,沿著 AI 基礎(chǔ)概念、機器學(xué)習(xí)基礎(chǔ)、深度學(xué)習(xí)基礎(chǔ)、AIGC背后的基礎(chǔ)技術(shù)、AIGC 大模型的學(xué)習(xí)路線逐層遞進,讀者不需要學(xué)習(xí)其他基礎(chǔ)課程,即可讀懂書中的內(nèi)容。AI 是以計算機科學(xué)為基礎(chǔ),涉及計算機、數(shù)學(xué)、統(tǒng)計學(xué)等知識的交叉學(xué)科。書中講到涉及其他學(xué)科的知識時,都會提前介紹,比如第 2 章介紹生成模型時涉及較多統(tǒng)計學(xué)的知識,因此 2.1.3 小節(jié)講解了生成模型中用到的統(tǒng)計學(xué)概念,為讀者學(xué)習(xí)和理解后面的內(nèi)容奠定基礎(chǔ)。 2.理論深度較淺,適合入門學(xué)習(xí) AI 模型的核心技術(shù)是算法和模型的網(wǎng)絡(luò)結(jié)構(gòu)。模型的網(wǎng)絡(luò)結(jié)構(gòu)是算法的具體實現(xiàn),而理解深度學(xué)習(xí)模型(特別是 AIGC 大模型)中的算法需要很多數(shù)學(xué)知識。為了便于初學(xué)者理解深度學(xué)習(xí)模型的工作原理,本書只簡要介紹一些基礎(chǔ)算法的數(shù)學(xué)公式,而在介紹深度學(xué)習(xí)模型時,通常只介紹其網(wǎng)絡(luò)結(jié)構(gòu),不涉及算法的數(shù)學(xué)公式,因為初學(xué)者只要理解模型的工作原理即可,不需要掌握設(shè)計 AI 模型的理論與技術(shù)。 3.緊跟時代發(fā)展,融合前沿技術(shù) AIGC 技術(shù)在近幾年高速發(fā)展,涌現(xiàn)出很多新技術(shù)和新的 AIGC 大模型。為了讓讀者能夠緊跟 AIGC 技術(shù)發(fā)展的潮流,本書不但重點講解了經(jīng)典 AIGC 技術(shù)大語言模型的工作原理和具體應(yīng)用,還介紹了 AIGC 在代碼生成、圖像生成、語音生成和視頻生成等領(lǐng)域的應(yīng)用。書中講解的很多 AIGC 大模型都是近年來推出的新模型,涵蓋了 AIGC 技術(shù)的最新發(fā)展趨勢。 4.創(chuàng)新教材形態(tài),助力讀者自學(xué) 編者結(jié)合書中重點內(nèi)容錄制了大量微課,為讀者開展高效自學(xué)提供了便捷路徑,并提供豐富的教輔資源,以幫助院校老師快速開展教學(xué)。為了便于初學(xué)者理解 AIGC 大模型的具體應(yīng)用,本書還設(shè)計了各種體驗任務(wù),可與讀者共同體驗大語言模型和各種多模態(tài) AIGC 大模型的應(yīng)用效果,使讀者在體驗豐富、新奇的 AI 技術(shù)的同時,加深對基礎(chǔ)理論和 AIGC 大模型工作原理的理解,實現(xiàn)理論性、趣味性與實用性相結(jié)合。
賈小林: 教授,博士生導(dǎo)師,畢業(yè)于西南交通大學(xué),獲工學(xué)博士學(xué)位;現(xiàn)任計算機科學(xué)與技術(shù)學(xué)院副院長,分工負責(zé)本?平逃虒W(xué)與改革、專業(yè)建設(shè)與評估、教學(xué)研究、本科人才培養(yǎng)團隊建設(shè)等工作,分管教學(xué)科研辦公室。四川省普通本科高校教學(xué)指導(dǎo)委員會委員,國際電子電器工程師學(xué)會(IEEE)高級會員,中國計算機學(xué)會(CCF)高級會員,CCF優(yōu)秀傳播大使,四川省海外高層次留學(xué)人才,綿陽市4 3高端成長型產(chǎn)業(yè)領(lǐng)軍人才,綿陽市優(yōu)秀教師,西南科技大學(xué)十佳崗位青年、優(yōu)秀共產(chǎn)黨員、優(yōu)秀教師、教學(xué)名師等,入選西南科技大學(xué)70周年校慶特輯《龍山薪火-西南科大人之教師篇》;主要從事射頻識別(RFID)技術(shù)、物聯(lián)網(wǎng)(IOT)技術(shù)、計算機應(yīng)用技術(shù)等領(lǐng)域的研究和教學(xué)工作;主持完成國家自然科學(xué)基金面上項目、四川省科技支撐計劃重大項目、四川省應(yīng)用基礎(chǔ)研究項目、四川省高校成果轉(zhuǎn)化重大培育項目、制造過程測試技術(shù)重點實驗室重點項目等重要研究課題;研究成果榮獲四川省科學(xué)技術(shù)進步二等獎1項,四川省高等教育教學(xué)成果三等獎2項,西南科技大學(xué)優(yōu)秀教學(xué)成果一等獎1項。 李曉黎: 軟件開發(fā)工程師,畢業(yè)于吉林大學(xué)計算機系;自2006年以來,帶領(lǐng)團隊一直從事網(wǎng)絡(luò)管理軟件、企業(yè)ERP系統(tǒng)和電商平臺等的開發(fā)與建設(shè)工作,具有中國投資銀行、國家開發(fā)銀行、中信銀行等多家銀行從業(yè)經(jīng)歷,參與銀行信息化建設(shè)、網(wǎng)銀平臺開發(fā)、智能合約設(shè)計與開發(fā)工作多年,在人工智能、AIGC、Java程序設(shè)計、系統(tǒng)軟件開發(fā)、團隊組織管理和系統(tǒng)架構(gòu)設(shè)計等領(lǐng)域積累了豐富的實戰(zhàn)經(jīng)驗,主編圖書10余本,并被上百所高校選作教材。
【章名目錄】 【第 1篇 導(dǎo)論篇】 第 1章 AI技術(shù)概述 【第 2篇 基礎(chǔ)篇】 第 2章 生成模型 第3章 自然語言處理經(jīng)典模型 第4章 計算機視覺經(jīng)典模型 【第3篇 應(yīng)用篇】 第5章 大語言模型 第6章 代碼生成大語言模型 第7章 圖像生成大模型 第8章 語音生成大模型 第9章 視頻生成大模型 【第4篇 展望篇】 第 10章 AIGC時代的機遇、挑戰(zhàn)及發(fā)展趨勢 附錄 大語言模型智能體精選與推薦 【詳細目錄】 【第 1篇 導(dǎo)論篇】 第 1章 AI技術(shù)概述 1.1 AI技術(shù)基礎(chǔ) 2 1.1.1 AI技術(shù)的發(fā)展歷程 2 1.1.2 AI領(lǐng)域的常用概念 4 1.2 機器學(xué)習(xí)基礎(chǔ) 7 1.2.1 機器學(xué)習(xí)的三要素 7 1.2.2 機器學(xué)習(xí)的分類 8 1.2.3 機器學(xué)習(xí)的工作流程 10 1.2.4 機器學(xué)習(xí)案例:使用線性回歸算法預(yù)測房價 11 1.3 深度學(xué)習(xí)基礎(chǔ) 16 1.3.1 深度學(xué)習(xí)的概念 16 1.3.2 前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法 17 1.3.3 深度學(xué)習(xí)案例:基于LeNet-5模型識別手寫數(shù)字 17 1.3.4 深度學(xué)習(xí)的常用基礎(chǔ)函數(shù)和算法 18 1.3.5 深度學(xué)習(xí)的基本工作流程 23 1.4 AIGC的發(fā)展歷史、應(yīng)用方向及基礎(chǔ)技術(shù) 25 1.4.1 AIGC的發(fā)展歷史 25 1.4.2 AIGC的應(yīng)用方向 26 1.4.3 AIGC的基礎(chǔ)技術(shù) 28 本章小結(jié) 32 習(xí)題 32 課程實踐 33 【第 2篇 基礎(chǔ)篇】 第 2章 生成模型 2.1 生成模型技術(shù)基礎(chǔ) 35 2.1.1 生成模型和判別模型 35 2.1.2 生成模型的分類 36 2.1.3 生成模型中用到的統(tǒng)計學(xué)概念 37 2.2 深度生成模型 42 2.2.1 GAN模型 42 2.2.2 自回歸模型 44 2.2.3 擴散模型 44 2.2.4 VAEs模型 46 2.2.5 標準化流模型 49 本章小結(jié) 50 習(xí)題 50 課程實踐 50 第3章 自然語言處理經(jīng)典模型 3.1 NLP技術(shù)的發(fā)展歷程和應(yīng)用現(xiàn)狀 52 3.1.1 NLP技術(shù)的發(fā)展歷程 52 3.1.2 NLP技術(shù)的應(yīng)用現(xiàn)狀 54 3.2 NLP技術(shù)基礎(chǔ) 55 3.2.1 文本的數(shù)值化表示 56 3.2.2 NLP模型 59 3.2.3 注意力機制 60 3.2.4 語料庫 66 3.3 經(jīng)典NLP深度學(xué)習(xí)模型 67 3.3.1 RNN模型 67 3.3.2 編碼器-解碼器架構(gòu) 69 3.3.3 LSTM模型 69 3.3.4 Transformer架構(gòu) 70 3.3.5 BERT模型 78 本章小結(jié) 80 習(xí)題 80 課程實踐 81 第4章 計算機視覺經(jīng)典模型 4.1 CV技術(shù)的發(fā)展歷程和應(yīng)用現(xiàn)狀 82 4.1.1 CV技術(shù)的發(fā)展歷程 82 4.1.2 CV技術(shù)的應(yīng)用現(xiàn)狀 84 4.2 CV技術(shù)基礎(chǔ) 85 4.2.1 圖像的表現(xiàn)形式 86 4.2.2 數(shù)字圖像處理 87 4.3 經(jīng)典CV模型 89 4.3.1 CNN模型 89 4.3.2 ResNet模型 96 4.3.3 ViT模型 97 本章小結(jié) 100 習(xí)題 100 課程實踐 100 【第3篇 應(yīng)用篇】 第5章 大語言模型 5.1 大語言模型概述 102 5.1.1 大語言模型的定義 102 5.1.2 大語言模型的工作原理 104 5.1.3 大語言模型落地應(yīng)用的方法 105 5.2 主流大語言模型簡析 105 5.2.1 國外主流大語言模型 105 5.2.2 國內(nèi)主流大語言模型 107 5.3 GPT系列模型的工作原理 109 5.3.1 GPT-1 109 5.3.2 GPT-2 113 5.3.3 GPT-3 120 5.3.4 GPT-3.5和GPT-4 122 5.4 體驗主流大語言模型 123 5.4.1 設(shè)計體驗任務(wù) 123 5.4.2 體驗大語言模型的方法 125 5.4.3 體驗純文本任務(wù) 127 5.4.4 體驗多模態(tài)任務(wù) 131 本章小結(jié) 137 習(xí)題 138 課程實踐 138 第6章 代碼生成大語言模型 6.1 代碼生成大語言模型概述 139 6.1.1 什么是代碼生成大語言模型 139 6.1.2 代碼生成大語言模型的基本工作原理 141 6.2 主流代碼生成大語言模型選解 142 6.2.1 GitHub Copilot 142 6.2.2 CodeWhisperer 143 6.2.3 CodeGeeX 143 6.2.4 CodeBERT 146 6.3 體驗CodeWhisperer 148 6.3.1 在IDEA中安裝AWS Toolkit插件 148 6.3.2 在IDEA中使用CodeWhisperer 149 6.3.3 Amazon Q Chat 150 6.3.4 在開發(fā)過程中利用CodeWhisperer的編碼建議 152 6.4 體驗CodeGeeX 154 6.4.1 在VS Code中安裝CodeGeeX插件 154 6.4.2 在VS Code中使用CodeGeeX 155 本章小結(jié) 160 習(xí)題 160 課程實踐 160 第7章 圖像生成大模型 7.1 圖像生成大模型的工作原理 161 7.1.1 圖像嵌入 161 7.1.2 圖像生成大模型的基本工作流程 162 7.1.3 條件生成模型 163 7.1.4 建立文圖聯(lián)系的CLIP模型 165 7.2 主流圖像生成大模型選解 168 7.2.1 國外的圖像生成大模型 168 7.2.2 國內(nèi)的圖像生成大模型 175 7.3 體驗圖像生成大模型 176 7.3.1 體驗圖像生成大模型的方法 176 7.3.2 設(shè)計體驗任務(wù) 180 7.3.3 體驗生成人物攝影圖像 183 7.3.4 體驗生成風(fēng)景植物圖像 186 7.3.5 體驗生成建筑設(shè)計圖像 188 7.3.6 體驗生成中國風(fēng)格圖像 190 本章小結(jié) 192 習(xí)題 192 課程實踐 192 第8章 語音生成大模型 8.1 語音生成大模型的工作原理 193 8.1.1 TTS技術(shù)的發(fā)展歷史 193 8.1.2 梅爾頻譜 194 8.1.3 TTS的工作原理 194 8.2 語音生成大模型選解 195 8.2.1 XTTS模型 195 8.2.2 Mega-TTS模型 196 8.3 體驗語音生成大模型 198 本章小結(jié) 199 習(xí)題 199 課程實踐 200 第9章 視頻生成大模型 9.1 視頻生成大模型的基礎(chǔ)技術(shù) 201 9.1.1 視頻表示 201 9.1.2 條件概率視頻生成大模型的概念 201 9.2 主流視頻生成大模型選解 202 9.2.1 Sora模型的工作原理 202 9.2.2 MagicVideo-V2模型的工作原理 205 9.3 體驗主流視頻生成大模型 206 9.3.1 Gen-3模型生成的視頻 206 9.3.2 Pika模型生成的視頻 207 9.3.3 MagicVideo-V2模型生成的視頻 208 本章小結(jié) 209 習(xí)題 209 課程實踐 209 【第4篇 展望篇】 第 10章 AIGC時代的機遇、挑戰(zhàn)及發(fā)展趨勢 10.1 AIGC的社會影響 211 10.1.1 AIGC對社會經(jīng)濟的影響 211 10.1.2 AIGC對普通人生活的影響 212 10.2 AIGC時代的機遇和挑戰(zhàn) 213 10.2.1 AIGC時代的機遇 213 10.2.2 AIGC時代的挑戰(zhàn) 216 10.3 AIGC技術(shù)所面臨的挑戰(zhàn)及發(fā)展趨勢 221 10.3.1 AIGC技術(shù)的倫理問題和所面臨的挑戰(zhàn) 221 10.3.2 AIGC技術(shù)的發(fā)展趨勢 224 本章小結(jié) 227 習(xí)題 228 課程實踐 228 附錄 大語言模型智能體精選與推薦 F.1 文心智能體平臺 229 F.2 通義智能體 229 F.3 ChatAI的定制模型 230 F.4 DeepSeek智能體 231