| |
定 價(jià):129.8 元
叢書名:AIGC技術(shù)探索叢書
- 作者:袁朝輝、王雙、劉思岑、許義鑫
- 出版時(shí)間:2025/7/1
- ISBN:9787302697251
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TN948.4-39
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
讀者對象:本書適合自媒體創(chuàng)作、視頻創(chuàng)作、影視創(chuàng)作和動(dòng)漫創(chuàng)作等相關(guān)領(lǐng)域的從業(yè)者與愛好者閱讀, 也適合高等院校和培訓(xùn)機(jī)構(gòu)作為影視、動(dòng)畫和動(dòng)漫等專業(yè)的教材或培訓(xùn)用書

《AI視頻生成:原理、工具與應(yīng)用實(shí)踐》結(jié)合36個(gè)典型案例,從AI視頻生成的發(fā)展歷史、現(xiàn)狀、基本原理、平臺(tái)、工具、模型、基礎(chǔ)操作、場景應(yīng)用和綜合實(shí)戰(zhàn)等幾個(gè)方面詳細(xì)介紹其核心知識、操作技巧與應(yīng)用實(shí)戰(zhàn)等。本書基于當(dāng)前的主流開源模型、工具與平臺(tái),重點(diǎn)對AI視頻的生成、換臉、轉(zhuǎn)繪、重繪、編輯和控制等操作技巧與場景應(yīng)用進(jìn)行詳細(xì)介紹,并詳細(xì)展示AI動(dòng)畫和AI文旅視頻兩個(gè)綜合項(xiàng)目案例的實(shí)現(xiàn)過程。AI視頻生成:原理、工具與應(yīng)用實(shí)踐提供配套教學(xué)視頻、案例素材、提示詞文件、工作流文件、教學(xué)PPT和軟件安裝文件等超值配套資源,幫助讀者高效、直觀地學(xué)習(xí)。 AI視頻生成:原理、工具與應(yīng)用實(shí)踐共19章,分為6篇。第1篇 AI視頻概述,介紹AI視頻的發(fā)展歷史、對社會(huì)的沖擊和未來展望等;第2篇AI視頻原理,介紹AI視頻生成模型、擴(kuò)散模型和混合模型等相關(guān)知識;第3篇AI視頻平臺(tái)、工具與模型,介紹在線AI視頻平臺(tái)與常用工具,以及開源AI視頻模型和多模態(tài)大模型等相關(guān)知識;第4篇AI視頻平臺(tái)、工具與模型的使用,介紹在線視頻平臺(tái)、開源視頻模型和ComfyUI工作流的具體操作等;第5篇AI視頻場景應(yīng)用實(shí)戰(zhàn),通過一系列案例展示讓圖片動(dòng)起來、AI視頻換臉、AI視頻轉(zhuǎn)繪、AI視頻重繪和AI視頻編輯等常用技巧;第6篇AI視頻項(xiàng)目案例實(shí)戰(zhàn),綜合使用前面章節(jié)介紹的平臺(tái)、工具、模型與技巧等,完成AI動(dòng)畫制作復(fù)現(xiàn)《門后的世界》、AI文旅視頻制作武漢宣傳片兩個(gè)綜合項(xiàng)目案例。 AI視頻生成:原理、工具與應(yīng)用實(shí)踐內(nèi)容豐富,講解深入淺出,案例典型,適合自媒體創(chuàng)作、視頻創(chuàng)作、影視創(chuàng)作和動(dòng)漫創(chuàng)作等相關(guān)領(lǐng)域的從業(yè)者與愛好者閱讀,也適合作為高等院校和培訓(xùn)機(jī)構(gòu)影視、動(dòng)畫和動(dòng)漫等專業(yè)的教材或培訓(xùn)用書。
AIGC(人工智能生成內(nèi)容)的發(fā)展如火如荼,正在快速席卷各行各業(yè)。各種新模型層出不窮,基于新模型的新應(yīng)用場景不斷涌現(xiàn)。AI 視頻生成作為AIGC 的重要應(yīng)用場景正在深刻地影響著人們的日常生活。從自媒體創(chuàng)作到視頻制作,從影視創(chuàng)作到動(dòng)畫與動(dòng)漫創(chuàng)作等,AI 視頻生成正在不斷地重塑相關(guān)行業(yè)?梢哉f,AI 視頻生成因其高效率、低成本、低門檻等特點(diǎn)已經(jīng)成為自媒體從業(yè)者、視頻創(chuàng)作者、影視從業(yè)者、動(dòng)畫與動(dòng)漫創(chuàng)作者等必須掌握的基本技能,也正在成為大中專院校影視動(dòng)畫與數(shù)字媒體等相關(guān)專業(yè)的必修課。 為了幫助AIGC 從業(yè)者全面、系統(tǒng)、深入地學(xué)習(xí)繪畫、語音和視頻等生成與處理技術(shù),可學(xué)AI團(tuán)隊(duì)于2023 年便開始組織人員籌劃相關(guān)圖書的寫作和出版事宜,并于2024 年先后出版了《AI 繪畫大師之道:輕松入門》和《AI 繪畫全場景案例應(yīng)用與實(shí)踐》。這兩部圖書上市后均獲得了廣大讀者的好評。為了幫助讀者更加系統(tǒng)地學(xué)習(xí)AIGC 相關(guān)技術(shù),可學(xué)AI團(tuán)隊(duì)經(jīng)過調(diào)研,計(jì)劃進(jìn)一步推出《AIGC 繪畫與音視頻生成:ComfyUI 工作流應(yīng)用與實(shí)踐》《AI 語音與音樂生成:原理、工具與應(yīng)用實(shí)踐》《AI 視頻生成:原理、工具與應(yīng)用實(shí)踐》《AI 繪畫模型微調(diào):原理、工具與應(yīng)用實(shí)踐》等圖書,這些圖書組成AIGC 技術(shù)探索叢書供讀者閱讀。 本書為AIGC 技術(shù)探索叢書中的《AI 視頻生成:原理、工具與應(yīng)用實(shí)踐》分冊。本書結(jié)合36 個(gè)應(yīng)用案例詳細(xì)介紹AI 視頻生成的基本原理、主流平臺(tái)與工具、開源模型、基礎(chǔ)操作、場景應(yīng)用與綜合項(xiàng)目實(shí)戰(zhàn)等。本書采用全彩印刷,效果精美。書中對一些重點(diǎn)中英文提示詞用藍(lán)色突出顯示,對一些重點(diǎn)命令用紫色顯示,以提高閱讀體驗(yàn)。通過閱讀本書,讀者可以全面、系統(tǒng)、深入地掌握AI 視頻生成涉及的核心技術(shù)、工具、模型、技巧與場景應(yīng)用等。 本書特色 ? 輕松上手:通過圖書 教學(xué)視頻 拓展學(xué)習(xí) 答疑解惑的立體教學(xué)方式,帶領(lǐng)讀者輕松上手。 ? 內(nèi)容全面:涵蓋AI 視頻生成的發(fā)展歷史、基本原理、工具與平臺(tái)、開源模型、基礎(chǔ)操作、場景應(yīng)用和項(xiàng)目實(shí)戰(zhàn)等,涉及25 個(gè)AI 視頻類在線平臺(tái)與工具、27 款開源AI 視頻模型、20 種常用ComfyUI 工作流,帶領(lǐng)讀者一站式掌握AI 視頻生成的核心知識與應(yīng)用。 ? 技術(shù)新穎:緊跟技術(shù)發(fā)展趨勢,基于當(dāng)前的主流工具、平臺(tái)和模型進(jìn)行講解,以確FOREWORD保內(nèi)容的時(shí)效性與準(zhǔn)確性。 ? 圖文并茂:結(jié)合300 多幅圖進(jìn)行講解,直觀地展現(xiàn)AI 視頻生成的原理與操作過程。 ? 實(shí)踐性強(qiáng):詳解36 個(gè)類型豐富、由易到難的經(jīng)典應(yīng)用案例,涵蓋AI 視頻生成的常見場景應(yīng)用,幫助讀者快速提高AI 視頻生成的實(shí)際動(dòng)手能力。 ? 舉一反三:針對同一功能或場景應(yīng)用,提供多種實(shí)現(xiàn)思路,幫助讀者融會(huì)貫通,從而達(dá)到舉一反三的效果。 ? 資源超值:提供大量的超值配套學(xué)習(xí)資源(見后文),幫助讀者高效、直觀地學(xué)習(xí)。 ? 服務(wù)完善:提供QQ 書友群、電子郵箱、B 站和公眾號等多種服務(wù)渠道,為讀者的學(xué)習(xí)保駕護(hù)航。 本書內(nèi)容 第1 篇 AI 視頻概述 第1 章介紹AI 視頻技術(shù)的發(fā)展歷史與現(xiàn)狀,讓讀者了解AI 視頻的發(fā)展脈絡(luò)。 第2 章介紹AI 視頻快速發(fā)展帶來的沖擊,包括AI 視頻電信詐騙、好萊塢演員罷工和AI 視頻作品版權(quán)等相關(guān)內(nèi)容,讓讀者了解相應(yīng)的對策。 第3 章介紹人們?nèi)绾芜m應(yīng)AIGC 和AI 視頻發(fā)展的未來。 第2 篇 AI 視頻原理 第4 章介紹常見的AI 視頻生成模型,包括變分自編碼器、生成對抗網(wǎng)絡(luò)、擴(kuò)散模型和自回歸模型。 第5 章介紹視頻擴(kuò)散模型的相關(guān)知識,包括其應(yīng)用場景、基本框架、生成高清視頻的技巧,以及如何保持視頻時(shí)空一致性和基于多樣性數(shù)據(jù)訓(xùn)練模型。 第6 章介紹流行的混合模型DiT 的相關(guān)知識以及文生視頻模型Sora 和國產(chǎn)視頻生成模型可靈AI 的相關(guān)知識。 第3 篇 AI 視頻平臺(tái)、工具與模型 第7 章介紹國內(nèi)外25 款在線AI 視頻平臺(tái)與工具,包括騰訊智影、秒創(chuàng)、可靈AI、剪映、即夢AI、PixVerse、清影、Vidu、Runway、Pika、HeyGen、Akool、度加創(chuàng)作工具、快手云剪、剪輯魔法師、萬彩AI、33 搜幀、Q.AI、Fliki 等。 第8 章介紹開源AI 視頻模型,包括4 款通用類模型、4 款圖片說話類模型、3 款動(dòng)作引導(dǎo)類模型、3 款SD-WebUI 插件類模型和3 款類Sora 知名開源模型。 第9 章介紹幾款多模態(tài)大模型,包括文心一言、通義千問和訊飛星火等。 第4 篇 AI 視頻平臺(tái)、工具與模型的使用 第10 章介紹在線視頻平臺(tái)Runway、Pika 和可靈AI 的使用方法。 第11 章介紹SVD、CogVideo、Animate Anyone 和Champ 等開源AI 視頻模型的部署和使用方法。 第12 章介紹20 個(gè)ComfyUI 視頻工作流的用法,包括4 個(gè)文生視頻工作流、5 個(gè)圖生視頻工作流、2 個(gè)視頻風(fēng)格轉(zhuǎn)繪工作流、5 個(gè)圖片跳舞工作流及4 個(gè)其他創(chuàng)意應(yīng)用工作流。 第5 篇 AI 視頻場景應(yīng)用實(shí)戰(zhàn) 第13 ~ 17 章分別介紹讓圖片動(dòng)起來、視頻換臉、視頻轉(zhuǎn)繪、視頻重繪和視頻編輯5個(gè)AI 視頻的常見場景應(yīng)用。每個(gè)場景應(yīng)用都通過多個(gè)具體案例展示其實(shí)現(xiàn)過程與效果,并進(jìn)行總結(jié)和擴(kuò)展。 第6 篇 AI 視頻項(xiàng)目案例實(shí)戰(zhàn) 第18 章從編寫腳本、美術(shù)設(shè)計(jì)、分鏡設(shè)計(jì)、AI 繪畫出圖、視頻制作、添加聲音和后期制作7 個(gè)方面展示AI 動(dòng)畫制作復(fù)現(xiàn)《門后的世界》項(xiàng)目案例的實(shí)現(xiàn)。 第19 章從編寫腳本、美術(shù)設(shè)計(jì)、分鏡設(shè)計(jì)、AI 繪畫出圖、視頻制作、添加聲音和后期制作7 個(gè)方面展示AI 文旅視頻制作武漢宣傳片項(xiàng)目案例的實(shí)現(xiàn)。 讀者對象 本書讀者對象如下: ? 自媒體從業(yè)人員; ? 視頻創(chuàng)作人員; ? 影視創(chuàng)作人員; ? 數(shù)字人、直播從業(yè)者; ? 其他AI 視頻技術(shù)愛好者; ? 高等院校影視動(dòng)漫、數(shù)字媒體等專業(yè)的學(xué)生和教師; ? AI 視頻培訓(xùn)機(jī)構(gòu)的學(xué)員。 配套資源獲取方式 本書贈(zèng)送以下超值配套資源: ? 教學(xué)視頻; ? 案例素材; ? 提示詞文件; ? 視頻類工作流文件; ? 教學(xué)PPT; ? 軟件安裝文件。 上述配套資源有兩種獲取方式:一是關(guān)注微信公眾號方大卓越,回復(fù)數(shù)字51自動(dòng)獲取下載鏈接;二是在清華大學(xué)出版社網(wǎng)站(www.tup.com.cn)上搜索到本書,然后在本書頁面上找到資源下載欄目,單擊網(wǎng)絡(luò)資源按鈕進(jìn)行下載。另外,讀者也可以在B 站上查找UP 主可學(xué)AI,在線觀看本書配套教學(xué)視頻。 意見反饋 AI 視頻正在持續(xù)高速發(fā)展中,其功能迭代日新月異。雖然本書在寫作中已盡力保持內(nèi)容的時(shí)效性與新穎性,但是鑒于技術(shù)的快速變化和作者認(rèn)知的局限性,書中難免存在一些未盡完善之處或細(xì)微疏漏,敬請各位讀者批評與指正,筆者會(huì)及時(shí)進(jìn)行調(diào)整和修改,您的寶貴意見是我們不斷進(jìn)步的動(dòng)力。讀者可以通過本書QQ 書友群或電子郵箱聯(lián)系我們,也可關(guān)注微信公眾號可學(xué)AI,了解AIGC 的相關(guān)進(jìn)展信息。讀者也可關(guān)注微信公眾號方大卓越,回復(fù)數(shù)字51自動(dòng)獲取QQ 書友群號等信息。 致謝 感謝夏小康、尹子成、白玉棋、張炯濤、朱美霞、秦天琪、王佑琳、肖越漢、張洋和王浩銘等在本書寫作期間給予筆者團(tuán)隊(duì)的支持與幫助! 感謝歐振旭在本書出版過程中給予筆者的大力支持與幫助! 感謝清華大學(xué)出版社參與本書出版的所有人員!是你們一絲不茍的精神,才使本書得 以高質(zhì)量出版。
袁朝輝
|