本書系統(tǒng)地介紹了語音識別在大模型時代的新技術與新應用。全書共16章,原理部分涵蓋聲學特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經(jīng)網(wǎng)絡(DNN)、語言模型和加權有限狀態(tài)轉(zhuǎn)換器(WFST)、語音大模型,重點描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識別框架;應用部分包含Kaldi、W
"近年來人工智能技術突飛猛進,以語音識別為代表的音頻處理技術取得了大量突破,但該領域內(nèi)理論結(jié)合實戰(zhàn)的入門書籍卻較為缺乏,本書旨在為有志學習音頻信號處理的讀者提供一本實用的入門書籍。本書共13章,第1章和第2章是基礎部分,包括聲學基礎知識及Python基礎等內(nèi)容;第3到4章介紹了音頻信號的獲取及分析方法;第5~8章介紹了
本書的撰寫主要分為四個章節(jié):第一章數(shù)字音頻藝術的基本藝術體系;第二章數(shù)字音頻藝術教育;第三章廣播劇與影視動漫聲音研究;第四章數(shù)字音頻的文化產(chǎn)業(yè)分析。主要內(nèi)容:1、理清數(shù)字音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的脈絡,建立數(shù)字音頻創(chuàng)意發(fā)展編年史。2、形成數(shù)字音頻創(chuàng)意教育引導機制的研究報告,提出音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的咨詢報告。3、綜合性分析音頻創(chuàng)意
全書共分11章,主要介紹了聲學基礎知識、音頻信號的數(shù)字化、數(shù)字音頻壓縮編碼的基本原理及相關標準、信道編碼與調(diào)制技術、光盤存儲技術、電子樂器數(shù)字接口(MIDI)、數(shù)字音頻文件格式、音頻處理與控制設備、數(shù)字音頻工作站、數(shù)字聲音廣播、音頻測量與分析等內(nèi)容。每章都附有小結(jié)與習題,以指導讀者加深對本書主要內(nèi)容的理解。本書可作為高
本教材結(jié)合語音信息處理的理論與實踐部分,主要內(nèi)容包括語音產(chǎn)生與感知機理、語音信號處理、語音識別、統(tǒng)計語音合成、語音增強、聲紋識別、語音對話以及語音信息處理的前瞻技術等。全書共分8章。第1章介紹語音產(chǎn)生與感知機理,以及與此相關的語言基礎知識,是全書的理論基礎。第2章介紹語音信號處理的基礎,包括語音產(chǎn)生與感知的數(shù)學模型、語
本書是一本深入探討B(tài)BC監(jiān)聽音箱的專著。BBC在聲學領域貢獻卓著,其研發(fā)的監(jiān)聽音箱具有悠久的歷史和廣泛的影響力,對當今的聲音美學理念和音響產(chǎn)品產(chǎn)生了深遠影響。作者楊立新先生憑借多年對BBC設計理念的系統(tǒng)性研習、對BBC聲學文獻和監(jiān)聽音箱的深入研究,以及對原始設備的精心修復經(jīng)驗,為讀者提供了全面而系統(tǒng)的BBC監(jiān)聽音箱知識
本書從人類聽覺、視覺的處理機制出發(fā),系統(tǒng)地介紹了聽覺和視覺感知模型、音視頻(圖像)壓縮編碼技術、音視頻(圖像)處理技術、基于內(nèi)容的音視頻(圖像)檢索技術、數(shù)字音視頻技術的交叉應用等內(nèi)容。同時,本書還給出了相關知識的應用實例,這寫實例都具有較高的參考和實用價值。本書涵蓋的學科領域十分廣泛,包括人工智能、信號處理、圖像處理
本書采用項目式的編寫方法,系統(tǒng)地介紹了語音識別的基本概念、基本原理和常用技術,并使用Python語言對每項技術進行了編程實現(xiàn)。全書共有8個項目,內(nèi)容涵蓋搭建語音識別開發(fā)環(huán)境、語音特征提取、構(gòu)建傳統(tǒng)聲學模型、使用深度神經(jīng)網(wǎng)絡構(gòu)建聲學模型、訓練語言模型、構(gòu)建語音識別解碼器、構(gòu)建端到端的語音識別模型和中文普通話語音識別。
本書介紹了語音信號處理的基礎、原理、方法和應用,以及該學科領域近年來取得的一些新的研究成果和技術。全書共分13章,內(nèi)容包括:緒論、語音信號處理的基礎知識、語音信號處理的常用算法、語音信號分析、語音信號特征提取技術、語音增強、語音識別、說話人識別、語音編碼、語音合成與轉(zhuǎn)換、語音信號情感處理、聲源定位、多模態(tài)語音信號處理。
本教材緊密結(jié)合《數(shù)字音效》課程設計,以聲音概念為理論基礎、人種志方法論為研究方法,結(jié)合Audition聲音編輯軟件,以保護聲音文化遺產(chǎn)為目標,結(jié)合聲音研究實踐案例,最終實現(xiàn)把數(shù)字音效教材與交互媒體專業(yè)課程結(jié)合。該課程將理論課與實踐作業(yè)相結(jié)合,以更直接的方式接觸和理解聲音、空間和材質(zhì),使學生能夠運用這些知識進行個人創(chuàng)作。