數(shù)字音頻處理是數(shù)字媒體技術專業(yè)的專業(yè)核心課程,音頻的編輯和處理是數(shù)字媒體中不可缺少的一環(huán),對于學習者后期的游戲制作、媒體編輯等有非常重要的作用。數(shù)字媒體技術專業(yè)蓬勃發(fā)展,但是相關的教材卻很少,不適合數(shù)字媒體技術專業(yè)理論與實踐結合的方向和培養(yǎng)原則,因此編寫了這一本教材。數(shù)字音頻處理主要講授的內(nèi)容是聲音的特性、音頻處理的過
這是第一本系統(tǒng)性地介紹聲紋識別、聲紋分割聚類及聲紋在語音識別、語音合成、人聲分離等領域中應用的技術書。本書內(nèi)容全面且緊隨時代前沿,不僅涵蓋了早至20世紀60年代的經(jīng)典方法,而且以大量篇幅著重介紹了深度學習時代的最新技術。本書注重理論與實踐的結合,除了配備大量實踐案例與習題,還有專門章節(jié)介紹聲紋技術在實際工程部署方面的諸
聲音可以從兩個角度來定義。首先是從物理學的角度來定義,聲音是空氣質點振動狀態(tài)由近及遠的傳播,聲音即聲波;其二是從心理學的角度來定義,聲音是聲波在聽覺上產(chǎn)生的主觀感覺。如果是從物理學的角度來了解聲音的基本性質,那么聲音就是聲波,可以用聲壓這一物理量來描述;如果要對揚聲器重放的聲音進行主觀音質評價,則聲音與人耳的聽覺特性密
本書分為三篇:基礎理論與實踐篇、操作應用與技能篇和數(shù)字音響技術篇,書中主要介紹音響技術的基本原理、各種音響設備的基本功能及工作原理與基本操作方法,具體介紹了音響系統(tǒng)的連接調(diào)整方法與使用技巧,重點介紹了調(diào)音臺與周邊設備以及功放音箱的使用調(diào)整方法和故障的檢測判斷方法。同時,本書對于數(shù)字聲頻技術、數(shù)字調(diào)音臺、數(shù)字音頻信號的網(wǎng)
我們的日常離不開說話,一個人的聲音不僅僅傳遞表達的情感,聲音也可以創(chuàng)造價值。本書分享了作者從會計工作轉行聲音領域創(chuàng)業(yè)的經(jīng)歷,從知識付費入手拆解聲音付費市場的剛需,解讀不同聲音形象的賣點與練聲技巧,從而可以自己制作聲音付費產(chǎn)品,幫助讀者找到適合自己的聲音變現(xiàn)之路。本書以30個要點的形式解讀了打造聲音付費產(chǎn)品的場景、過程、
Kaldi是目前語音識別領域,廣受歡迎并流行的開源工具包。Kaldi設計之初對通用性,可拓展性等一系列源代碼層次的考量,大大降低了Kaldi作為語音識別工具包的門檻,同時擁有非常完整的語音識別系統(tǒng)訓練腳本。本書通過對Kaldi已有訓練腳本的梳理和引導,幫助讀者快速搭建可用的語音識別系統(tǒng)。
本書以國際大型體育賽事為背景,系統(tǒng)介紹了賽事轉播組織架構和具體技術實施方案。在第一章和第二章中主要介紹了國際信號的定義、團隊工作流程和信號采集方法;第三章和第四章介紹了國際信號中重要的評論聲制作方式和轉播團隊使用的內(nèi)部通訊系統(tǒng);第五章、第六章和第七章詳細介紹了各種體育比賽轉播的音頻制作方法。本書具有理論指導實踐的特點,
聽覺信息處理技術的創(chuàng)新能夠推動實現(xiàn)高度智能化機器感知系統(tǒng)的發(fā)展,本分冊主要介紹了國內(nèi)外聽覺信息處理方面的研究現(xiàn)狀和階段性成果,通過對人類言語產(chǎn)生與聽覺機理,聽覺機理的計算理論與方法,語音信號處理,語音識別聲學建模,特殊場景語音識別,聲紋與語種識別,韻律、情緒及音樂分析,統(tǒng)計語音合成,口語對話系統(tǒng)等技術研究成果的闡述與分
《語音信號識別技術與實踐》內(nèi)容分為8章。第1章為語音識別技術概述,介紹了語音識別技術的原理和發(fā)展與應用。第2章為語音信號處理基本技術,包括數(shù)字化預處理、短時時域處理和頻域處理的內(nèi)容。第3章是語音信號的端點檢測和分割,介紹了端點檢測的原理和常規(guī)檢測方法,提出了基于復雜背景條件下的端點檢測算法,包括算法流程和實驗方法。第4
語音情感識別(SpeechEmotionRecognition,SER)是情感計算、模式識別、信號處理和人機交互領域的熱門研究話題,SER的研究涉及特征提取、特征優(yōu)選、分類器改進、特征融合等多種技術。語音情感識別是在同一數(shù)據(jù)庫中進行的識別研究,主要應用于自然的人機交互領域,目前大部分的人機交互方式都依賴于觸覺,如觸屏、