本書面向人工智能相關(guān)專業(yè)(智能科學(xué)與技術(shù)、控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù))的本科生,以從人工智能角度理解模式識(shí)別和用模式識(shí)別原理解決工程問題為目標(biāo),將內(nèi)容分為基礎(chǔ)知識(shí)、模式分類和模式聚類三大部分,突出簡(jiǎn)明和實(shí)用的特點(diǎn)。書中穿插大量案例,可以幫助學(xué)生在掌握基本概念的基礎(chǔ)上理解基本原理,熟悉典型方法,做到知其然,知其所以然。本書注重引導(dǎo)學(xué)生充分利用樣本數(shù)據(jù)庫和算法庫等各種網(wǎng)絡(luò)資源,通過課程學(xué)習(xí)、案例計(jì)算和算法實(shí)現(xiàn),分析來自生產(chǎn)和生活實(shí)際中的模式識(shí)別問題,采用合適的模式識(shí)別算法和技術(shù),通過Python和MATLAB 編程構(gòu)建自己的模式識(shí)別系統(tǒng)來解決這些問題,并能夠評(píng)估模式識(shí)別系統(tǒng)的性能和不足,理解不同模式識(shí)別算法的針對(duì)性和局限性,從而提高學(xué)生理論和實(shí)踐相結(jié)合、綜合運(yùn)用所學(xué)知識(shí)解決具體模式識(shí)別問題的能力,培養(yǎng)學(xué)生深入學(xué)習(xí)更新、更先進(jìn)的模式識(shí)別知識(shí)的興趣。
本書可作為普通高等院校自動(dòng)化、人工智能、計(jì)算機(jī)相關(guān)專業(yè)的教材,也可作為從事人工智能和自動(dòng)化系統(tǒng)開發(fā)應(yīng)用人員的參考書。
本書遵循教指委相關(guān)指導(dǎo)文件和高等院校學(xué)生學(xué)習(xí)規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實(shí)踐相結(jié)合。
前言
模式(Pattern)泛指蘊(yùn)含在數(shù)據(jù)記錄中能夠體現(xiàn)事物或?qū)ο竽撤N內(nèi)在屬性的結(jié)構(gòu)、特征、規(guī)律、趨勢(shì)或聯(lián)系,通常表現(xiàn)為某種重復(fù)出現(xiàn)的特定結(jié)構(gòu)或形式。它可以是一系列事件或行為經(jīng)常相伴發(fā)生或發(fā)展的方式,或者是一系列線條、圖案、形狀、顏色組織在一起反復(fù)出現(xiàn)的樣式。模式識(shí)別(Pattern Recognition)就是通過對(duì)表征事物、現(xiàn)象的各種信息描述(數(shù)據(jù)、波形、圖像、文字、邏輯關(guān)系和其他任何可測(cè)量特征的集合)進(jìn)行辨認(rèn)、分析和處理,發(fā)現(xiàn)隱含在數(shù)據(jù)中的模式和規(guī)律,用以推斷未知數(shù)據(jù)的特征或類別,有效地完成識(shí)別、分類、解釋、預(yù)測(cè)和決策等任務(wù)。
模式識(shí)別首先是人類思考問題、解決問題、認(rèn)知事物、認(rèn)識(shí)世界的一種方式。俗語說:物以類聚,人以群分。人們根據(jù)事物和對(duì)象特征的異同對(duì)其進(jìn)行區(qū)分或歸類,這將帶來以下兩方面的好處:一是對(duì)認(rèn)識(shí)和經(jīng)驗(yàn)分門別類地進(jìn)行整理,找出隱含在數(shù)據(jù)記錄中的規(guī)律,形成系統(tǒng)性的知識(shí),方便記錄、學(xué)習(xí)和傳播;二是根據(jù)已有的知識(shí)觸類旁通地認(rèn)知新事物,做到人們常說的以此類推和舉一反三。
模式識(shí)別然后才是一種人工智能的領(lǐng)域和方法,它受人類智慧的啟發(fā),模擬人類認(rèn)知思考的模式和方法,以計(jì)算機(jī)為工具,綜合運(yùn)用數(shù)值分析、概率統(tǒng)計(jì)、神經(jīng)網(wǎng)絡(luò),以及其他機(jī)器學(xué)習(xí)和人工智能技術(shù),尋找隱含在樣本數(shù)據(jù)背后的關(guān)聯(lián)性和相似性,自動(dòng)識(shí)別并揭示事物之間的特定聯(lián)系、規(guī)律或趨勢(shì),完成對(duì)對(duì)象的識(shí)別、分類、聚類、預(yù)測(cè)和決策。
模式和模式識(shí)別在概念上的寬泛性,源于模式識(shí)別應(yīng)用范圍的廣泛性。模式識(shí)別無處不在(圖像識(shí)別、語音識(shí)別、文字識(shí)別等),其應(yīng)用已經(jīng)遍及人們生活的方方面面。
模式識(shí)別應(yīng)用于人類身份識(shí)別,包括人臉識(shí)別、指紋識(shí)別、語音識(shí)別、步態(tài)識(shí)別等,已經(jīng)在安防系統(tǒng)、手機(jī)支付、反恐等領(lǐng)域中獲得廣泛應(yīng)用。
模式識(shí)別應(yīng)用于基于內(nèi)容的檢索系統(tǒng),根據(jù)用戶提交到系統(tǒng)中的對(duì)象與互聯(lián)網(wǎng)上各種對(duì)象間的相似性進(jìn)行信息查詢,例如輸入一幅圖像或一段視頻以檢索相似的圖像和視頻,輸入一段旋律以檢索相似的音樂作品等,極大地方便和豐富了人們的休閑娛樂生活。
模式識(shí)別將文字識(shí)別、語音識(shí)別、自然語言處理、語音合成等技術(shù)集成在一起,通過手機(jī)APP翻譯軟件實(shí)現(xiàn)了從圖像到文字的拍照翻譯、從文字到語言的朗讀、不同語言之間的實(shí)時(shí)互譯等功能,有效地促進(jìn)了異國人士之間的交流,以及聾啞人和正常人的交流。
模式識(shí)別應(yīng)用于工業(yè)機(jī)器人視覺系統(tǒng),通過在線分析圖像,既可以將產(chǎn)品自動(dòng)區(qū)分為合格和不合格兩類,并完成合格品的自動(dòng)裝箱和倉儲(chǔ)管理,也可以自動(dòng)識(shí)別和定位不同的工件,并根據(jù)配合關(guān)系自動(dòng)完成產(chǎn)品的在線裝配,從而顯著提高工業(yè)生產(chǎn)效率。
模式識(shí)別應(yīng)用于家庭服務(wù)機(jī)器人,可以通過物體識(shí)別區(qū)分家居環(huán)境中的各種家具、工具、食品,通過人臉識(shí)別、語音識(shí)別、表情識(shí)別、手勢(shì)識(shí)別、情感識(shí)別與人交互,為人類提供陪伴交流和家居服務(wù),通過助老助殘?zhí)嵘夏耆撕蜌埣踩说纳钯|(zhì)量。
模式識(shí)別應(yīng)用于交通領(lǐng)域,汽車自動(dòng)駕駛采用行人檢測(cè)、車道識(shí)別、交通信號(hào)識(shí)別等技術(shù),不僅能夠有效地消除人為駕駛錯(cuò)誤和疲勞駕駛,保障交通安全,而且能夠有效地減少交通擁堵,提高行車效率;交管部門采用車牌識(shí)別和車輛異常行為識(shí)別等技術(shù),實(shí)現(xiàn)了車輛違章抓拍和停車場(chǎng)自動(dòng)收費(fèi);智慧交通系統(tǒng)識(shí)別交通場(chǎng)景中的車輛行駛狀況和擁堵狀況,可以輔助交警進(jìn)行交通調(diào)度,并幫助城市規(guī)劃部門設(shè)計(jì)新的道路改善方案。
模式識(shí)別應(yīng)用于醫(yī)療領(lǐng)域,在醫(yī)學(xué)影像分析方面,基于諸如X光片、CT圖像、超聲波檢測(cè)圖像、心電圖、腦電圖、肌電圖等各種醫(yī)療檢測(cè)數(shù)據(jù),通過計(jì)算機(jī)輔助診斷可以有效地進(jìn)行病理診斷,幫助醫(yī)生提高診斷的正確性和治療效率;基于生物信息學(xué)的基因比對(duì)和基因模式識(shí)別,幫助醫(yī)生發(fā)現(xiàn)特定基因序列與特殊疾病之間的因果關(guān)系,有助于發(fā)現(xiàn)癌癥和其他罕見病的治療方案。
模式識(shí)別應(yīng)用于金融領(lǐng)域,通過金融數(shù)據(jù)分析和風(fēng)險(xiǎn)識(shí)別,可以有效地幫助人們進(jìn)行股市預(yù)測(cè)、信用評(píng)分、欺詐檢測(cè)等,既可以識(shí)別異常交易和欺詐行為,發(fā)現(xiàn)潛在的風(fēng)險(xiǎn)因素和異常波動(dòng),幫助金融機(jī)構(gòu)監(jiān)測(cè)和管理風(fēng)險(xiǎn),提高金融安全,又可以識(shí)別市場(chǎng)需求和用戶偏好,幫助投資者做出更準(zhǔn)確的投資決策或制定更有效的營(yíng)銷策略。
總之,模式識(shí)別與人們的生活息息相關(guān),其應(yīng)用已經(jīng)深入人們工作和生活的方方面面。我們應(yīng)該重視模式識(shí)別理論的發(fā)展以及模式識(shí)別技術(shù)的應(yīng)用,尤其是要在普通高校的理工科學(xué)生中促進(jìn)模式識(shí)別相關(guān)知識(shí)的普及,并在信息科學(xué)相關(guān)專業(yè)中推動(dòng)模式識(shí)別課程教學(xué)改革的深入。
高教司順應(yīng)時(shí)代的要求,主導(dǎo)推進(jìn)戰(zhàn)略性新興領(lǐng)域十四五高等教育教材體系建設(shè),以提高戰(zhàn)略性新興領(lǐng)域人才培養(yǎng)質(zhì)量。這是一個(gè)非常明智和及時(shí)的舉措。
作為長(zhǎng)期從事模式識(shí)別相關(guān)教學(xué)和科研的高校一線教師,我們深知模式識(shí)別課程對(duì)于高校人工智能相關(guān)專業(yè)本科生知識(shí)架構(gòu)和專業(yè)技能養(yǎng)成的重要性,也深感教材建設(shè)對(duì)于高校模式識(shí)別課程教學(xué)的重要性,因此,我們響應(yīng)高教司的號(hào)召,把自己長(zhǎng)期在一線教學(xué)科研中總結(jié)的經(jīng)驗(yàn)融入這本教材的編寫,希望能夠?qū)V大青年學(xué)子對(duì)模式識(shí)別課程的學(xué)習(xí)有所裨益,也對(duì)我國高校人工智能學(xué)科教育教學(xué)的發(fā)展有所助力。
本書分為三部分。在基礎(chǔ)知識(shí)部分,重點(diǎn)講授模式識(shí)別的基本概念、模式識(shí)別系統(tǒng)的性能指標(biāo)和一般結(jié)構(gòu)等內(nèi)容;在模式分類部分,重點(diǎn)講授基于判別函數(shù)、統(tǒng)計(jì)理論、神經(jīng)網(wǎng)絡(luò)的模式分類等內(nèi)容;在模式聚類部分,重點(diǎn)講授動(dòng)態(tài)聚類、層次聚類、高斯混合模型聚類、密度聚類等內(nèi)容。
由于編者學(xué)識(shí)水平所限,書中疏漏之處在所難免,還懇請(qǐng)各位同行專家不吝指正,以幫助我們及時(shí)修正完善。模式識(shí)別領(lǐng)域的發(fā)展日新月異,新的思想和方法層出不窮,在教學(xué)過程中,同行教師和青年學(xué)生如果有好的思路或建議,也請(qǐng)隨時(shí)和我們聯(lián)系交流,便于我們?cè)诤罄m(xù)版本更新中及時(shí)進(jìn)行修訂。希望能夠在大家的幫助下完善本書,使其緊貼時(shí)代前進(jìn)的脈搏,與時(shí)俱進(jìn)地體現(xiàn)模式識(shí)別領(lǐng)域的最新發(fā)展,并因此能夠?qū)Ω鄬W(xué)子學(xué)習(xí)模式識(shí)別知識(shí)有所裨益,對(duì)我國人工智能科技的發(fā)展有所貢獻(xiàn),這正是我們所熱切期待的。
以下是編者的聯(lián)系方式:北方工業(yè)大學(xué)張曉平zhangxp@ncut.edu.cn(第4章)
北京工業(yè)大學(xué)龔道雄gongdx@bjut.edu.cn(第7章)
姜華杰jianghj@bjut.edu.cn(第5、6章)
東北大學(xué)秦皇島分校趙玉良zhaoyuliang@neuq.edu.cn(第1章)
華南理工大學(xué)畢盛picy@scut.edu.cn(第2章)
董敏hollymin@scut.edu.cn(第3章)
羅家祥luojx@scut.edu.cn(第8章)
編者
目錄
前言
第1部分基 礎(chǔ) 知 識(shí)
第1章模式識(shí)別系統(tǒng)的構(gòu)成和基本概念
1.1模式和模式識(shí)別
1.1.1模式識(shí)別范疇
1.1.2模式識(shí)別問題的數(shù)學(xué)表達(dá)
1.2模式識(shí)別系統(tǒng)的基本構(gòu)成
1.3模式識(shí)別的基本概念
1.3.1模式識(shí)別的分類和聚類
1.3.2樣本、特征和特征空間
1.3.3特征選擇與降維
1.3.4距離與相似性度量
1.4模式識(shí)別系統(tǒng)的性能指標(biāo)
1.4.1評(píng)估和優(yōu)化模型性能的關(guān)鍵指標(biāo)
1.4.2泛化、欠擬合與過擬合
1.4.3評(píng)估方法
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第2部分模 式 分 類
第2章基于判別函數(shù)的模式分類
2.1線性分類器
2.1.1線性判別函數(shù)與決策面
2.1.2最小二乘誤差分類(LMSE)
2.1.3Fisher線性判別分析(FLDA)
2.1.4支持向量機(jī)(SVM)
2.2非線性分類器
2.2.1多項(xiàng)式分類器
2.2.2分段線性函數(shù)分類器
2.2.3k近鄰算法
2.2.4決策樹算法
2.3組合分類器
2.3.1Bagging算法
2.3.2Boosting算法(含AdaBoost算法)
2.3.3隨機(jī)森林
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第3章基于統(tǒng)計(jì)理論的模式分類
3.1貝葉斯決策和貝葉斯分類器
3.1.1最小風(fēng)險(xiǎn)決策
3.1.2最小錯(cuò)誤率決策
3.1.3樸素貝葉斯分類器
3.1.4正態(tài)分布下的貝葉斯分類器
3.2Neyman-Pearson決策
3.2.1Neyman-Pearson決策的算法原理
3.2.2Neyman-Pearson決策的模式分類應(yīng)用舉例
3.3最大似然估計(jì)
3.3.1最大似然估計(jì)的算法原理
3.3.2最大似然估計(jì)的模式分類應(yīng)用舉例
3.4期望最大化(EM)方法
3.4.1期望最大化方法
3.4.2期望最大化方法的模式分類應(yīng)用舉例
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第4章基于神經(jīng)網(wǎng)絡(luò)的模式分類
4.1基于多層前饋神經(jīng)網(wǎng)絡(luò)的模式分類
4.1.1神經(jīng)元模型
4.1.2多層前饋神經(jīng)網(wǎng)絡(luò)
4.1.3BP算法
4.1.4多層前饋神經(jīng)網(wǎng)絡(luò)的模式分類應(yīng)用舉例
4.2基于卷積神經(jīng)網(wǎng)絡(luò)的模式分類
4.2.1卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
4.2.2卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和模式分類應(yīng)用舉例
4.3基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模式分類
4.3.1循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
4.3.2循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和模式分類應(yīng)用舉例
4.4基于Transformer的模式分類
4.4.1Transformer的結(jié)構(gòu)
4.4.2Transformer的訓(xùn)練和模式分類應(yīng)用舉例
4.5基于YOLOvX的視覺模式識(shí)別
4.5.1YOLOvX網(wǎng)絡(luò)的基本原理
4.5.2YOLOv8網(wǎng)絡(luò)的訓(xùn)練和目標(biāo)檢測(cè)應(yīng)用舉例
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第3部分模 式 聚 類
第5章動(dòng)態(tài)聚類
5.1動(dòng)態(tài)聚類的算法特點(diǎn)和適用場(chǎng)合
5.2典型的動(dòng)態(tài)聚類算法
5.2.1k均值算法
5.2.2ISODATA聚類算法
5.3動(dòng)態(tài)聚類應(yīng)用舉例
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第6章層次聚類
6.1層次聚類的算法特點(diǎn)和適用場(chǎng)合
6.2典型的層次聚類算法
6.2.1自下而上的聚集聚類算法(Agglomerative)
6.2.2自上而下的分裂聚類算法(Divisive)
6.3層次聚類算法應(yīng)用舉例
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第7章高斯混合模型聚類
7.1GMM的算法特點(diǎn)和適用場(chǎng)合
7.2GMM算法
7.2.1高斯分布
7.2.2GMM的算法原理
7.2.3GMM的參數(shù)學(xué)習(xí)
7.2.4應(yīng)用EM算法訓(xùn)練GMM模型
7.2.5GMM組件個(gè)數(shù)的確定
7.3GMM聚類的應(yīng)用舉例
7.4GMM聚類的函數(shù)指令和編程實(shí)現(xiàn)
7.4.1MATLAB常用的GMM聚類函數(shù)
7.4.2Python常用的GMM聚類指令
7.4.3GMM聚類的Python程序代碼舉例
本章小結(jié)
習(xí)題
參考文獻(xiàn)
第8章密度聚類
8.1基于密度的聚類
8.2DBSCAN算法
8.2.1算法基本思想
8.2.2確定參數(shù)Eps和MinPts
8.2.3性能評(píng)估
8.3OPTICS聚類
8.3.1基于密度的聚類排序
8.3.2識(shí)別聚類結(jié)構(gòu)
本章小結(jié)
習(xí)題
參考文獻(xiàn)