計算機視覺——從理論到實踐
定 價:59.8 元
叢書名:新一代人工智能創(chuàng)新人才培養(yǎng)精品系列
讀者對象:本書適用于人工智能、智能科學與技術(shù)等專業(yè)學生
本書深入探索計算機視覺的核心技術(shù),圍繞五大關(guān)鍵任務展開介紹,即圖像分類、圖像分割、目標檢測、目標跟蹤及三維重建。本書共9章,分為三篇,即基礎(chǔ)篇、識別篇和重建篇,系統(tǒng)性地引導讀者逐步深入了解計算機視覺的復雜內(nèi)涵與應用實踐;A(chǔ)篇(第1~4章)著重介紹了構(gòu)成計算機視覺的通用理論與算法,包括但不限于圖像濾波技術(shù)的基本原理、邊緣檢測的實現(xiàn)方法、尺度不變特征的提取策略及模型擬合的數(shù)學工具等,為后續(xù)章節(jié)的學習奠定必要的理論與技術(shù)基礎(chǔ)。識別篇(第5~7章)深入分析了機器解析圖像內(nèi)容的高級能力,具體涉及圖像分割、圖像分類、目標檢測與跟蹤的經(jīng)典算法及模型。重建篇(第8、9章)聚焦于如何從二維圖像數(shù)據(jù)中復原三維場景結(jié)構(gòu),詳細闡述了攝像機幾何原理、極幾何的應用、雙目立體視覺等關(guān)鍵技術(shù)的概念與算法,展現(xiàn)了從圖像像素到三維場景結(jié)構(gòu)的轉(zhuǎn)換過程。本書可作為人工智能、智能科學與技術(shù)等專業(yè)計算機視覺、機器視覺等課程的教材,也可供計算機視覺領(lǐng)域的專業(yè)人士(包括開發(fā)人員、科技人員和研究學者)參考使用。
魯鵬: 北京郵電大學人工智能學院副教授;2003年7月獲得華中科技大學圖像所碩士學位,2006年7月獲得中國科學院自動化所博士學位,2008年至2010年在北京大學人機交互與多媒體實驗室從事博士后研究工作;在北京郵電大學任教以來,長期從事本科生、研究生計算機視覺課程的教學工作,在B站上講授的計算機視覺相關(guān)課程的錄播視頻播放量超過100萬人次,同時,主講的計算機視覺在線慕課已在學堂在線上線;教學經(jīng)驗豐富、成果顯著,出版《計算機視覺從理論到實踐(微課版)》《計算機視覺基礎(chǔ)》等多部教材。
【章名目錄】第 1章 緒論 1第 2章 線性濾波器 8第3章 圖像邊緣提取與模型擬合 27第4章 局部特征提取 56第5章 圖像分割 81第6章 圖像檢索與分類 94第7章 目標檢測與跟蹤 117第8章 攝像機幾何與標定 144第9章 三維重建 175【詳細目錄】第 1章 緒論 11.1 計算機視覺概述 11.2 相關(guān)學科 21.3 發(fā)展歷程 31.4 應用領(lǐng)域 5本章小結(jié) 7習題 7第 2章 線性濾波器 82.1 卷積 82.1.1 圖像表示與線性濾波 82.1.2 卷積的定義 102.1.3 卷積的性質(zhì) 112.1.4 卷積示例 112.1.5 動手實踐:圖像銳化 132.2 圖像去噪 142.2.1 噪聲分析 142.2.2 中值濾波器 162.2.3 動手實踐:去除圖像中的椒鹽噪聲 182.2.4 高斯濾波 202.2.5 動手實踐:去除圖像中的高斯噪聲 24本章小結(jié) 26習題 26第3章 圖像邊緣提取與模型擬合 273.1 圖像邊緣與圖像求導 273.1.1 邊緣的位置特點 273.1.2 圖像導數(shù)與梯度 293.1.3 高斯一階偏導核 303.1.4 動手實踐:圖像求導 333.2 邊緣檢測 353.2.1 Canny邊緣檢測器 353.2.2 動手實踐:車道線檢測 373.3 模型擬合 383.3.1 最小二乘擬合 383.3.2 魯棒擬合 413.3.3 RANSAC算法 423.3.4 動手實踐:RANSAC直線擬合 453.3.5 霍夫變換 473.4 動手實踐:硬幣定位 53本章小結(jié) 55習題 55第4章 局部特征提取 564.1 圖像拼接問題與局部特征 564.2 Harris-Laplace檢測器 594.2.1 Harris角點檢測器 594.2.2 尺度不變理論 654.2.3 LoG算子 674.3 SIFT特征 724.3.1 DoG尺度空間 724.3.2 SIFT特征點檢測 744.3.3 SIFT特征描述子 754.4 動手實踐:圖像拼接 76本章小結(jié) 80習題 80第5章 圖像分割 815.1 圖像分割概述 815.2 人類視覺分組與格式塔理論 825.3 基于像素聚類的圖像分割 835.3.1 基于K-means的圖像分割 835.3.2 基于均值漂移的圖像分割 855.3.3 動手實踐:圖像分割 89本章小結(jié) 92習題 93第6章 圖像檢索與分類 946.1 圖像分類任務概述 946.1.1 圖像分類任務的難點 956.1.2 圖像分類任務的評價指標 986.1.3 數(shù)據(jù)驅(qū)動的圖像分類系統(tǒng)的基本范式 996.2 詞袋模型與圖像檢索 1006.2.1 文本詞袋模型 1006.2.2 TF-IDF加權(quán) 1016.2.3 視覺詞袋模型 1026.2.4 動手實踐:基于詞袋模型的圖像檢索 1046.3 基于詞袋模型的圖像分類 1076.3.1 線性分類模型 1076.3.2 多類支持向量機損失 1086.3.3 模型優(yōu)化 1096.3.4 欠擬合與過擬合 1106.3.5 動手實踐:場景圖像分類 111本章小結(jié) 116習題 116第7章 目標檢測與跟蹤 1177.1 目標檢測任務概述 1177.2 基于滑動窗口的目標檢測范式 1187.3 基于AdaBoost的人臉檢測 1217.3.1 人臉檢測任務概述 1217.3.2 AdaBoost算法 1217.3.3 構(gòu)建弱分類器 1227.3.4 級聯(lián)結(jié)構(gòu) 1257.3.5 動手實踐:人臉檢測 1277.4 基于HOG特征的行人檢測 1297.4.1 行人檢測任務概述 1307.4.2 HOG特征 1307.4.3 應用HOG特征實現(xiàn)行人檢測 1317.4.4 動手實踐:行人檢測 1327.5 基于光流的運動跟蹤 1337.5.1 光流計算基本等式 1347.5.2 Lucas-Kanade光流計算 1367.5.3 動手實踐:車輛運動跟蹤 138本章小結(jié) 142習題 142第8章 攝像機幾何與標定 1448.1 針孔模型與透鏡 1448.1.1 針孔攝像機 1448.1.2 透鏡成像 1488.2 攝像機幾何 1518.2.1 齊次坐標 1518.2.2 坐標系變換和剛體變換 1538.2.3 一般攝像機的幾何模型 1578.2.4 透視投影矩陣的性質(zhì) 1618.3 攝像機標定 1618.3.1 投影矩陣估計 1618.3.2 退化情況 1638.4 徑向畸變的攝像機標定 1648.4.1 徑向畸變模型 1648.4.2 徑向畸變標定 1658.5 動手實踐:攝像機標定 167本章小結(jié) 173習題 173第9章 三維重建 1759.1 三維重建基礎(chǔ) 1759.1.1 三角化的概念 1759.1.2 三角化的線性解法 1779.1.3 三角化的非線性解法 1789.2 極幾何與基礎(chǔ)矩陣 1799.2.1 極幾何 1799.2.2 本質(zhì)矩陣與基礎(chǔ)矩陣 1809.2.3 基礎(chǔ)矩陣估計 1829.2.4 動手實踐:基礎(chǔ)矩陣估計 1849.3 雙目立體視覺 1909.3.1 基于平行視圖的雙目立體視覺 1909.3.2 圖像校正 1949.3.3 對應點搜索 1979.3.4 動手實踐:雙目立體視覺定位 201本章小結(jié) 208習題 208參考文獻 210