計(jì)算機(jī)視覺應(yīng)用開發(fā)
定 價(jià):49.8 元
叢書名:職業(yè)教育人工智能技術(shù)應(yīng)用專業(yè)系列教材
- 作者:國基北盛(南京)科技發(fā)展有限公司
- 出版時(shí)間:2023/7/1
- ISBN:9787111729730
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP302.7
- 頁碼:
- 紙張:純質(zhì)紙
- 版次:
- 開本:16開
本書從計(jì)算機(jī)視覺初學(xué)者的視角出發(fā),以Python及其相關(guān)框架為工具,以實(shí)戰(zhàn)為導(dǎo)向,講述了計(jì)算機(jī)視覺中關(guān)于圖像以及多種圖像處理的基本概念、理論方法和經(jīng)典算法,既有對(duì)圖像基礎(chǔ)知識(shí)的介紹,也有對(duì)現(xiàn)實(shí)問題的解決方案和技術(shù)詳細(xì)闡述。通過利用計(jì)算機(jī)視覺中的圖像變換算法解決圖像分類、人臉識(shí)別、圖像增強(qiáng)、圖像語義分割、圖像風(fēng)格遷移、圖像超分辨率重建和場(chǎng)景文字識(shí)別等現(xiàn)實(shí)問題,使讀者既能了解圖像的多種操作原理,又能學(xué)會(huì)解決實(shí)際問題的思路和方法,提高使用計(jì)算機(jī)視覺方法的能力。
本書可作為各類職業(yè)院校人工智能技術(shù)應(yīng)用及相關(guān)專業(yè)的教材,也可作為人工智能、計(jì)算機(jī)視覺初學(xué)者的參考書。
本書配有電子課件等教學(xué)資源,選用本書作為授課教材的教師可從機(jī)械工業(yè)出版社教育服務(wù)網(wǎng)(wwwcmpeducom)免費(fèi)注冊(cè)并登錄后下載,或聯(lián)系編輯(010-88379807)咨詢。
前言
計(jì)算機(jī)視覺(Computer Vision,CV)屬于計(jì)算機(jī)科學(xué)領(lǐng)域,專注于創(chuàng)建可以像人類一樣處理、分析和理解視覺數(shù)據(jù)(圖像或視頻)的數(shù)字系統(tǒng)。計(jì)算機(jī)視覺的概念是教會(huì)計(jì)算機(jī)處理像素級(jí)別的圖像并理解它。從技術(shù)上講,機(jī)器嘗試通過特殊的軟件算法來對(duì)視覺信息進(jìn)行檢索、處理并解釋其結(jié)果。隨著人工智能技術(shù)的不斷發(fā)展,各類計(jì)算機(jī)視覺技術(shù)應(yīng)用到了日常生活中,人們通過計(jì)算機(jī)視覺技術(shù)可以更便捷、高效地來交流、辦公和娛樂。同樣,計(jì)算機(jī)視覺的不斷發(fā)展也吸引了大量的優(yōu)秀人才和高校畢業(yè)生投身其中。但是,現(xiàn)實(shí)生活中的問題千奇百怪,計(jì)算機(jī)視覺也無法完全解決生活中的所有難題,只能通過不同領(lǐng)域的學(xué)者一起努力研究和探索。
本書在內(nèi)容選擇上盡量涵蓋了計(jì)算機(jī)視覺中圖像處理的各方面知識(shí),采用理論與實(shí)踐相結(jié)合的編寫模式,從初學(xué)者的角度深入淺出地介紹了計(jì)算機(jī)視覺中圖像處理的基本概念、基礎(chǔ)知識(shí)以及常用的理論方法和算法,并應(yīng)用所學(xué)方法解決實(shí)際案例問題,幫助讀者快速理解并掌握計(jì)算機(jī)視覺中圖像處理的理論方法以及實(shí)踐技能。
本書把“立德樹人”作為綜合教育理念,讓學(xué)生在學(xué)習(xí)的過程中形成協(xié)同效應(yīng),培養(yǎng)素質(zhì)高、專業(yè)技術(shù)全面的高技能人才,助力中國式現(xiàn)代化。
本書為2021年度陜西高等職業(yè)教育教學(xué)改革研究重點(diǎn)攻關(guān)項(xiàng)目《產(chǎn)教融合背景下高職院校產(chǎn)業(yè)學(xué)校建設(shè)運(yùn)行機(jī)制的研究與實(shí)踐》(項(xiàng)目編號(hào):21GG009)研究成果之一。
本書中所有程序代碼都基于Python 37和Tensorflow 27進(jìn)行開發(fā)。
本書共8個(gè)學(xué)習(xí)單元,每個(gè)單元都設(shè)有單元概述和學(xué)習(xí)目標(biāo),并在學(xué)習(xí)結(jié)束后設(shè)有學(xué)習(xí)評(píng)估和單元習(xí)題。其中,單元1介紹了計(jì)算機(jī)視覺中圖像的相關(guān)概念、基礎(chǔ)知識(shí)以及一些簡(jiǎn)單的圖像變換處理等;單元2、3介紹了圖像分類和人臉識(shí)別的基本概念、方法以及應(yīng)用;單元4介紹了圖像增強(qiáng)的分類及方法;單元5介紹了圖像語義分割的基本概念、語義分割網(wǎng)絡(luò)和案例實(shí)施;單元6介紹了圖像風(fēng)格遷移的概念、多種風(fēng)格遷移方法及應(yīng)用;單元7介紹了圖像超分辨率重建基礎(chǔ)知識(shí)、多種重建方法及應(yīng)用;單元8介紹了場(chǎng)景文字識(shí)別的概念、方法及應(yīng)用。各單元建議安排的學(xué)時(shí)如下:
單元名稱建議學(xué)時(shí)單元1圖像基礎(chǔ)學(xué)習(xí)4單元2圖像分類6單元3人臉識(shí)別8單元4圖像增強(qiáng)6單元5圖像語義分割10單元6圖像風(fēng)格遷移12單元7圖像超分辨率重建12單元8場(chǎng)景文字識(shí)別6
本書由國基北盛(南京)科技發(fā)展有限公司組編,由劉洪海、丁愛萍、張衛(wèi)婷任主編,王妍、于倩、屈毅、張傳勇任副主編,參與編寫的還有馬曉虎、王春蓮、張峰連、李永亮、王秀芳、王靖、勞飛、單杰和魏鵬飛。其中,劉洪海、丁愛萍、王妍、張峰連和魏鵬飛負(fù)責(zé)編寫單元1和單元2,丁愛萍、張衛(wèi)婷、屈毅和王靖負(fù)責(zé)編寫單元3和單元4,劉洪海、于倩、馬曉虎和勞飛負(fù)責(zé)編寫單元5和單元6,張傳勇、李永亮、王春蓮、王秀芳和單杰負(fù)責(zé)編寫單元7和單元8。
由于編者水平有限,書中難免存在疏漏和不足之處,懇請(qǐng)讀者批評(píng)指正。
編者
目錄
前言
單元1圖像基礎(chǔ)學(xué)習(xí)
11圖像相關(guān)名詞概述
12圖像基礎(chǔ)操作
13圖像幾何變換
14閾值分割
15圖像統(tǒng)計(jì)
16圖像濾波
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元2圖像分類
21圖像分類概述
22神經(jīng)網(wǎng)絡(luò)
23卷積神經(jīng)網(wǎng)絡(luò)
24實(shí)戰(zhàn)案例——基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類
25遷移學(xué)習(xí)
26實(shí)戰(zhàn)案例——基于遷移學(xué)習(xí)的圖像分類
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元3人臉識(shí)別
31目標(biāo)檢測(cè)
32實(shí)戰(zhàn)案例——基于YOLOv3的目標(biāo)檢測(cè)
33人臉檢測(cè)
34實(shí)戰(zhàn)案例——基于Haar特征的人臉檢測(cè)
35實(shí)戰(zhàn)案例——基于Hog特征的人臉檢測(cè)
36人臉識(shí)別
37認(rèn)識(shí)face_recognition開源庫
38實(shí)戰(zhàn)案例——基于face_recognition的人臉識(shí)別
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元4圖像增強(qiáng)
41圖像增強(qiáng)概述
42有監(jiān)督的圖像增強(qiáng)
43實(shí)戰(zhàn)案例——基于mixup/cutmix算法的圖像增強(qiáng)
44無監(jiān)督的圖像增強(qiáng)
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元5圖像語義分割
51語義分割概述
52上采樣
53特征融合
54語義分割網(wǎng)絡(luò)
55實(shí)戰(zhàn)案例——基于UNet的圖像語義分割
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元6圖像風(fēng)格遷移
61圖像風(fēng)格遷移概述
62風(fēng)格提取
63gram矩陣
64損失計(jì)算
65VGG19
66實(shí)戰(zhàn)案例——基于VGG19的圖像風(fēng)格遷移
67對(duì)抗生成網(wǎng)絡(luò)
68實(shí)戰(zhàn)案例——基于CycleGAN的圖像風(fēng)格遷移
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元7圖像超分辨率重建
71認(rèn)識(shí)圖像分辨率
72認(rèn)識(shí)圖像超分辨率
73超分辨率重建技術(shù)
74SRCNN
75PSNR
76實(shí)戰(zhàn)案例——基于SRCNN的圖像超分辨率重建
77SRGAN
78實(shí)戰(zhàn)案例——基于SRGAN的圖像超分辨率重建
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
單元8場(chǎng)景文字識(shí)別
81場(chǎng)景文字識(shí)別概述
82LSTM
83CTC
84實(shí)戰(zhàn)案例——基于LSTM+CTC的文字識(shí)別
85tesseract
86實(shí)戰(zhàn)案例——基于tesseract的文字識(shí)別
單元小結(jié)
學(xué)習(xí)評(píng)估
單元習(xí)題
參考文獻(xiàn)