《機器視覺的開發(fā)實踐》著力于介紹機器視覺的基本理論、架構(gòu)和主要技術(shù)等,利用深度學習常見框架TensorFlow等,創(chuàng)建強大的圖像處理應用程序,并給出了具體的開發(fā)實踐。
《機器視覺的開發(fā)實踐》主要內(nèi)容包括機器視覺基礎,神經(jīng)網(wǎng)絡與機器視覺,機器學習開發(fā)實踐環(huán)境,圖像分類、分割、生成和目標檢測等,給出了機器視覺高級概念和新前沿,為機器視覺研究領域提供了良好的理論指導和技術(shù)支撐。
《機器視覺的開發(fā)實踐》可供從事機器視覺方面的工程技術(shù)人員參考閱讀。
本書從機器視覺和深度學習的基礎概念入手,以流行的深度學習框架PyTorch為基礎,展示深度學習在計算機視覺方面的應用。作為機器視覺的入門和實戰(zhàn)教程,本書以簡潔易懂的語言和示例介紹相關機器視覺和深度學習的理論知識,并介紹如何更好地使用PyTorch深度學習框架來處理機器視覺方面的問題。
本書共7章,主要內(nèi)容如下:
第1章機器視覺基礎。本章介紹了有關機器視覺的基礎知識,包括機器視覺的概念、發(fā)展和應用,分析了機器視覺的任務,研究了機器視覺的構(gòu)成及各組成部分的主要功能,并從圖像噪聲、圖像濾波、幾何變換和圖像特征四個方面深入分析了機器視覺的原理,為后續(xù)相關內(nèi)容的研究奠定了基礎。
第2章神經(jīng)網(wǎng)絡與機器視覺。本章介紹了神經(jīng)網(wǎng)絡基礎、卷積神經(jīng)網(wǎng)絡、典型CNN架構(gòu)模型及常見深度學習框架。其中,典型CNN架構(gòu)模型包括LeNet-5、AlexNet、GoogleNet、VGGNet、ResNet等;常見的深度學習框架包括TensorFlow、PyTorch、Keras、Caffe、CNTK、MXNet等。
第3章機器學習開發(fā)實踐環(huán)境。本章首先介紹了機器學習開發(fā)所用到的實踐環(huán)境,包括Anaconda開發(fā)平臺的基礎知識及其安裝方法,以及嵌入式機器視覺開發(fā)平臺及其相關技術(shù);其次介紹了如何安裝Anaconda,以及在Anaconda環(huán)境下安裝TensorFlow和PyTorch框架的方法;最后介紹了機器視覺開發(fā)常用的幾種數(shù)據(jù)集,并給出了示例。
第4章圖像分類開發(fā)實踐。本章主要介紹了圖像分類基本概念及原理、典型分類模型和圖像分類的軟硬件開發(fā)環(huán)境,并通過實戰(zhàn)的方式對圖像分類進行了介紹,包括數(shù)據(jù)預處理、模型搭建、訓練及最后的驗證。
第5章目標檢測開發(fā)實踐。本章首先從目標檢測任務的需求出發(fā),對目標檢測的性能指標做了介紹;其次介紹了傳統(tǒng)的基于特征的目標檢測算法模型及利用卷積神經(jīng)網(wǎng)絡進行目標檢測算法模型,著重介紹了YOLO模型及原理,特別是算法的訓練與預測中的具體細節(jié);最后給出了如何使用PyTorch實現(xiàn)YOLOv5算法。
第6章圖像分割開發(fā)實踐。本章首先介紹了圖像分割的基本概念,包括圖像分割的內(nèi)容、類別及目的;其次介紹了基于閾值、區(qū)域、邊緣檢測等的常見傳統(tǒng)圖像分割方法,包括基本思想和具體程序?qū)崿F(xiàn);最后介紹了當前基于深度學習的核心思想和常用數(shù)據(jù)集,分析了經(jīng)典分割框架FCN的基本原理,在此基礎上介紹其改進后提出的UNet方法,并在介紹相關算法基本原理的基礎上,給出了主要實驗過程和關鍵代碼以供參考。
第7章圖像生成技術(shù)。圖像生成領域內(nèi)主流的圖像生成技術(shù)有三類,分別是PixelCNN像素卷積網(wǎng)絡、VAE變分自編碼器和GAN生成對抗網(wǎng)絡。本章選擇了最近熱門的GAN生成對抗網(wǎng)絡作為主要內(nèi)容,重點介紹了生成對抗網(wǎng)絡思想及算法推導,利用PyTorch實現(xiàn)了WGAN算法,并利用不同的數(shù)據(jù)集來生成圖像。
本書可為機器視覺研究領域提供良好的理論指導和技術(shù)支撐,進一步地,讀者可結(jié)合典型應用場景,依據(jù)本書提供的經(jīng)典案例和代碼,開展具體實踐驗證。編者結(jié)合多年在機器視覺方面的科研與教學經(jīng)驗,參考國內(nèi)外最新研究成果,總結(jié)并編寫本書,希望對讀者有所幫助。
第1章 機器視覺基礎
1.1 機器視覺概述
1.2 機器視覺系統(tǒng)的任務
1.3 機器視覺系統(tǒng)的構(gòu)成
1.4 機器視覺原理
第2章 神經(jīng)網(wǎng)絡與機器視覺
2.1 神經(jīng)網(wǎng)絡基礎
2.2 卷積神經(jīng)網(wǎng)絡
2.3 典型CNN架構(gòu)模型
2.4 常見深度學習框架
第3章 機器學習開發(fā)實踐環(huán)境
3.1 Anaconda開發(fā)平臺
3.2 嵌入式機器視覺開發(fā)平臺
3.3 常用數(shù)據(jù)集
第4章 圖像分類開發(fā)實踐
4.1 圖像分類基本概念及原理
4.2 典型分類模型
4.3 軟硬件開發(fā)環(huán)境
4.4 圖像分類實戰(zhàn)
第5章 目標檢測開發(fā)實踐
5.1 目標檢測的任務
5.2 目標檢測的性能指標
5.3 目標檢測的算法模型
5.4 YOLOv5目標檢測訓練模型
5.5 YOLOv5實戰(zhàn)
第6章 圖像分割開發(fā)實踐
6.1 圖像分割基本概念
6.2 傳統(tǒng)圖像分割方法
6.3 基于深度學習的圖像分割方法
第7章 圖像生成技術(shù)
7.1 圖像生成的基本思想
7.2 圖像生成網(wǎng)絡理論
7.3 生成對抗網(wǎng)絡算法推導
7.4 WGAN的原理
7.5 WGAN的實現(xiàn)
7.6 WGAN圖像生成實戰(zhàn)
參考文獻