本書(shū)以高校和企業(yè)合作的人工智能大數(shù)據(jù)標(biāo)注基地的實(shí)際運(yùn)作經(jīng)驗(yàn)為基礎(chǔ), 將自己在AI大數(shù)據(jù)標(biāo)注工廠中所領(lǐng)悟到的管理方法和所使用的技術(shù)平臺(tái)進(jìn)行詳細(xì)闡述, 并結(jié)合實(shí)際案例進(jìn)行講解, 在兼顧初學(xué)者的同時(shí), 更偏重于如何以數(shù)據(jù)標(biāo)注工廠的層面從管理方法和技術(shù)手段上提高AI大數(shù)據(jù)標(biāo)注生產(chǎn)能力的探討。
第1部分 數(shù)據(jù)標(biāo)注的緣起
第1章 人工智能的歷程回顧與展望
1.1 混沌初開(kāi)——數(shù)學(xué)模型(1900—1956)
1.1.1 開(kāi)天之問(wèn)
1.1.2 創(chuàng)世神器
1.1.3 武林秘籍
1.1.4 宗師問(wèn)世
1.2 江湖論道——達(dá)特茅斯會(huì)議(1956—1980)
1.2.1 華山論劍
1.2.2 江湖紛爭(zhēng)
1.2.3 停滯不前
1.2.4 門(mén)派初成
1.3 武林中興——深度學(xué)習(xí)(1981年至今)
1.3.1 盟主問(wèn)道——機(jī)器學(xué)習(xí)
1.3.2 神兵現(xiàn)世——神經(jīng)網(wǎng)絡(luò)
1.3.3 后起之秀——深度學(xué)習(xí)
1.3.4 前提要素——數(shù)據(jù)標(biāo)注
思考題
第2章 數(shù)據(jù)標(biāo)注的崛起
2.1 數(shù)據(jù)標(biāo)注的演變
2.1.1 數(shù)據(jù)標(biāo)注的起源
2.1.2 數(shù)據(jù)標(biāo)注在人工智能中的地位
2.1.3 數(shù)據(jù)標(biāo)注團(tuán)隊(duì)面臨的挑戰(zhàn)
2.2 數(shù)據(jù)標(biāo)注行業(yè)發(fā)展趨勢(shì)
2.2.1 數(shù)據(jù)標(biāo)注公司簡(jiǎn)介
2.2.2 數(shù)據(jù)標(biāo)注行業(yè)的現(xiàn)狀
2.2.3 數(shù)據(jù)標(biāo)注行業(yè)前景
2.3 數(shù)據(jù)標(biāo)注行業(yè)標(biāo)準(zhǔn)的制定
2.3.1 標(biāo)注數(shù)據(jù)量記錄標(biāo)準(zhǔn)
2.3.2 標(biāo)注工作職責(zé)說(shuō)明
2.3.3 標(biāo)注信息要求規(guī)范
2.3.4 標(biāo)注執(zhí)行過(guò)程標(biāo)準(zhǔn)
2.3.5 標(biāo)注術(shù)語(yǔ)體系標(biāo)準(zhǔn)
2.3.6 標(biāo)注交付物說(shuō)明
思考題
第3章 數(shù)據(jù)標(biāo)注基礎(chǔ)知識(shí)
3.1 數(shù)據(jù)標(biāo)注基礎(chǔ)
3.1.1 數(shù)據(jù)標(biāo)注的概念
3.1.2 數(shù)據(jù)標(biāo)注行業(yè)的特點(diǎn)
3.1.3 數(shù)據(jù)標(biāo)注的分類
3.1.4 數(shù)據(jù)標(biāo)注的過(guò)程
3.2 數(shù)據(jù)標(biāo)注的對(duì)象
3.2.1 數(shù)據(jù)標(biāo)注的人員結(jié)構(gòu)
3.2.2 數(shù)據(jù)標(biāo)注人員的素質(zhì)要求
3.2.3 數(shù)據(jù)標(biāo)注的采集目標(biāo)
3.2.4 數(shù)據(jù)標(biāo)注平臺(tái)和工具
3.3 數(shù)據(jù)標(biāo)注的質(zhì)量保證
3.3.1 數(shù)據(jù)標(biāo)注質(zhì)量的地位
3.3.2 數(shù)據(jù)標(biāo)注質(zhì)量標(biāo)準(zhǔn)
3.3.3 數(shù)據(jù)標(biāo)注質(zhì)量檢驗(yàn)方法
3.4 自動(dòng)標(biāo)注技術(shù)的發(fā)展
3.4.1 圖像自動(dòng)標(biāo)注
3.4.2 文本自動(dòng)標(biāo)注
思考題
第2部分 數(shù)據(jù)標(biāo)注實(shí)施
第4章 文本數(shù)據(jù)標(biāo)注
4.1 文本數(shù)據(jù)特征和分析
4.1.1 文本標(biāo)注的定義
4.1.2 文本標(biāo)注的應(yīng)用領(lǐng)域
4.1.3 文本標(biāo)注質(zhì)量標(biāo)準(zhǔn)
4.1.4 常見(jiàn)標(biāo)注結(jié)果文件格式
4.2 文本數(shù)據(jù)采集和整理
4.2.1 文本數(shù)據(jù)采集介紹和案例
4.2.2 文本數(shù)據(jù)預(yù)處理及清洗工具
4.2.3 文本處理工具
4.3 文本數(shù)據(jù)標(biāo)注工具和方法
4.3.1 目標(biāo)檢測(cè)文本識(shí)別工具及使用方法
4.3.2 語(yǔ)義定義全文OCR識(shí)別工具及使用方法
4.4 文本數(shù)據(jù)標(biāo)注案例
4.4.1 車(chē)牌——檢測(cè)識(shí)別
4.4.2 票據(jù)證件——語(yǔ)義分類全文OCR識(shí)別
思考題
第5章 圖像數(shù)據(jù)標(biāo)注
5.1 圖像數(shù)據(jù)特征和分析
5.1.1 圖像標(biāo)注的定義
5.1.2 圖像處理的應(yīng)用領(lǐng)域
5.1.3 數(shù)據(jù)質(zhì)量和標(biāo)注標(biāo)準(zhǔn)
5.1.4 常見(jiàn)的圖像文件和標(biāo)注結(jié)果格式
5.1.5 圖像標(biāo)注各類型介紹
5.2 圖像數(shù)據(jù)采集和整理
5.2.1 數(shù)據(jù)采集的渠道和方法
5.2.2 圖像數(shù)據(jù)采集案例
5.2.3 數(shù)據(jù)預(yù)處理和清洗
5.2.4 圖像處理工具
5.3 圖像數(shù)據(jù)標(biāo)注工具和方法
5.3.1 目標(biāo)檢測(cè)工具及使用方法
5.3.2 圖像分割工具及使用方法
5.4 圖像數(shù)據(jù)標(biāo)注案例
5.4.1 人體框圖像標(biāo)注——目標(biāo)檢測(cè)
5.4.2 車(chē)輛輪廓摳圖——圖像分割
5.4.3 手勢(shì)特征點(diǎn)——點(diǎn)位標(biāo)注
思考題
第6章 語(yǔ)音數(shù)據(jù)標(biāo)注
6.1 語(yǔ)音數(shù)據(jù)特征和分析
6.1.1 音頻標(biāo)注的定義
6.1.2 音頻標(biāo)注的應(yīng)用領(lǐng)域
6.1.3 語(yǔ)音的質(zhì)量和標(biāo)注標(biāo)準(zhǔn)
6.1.4 語(yǔ)音標(biāo)注運(yùn)用類型
6.1.5 語(yǔ)音標(biāo)注相關(guān)基礎(chǔ)知識(shí)
6.2 語(yǔ)音數(shù)據(jù)采集和整理
6.2.1 音頻采集的方法渠道
6.2.2 語(yǔ)音數(shù)據(jù)采集案例
6.2.3 音頻處理工具
6.3 語(yǔ)音數(shù)據(jù)標(biāo)注工具和方法
6.4 語(yǔ)音數(shù)據(jù)標(biāo)注案例
6.4.1 標(biāo)注任務(wù)流程及規(guī)則
6.4.2 標(biāo)注平臺(tái)系統(tǒng)操作
思考題
第7章 視頻數(shù)據(jù)標(biāo)注
7.1 視頻標(biāo)注特征和分析
7.1.1 視頻標(biāo)注的定義
7.1.2 視頻標(biāo)注與圖像標(biāo)注的差異
7.1.3 視頻標(biāo)注的應(yīng)用領(lǐng)域
7.1.4 視頻標(biāo)注基礎(chǔ)知識(shí)
7.1.5 常見(jiàn)視頻數(shù)據(jù)格式
7.2 視頻數(shù)據(jù)采集和整理
7.2.1 視頻采集的工作流程
7.2.2 視頻數(shù)據(jù)采集應(yīng)用和發(fā)展
7.2.3 常用視頻處理工具
7.2.4 快剪輯平臺(tái)技術(shù)
7.3 視頻數(shù)據(jù)標(biāo)注工具和方法
7.3.1 視頻幀跟蹤標(biāo)注工具
7.3.2 視頻標(biāo)注的方法和類型
思考題
第3部分 數(shù)據(jù)標(biāo)注工廠
第8章 數(shù)據(jù)標(biāo)注工廠理論基礎(chǔ)
8.1 生產(chǎn)管理理論
8.2 流水線理論
8.2.1 流水線起源
8.2.2 流水線的基礎(chǔ)概念
8.2.3 流水線生產(chǎn)的特點(diǎn)
思考題
第9章 數(shù)據(jù)標(biāo)注工廠的管