數(shù)據(jù)標注工程——概念、方法、工具與案例
定 價:59 元
- 作者:聶明
- 出版時間:2021/1/1
- ISBN:9787121286346
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:296
- 紙張:
- 版次:01
- 開本:16開
本書是人工智能技術應用核心課程系列教材之一,通過對人工智能數(shù)據(jù)標注的概念、方法、工具與案例的系統(tǒng)介紹,結合對圖像、視頻、語音、文本和3D點云等類別數(shù)據(jù)的具體標注案例的分析與操作,使初學者可以快速掌握數(shù)據(jù)標注的基礎知識和常用方法,使從業(yè)者在提升數(shù)據(jù)標注技術水平的同時,掌握工程化數(shù)據(jù)標注的項目組織、管理和質量控制的技術與方法。本書適合作為高校人工智能相關專業(yè)的教材,也可供人工智能、機器學習與深度學習愛好者閱讀,還可作為人工智能改造升級項目的規(guī)劃與實施者、人工智能數(shù)據(jù)服務從業(yè)者以及數(shù)據(jù)標注技術工程管理人員閱讀和參考。
聶明,男,1964年生人,中共黨員,博士,三級教授, 現(xiàn)任南京信息職業(yè)技術學院人工智能學院(籌)院長,是全國工信和信息化職業(yè)教育教學指導委員會計算機專指委委員、江蘇省"333工程”中青年學術帶頭人、江蘇省"六大人才高峰”高層次人才培養(yǎng)對象。編著出版過《移動增值應用開發(fā)導論》、《Java Web應用開發(fā)項目教程》、《VC++程序設計技能教程與實訓》和《計算機應用技術導論》等多本專著和教材。
第1章 人工智能概述 1
1.1 人工智能發(fā)展概況 1
1.1.1 人工智能的發(fā)展歷程 1
1.1.2 人工智能的影響力 3
1.1.3 人工智能的國際競爭 5
1.2 人工智能的典型技術 7
1.2.1 人工智能技術的分類 7
1.2.2 語音合成 10
1.2.3 語音識別 11
1.2.4 自然語言處理 12
1.2.5 圖像識別 13
1.2.6 3D點云 13
1.2.7 多模態(tài)數(shù)據(jù)處理 14
1.3 人工智能是新一代信息技術的核心 15
1.3.1 5G與人工智能的關系 16
1.3.2 云計算與人工智能的關系 16
1.3.3 大數(shù)據(jù)與人工智能的關系 17
1.3.4 物聯(lián)網(wǎng)與人工智能的關系 18
1.4 本章小結 18
1.5 作業(yè)與練習 19
第2章 數(shù)據(jù)標注的概念、工具與方法 20
2.1 數(shù)據(jù)標注的概念及其對人工智能發(fā)展的意義 20
2.1.1 全球數(shù)據(jù)的快速增長催生大數(shù)據(jù)產(chǎn)業(yè) 20
2.1.2 數(shù)據(jù)產(chǎn)業(yè)推動人工智能應用技術的發(fā)展 21
2.1.3 數(shù)據(jù)標注對于人工智能應用的意義 21
2.2 數(shù)據(jù)標注對象 22
2.2.1 數(shù)據(jù)集 22
2.2.2 語音數(shù)據(jù)集 24
2.2.3 圖像數(shù)據(jù)集 25
2.2.4 文本數(shù)據(jù)集 26
2.2.5 視頻數(shù)據(jù)集 27
2.3 數(shù)據(jù)標注工具與平臺 28
2.3.1 語音數(shù)據(jù)標注工具 28
2.3.2 圖像數(shù)據(jù)標注工具 30
2.3.3 視頻數(shù)據(jù)標注工具 31
2.3.4 文本數(shù)據(jù)標注工具 33
2.3.5 3D點云標注工具 34
2.4 典型數(shù)據(jù)標注技術 35
2.4.1 語音轉寫技術 35
2.4.2 人臉檢測和關鍵點檢測 36
2.4.3 圖像分割 36
2.4.4 視頻類標注 37
2.5 數(shù)據(jù)標注工程 37
2.5.1 數(shù)據(jù)采集 37
2.5.2 數(shù)據(jù)處理 40
2.5.3 數(shù)據(jù)標注 42
2.5.4 數(shù)據(jù)質檢 46
2.5.5 數(shù)據(jù)交付 46
2.5.6 數(shù)據(jù)驗收 47
2.6 本章小結 47
2.7 作業(yè)與練習 48
第3章 圖像數(shù)據(jù)標注 49
3.1 圖像數(shù)據(jù)標注簡介 49
3.1.1 圖像數(shù)據(jù)標注的目的與發(fā)展 49
3.1.2 圖像數(shù)據(jù)標注規(guī)范 50
3.1.3 場景分類型圖像數(shù)據(jù)標注 52
3.1.4 圖像數(shù)據(jù)標注形式分類 52
3.1.5 圖像任務和數(shù)據(jù)標注的關系 55
3.1.6 圖像數(shù)據(jù)標注的術語 56
3.2 關鍵點標注方法 56
3.2.1 關鍵點標注項目的應用及發(fā)展前景 56
3.2.2 關鍵點的標注內容 57
3.2.3 標注數(shù)據(jù)結果格式 58
3.2.4 關鍵點標注工具簡介 59
3.2.5 關鍵點標注案例分析 61
3.2.6 關鍵點標注難點及分析 63
3.3 標注框標注方法 63
3.3.1 框標注適合的場景 63
3.3.2 框標注工具簡介 65
3.3.3 標注方案及案例分析 67
3.3.4 標注框標注難點及分析 69
3.4 圖像區(qū)域標注方法 69
3.4.1 圖像區(qū)域標注適合的場景 69
3.4.2 圖像區(qū)域標注工具簡介 70
3.4.3 標注方案及案例分析 72
3.4.4 圖像區(qū)域標注難點及分析 74
3.5 本章小結 74
3.6 作業(yè)與練習 74
第4章 視頻數(shù)據(jù)標注 76
4.1 視頻數(shù)據(jù)標注簡介 76
4.1.1 視頻數(shù)據(jù)標注的意義 76
4.1.2 視頻數(shù)據(jù)標注任務 77
4.1.3 視頻源數(shù)據(jù)管理 77
4.2 視頻數(shù)據(jù)標注工具 78
4.2.1 視頻數(shù)據(jù)標注工具簡介 78
4.2.2 視頻數(shù)據(jù)標注流程 80
4.2.3 典型視頻數(shù)據(jù)標注方法 83
4.3 視頻數(shù)據(jù)標注案例解析 85
4.3.1 矩形框標注案例—人體追蹤屬性標注 85
4.3.2 矩形框標注案例—車輛標注 86
4.3.3 矩形框標注案例—商場監(jiān)控視頻數(shù)據(jù)標注 88
4.4.4 視頻幀標注案例—足球視頻數(shù)據(jù)標注 92
4.5 本章小結 94
4.6 作業(yè)與練習 95
第5章 語音數(shù)據(jù)標注 96
5.1 語音數(shù)據(jù)標注簡介 96
5.1.1 語音數(shù)據(jù)標注相關背景 96
5.1.2 語音信號基礎知識 97
5.2 語音數(shù)據(jù)標注概述 99
5.2.1 標注任務分類 99
5.2.2 常見語音數(shù)據(jù)異常 100
5.2.3 基本標注規(guī)范 102
5.3 典型開源語音數(shù)據(jù)標注工具 104
5.3.1 Praat語音學軟件 104
5.3.2 語音數(shù)據(jù)標注平臺 105
5.4 語音數(shù)據(jù)標注整體流程 110
5.4.1 項目背景與意義 110
5.4.2 語音項目整體規(guī)程 110
5.4.3 語音數(shù)據(jù)標注過程詳情 111
5.5 多樣化語音數(shù)據(jù)標注項目 115
5.5.1 智能家居兒童語音數(shù)據(jù)標注 115
5.5.2 智能音箱語音數(shù)據(jù)標注 117
5.5.3 智能客服語音拼音標注 119
5.5.4 演講語音數(shù)據(jù)標注 120
5.6 本章小結 122
5.7 作業(yè)與練習 122
第6章 文本數(shù)據(jù)標注 123
6.1 文本數(shù)據(jù)標注簡介 123
6.1.1 文本數(shù)據(jù)標注的發(fā)展與研究現(xiàn)狀 123
6.1.2 基本概念 124
6.1.3 流程介紹 127
6.1.4 交付格式 127
6.1.5 應用場景 127
6.2 文本數(shù)據(jù)標注工具 129
6.2.1 開源文本數(shù)據(jù)標注工具 129
6.2.2 專業(yè)文本數(shù)據(jù)標注工具及其標注場景 132
6.2.3 優(yōu)秀的標注工具應具備的條件 142
6.3 序列標注方法舉例 142
6.3.1 外賣成分識別標注案例 142
6.3.2 單品推廣文案標注案例 144
6.3.3 多音字關鍵詞提取標注案例 145
6.4 關系標注方法舉例—中文閱讀理解分析案例 147
6.5 屬性標注方法案例 148
6.5.1 語音文本判別標注案例 148
6.5.2 文本情感分析判別標注案例 150
6.6 本章小結 152
6.7 作業(yè)與練習 152
第7章 3D點云標注 153
7.1 3D點云標注簡介 153
7.1.1 點云的獲取方法 154
7.1.2 3D點云應用 156
7.1.3 3D點云的存儲方式及數(shù)據(jù)類型 158
7.1.4 3D點云典型數(shù)據(jù)集 159
7.2 3D點云標注工具 160
7.2.1 3D點云標注工具的主要功能 161
7.2.2 界面布局和操作 161
7.2.3 標注輸出格式 164
7.3 3D點云標注項目 164
7.3.1 項目背景 164
7.3.2 自動駕駛3D點云標注規(guī)范 164
7.3.3 3D點云標注流程 166
7.4 本章小結 169
7.5 作業(yè)與練習 169
第8章 工程化數(shù)據(jù)標注的組織管理 171
8.1 數(shù)據(jù)標注項目實施流程 171
8.1.1 數(shù)據(jù)標注項目 171
8.1.2 一般項目實施流程 173
8.1.3 數(shù)據(jù)標注項目實施流程 174
8.2 數(shù)據(jù)標注團隊組織架構 176
8.2.1 數(shù)據(jù)標注團隊組織類型 176
8.2.2 數(shù)據(jù)標注團隊組織架構 177
8.3 數(shù)據(jù)標注團隊角色分工 179
8.3.1 數(shù)據(jù)標注團隊角色分工之一 179
8.3.2 數(shù)據(jù)標注團隊角色分工之二 181
8.3.3 數(shù)據(jù)標注團隊角色分工總覽 182
8.4 數(shù)據(jù)標注團隊溝通和建設 184
8.4.1 項目相關方管理 184
8.4.2 數(shù)據(jù)標注團隊溝通 186
8.4.3 數(shù)據(jù)標注團隊建設 188
8.4.4 數(shù)據(jù)標注員培訓 189
8.5 國外數(shù)據(jù)產(chǎn)品生產(chǎn)組織方式案例 191
8.5.1 亞馬遜機械特克平臺 191
8.5.2 澳鵬平臺 192
8.6 本章小結 193
8.7 作業(yè)與練習 193
第9章 工程化數(shù)據(jù)標注的質量控制 194
9.1 質量控制 194
9.1.1 質量控制流程 194
9.1.2 控制流程細則 196
9.1.3 質量監(jiān)控 198
9.1.4 質量檢驗方法 199
9.2 質量標準 200
9.2.1 語音數(shù)據(jù)標注 200
9.2.2 圖像數(shù)據(jù)標注 202
9.2.3 文本數(shù)據(jù)標注 203
9.3 質檢與驗收 204
9.3.1 質檢流程 204
9.3.2 驗收原則 205
9.3.3 驗收報告 205
9.4 質量總結 209
9.5 數(shù)據(jù)質檢與驗收案例 210
9.5.1 人臉68點標注質檢案例 210
9.5.2 客服語音數(shù)據(jù)標注質檢案例 214
9.5.3 3~5歲中國兒童朗讀文本數(shù)據(jù)標注質檢案例 215
9.6 本章小結 216
9.7 作業(yè)與練習 216
第10章 工程化數(shù)據(jù)標注的進度管理 217
10.1 項目進度管理的定義和實踐 217
10.1.1 物理架構 217
10.1.2 項目進度管理的實踐 218
10.2 項目活動分解排序和估算時間 221
10.2.1 定義活動 221
10.2.2 排列活動順序 222
10.2.3 估算活動持續(xù)時間 224
10.3 制訂項目進度計劃 225
10.3.1 制訂項目進度計劃的常用技術 225
10.3.2 數(shù)據(jù)標注項目進度計劃實例 228
10.4 監(jiān)控進度計劃實施 230
10.4.1 監(jiān)控進度計劃實施的流程 230
10.4.2 監(jiān)控進度計劃實施的時機和方法 231
10.4.3 數(shù)據(jù)標注項目進度監(jiān)控實例 233
10.5 本章小結 236
10.6 作業(yè)與練習 236
第11章 工程化數(shù)據(jù)標注的系統(tǒng)平臺 238
11.1 數(shù)據(jù)標注系統(tǒng)概述 238
11.1.1 典型數(shù)據(jù)標注平臺系統(tǒng)架構 239
11.1.2 典型標注工具 240
11.2 數(shù)據(jù)標注平臺實例介紹 246
11.2.1 數(shù)加加Pro標注平臺的適用范圍 246
11.2.2 數(shù)加加Pro標注平臺的產(chǎn)品特性 246
11.2.3 數(shù)加加Pro標注平臺的產(chǎn)品架構 247
11.2.4 數(shù)加加Pro標注平臺的產(chǎn)品優(yōu)勢 248
11.3 本章小結 250
11.4 作業(yè)與練習 250
第12章 數(shù)據(jù)標注的發(fā)展趨勢 251
12.1 人工智能總體發(fā)展趨勢 251
12.1.1 主要國家和地區(qū)高度重視AI發(fā)展 251
12.1.2 有監(jiān)督學習仍是人工智能的主流 252
12.2 人工智能數(shù)據(jù)發(fā)展趨勢 254
12.2.1 人工智能數(shù)據(jù)需求 254
12.2.2 人工智能數(shù)據(jù)市場規(guī)模 258
12.2.3 人工智能數(shù)據(jù)需求特點 259
12.3 數(shù)據(jù)標注發(fā)展趨勢 259
12.3.1 定制化精細化發(fā)展 259
12.3.2 高度自動化發(fā)展 260
12.3.3 智能化流程化發(fā)展 262
12.3.4 重視安全與隱私保護 263
12.4 本章小結 264
12.5 作業(yè)與練習 264
附錄A 典型數(shù)據(jù)產(chǎn)品介紹 266
附錄B 開源數(shù)據(jù)集介紹與獲取 269
附錄C 人工智能的網(wǎng)絡學習資源 273
附錄D 人工智能的產(chǎn)業(yè)生態(tài)與技術圖譜 276
參考文獻 280