本書主要介紹大數(shù)據(jù)與人工智能相關知識。全書共10章,包括大數(shù)據(jù)與人工智能概述,大數(shù)據(jù)與人工智能產(chǎn)業(yè)概況,大數(shù)據(jù)技術,人工智能技術,機器學習,強化學習、深度學習與集成學習,其他新興技術,人工智能與大數(shù)據(jù)人才概述,人工智能倫理,數(shù)據(jù)安全等內(nèi)容。本書通過在章前設定學習目標的方式,幫助讀者掌握各章的核心內(nèi)容,并以簡明扼要的圖文方式對概念和技術進行全面論述。本書編者編寫了相關的擴展案例,以在線文檔的方式供讀者擴展閱讀;此外,本書每章最后還提供一定數(shù)量的習題,以供讀者鞏固所學知識。
本書可作為高等院校計算機科學與技術、人工智能、軟件工程、物聯(lián)網(wǎng)工程、網(wǎng)絡空間安全等專業(yè)的教材,也可供大數(shù)據(jù)和人工智能領域的技術人員學習使用,還可作為非計算機相關專業(yè)的研究人員學習大數(shù)據(jù)與人工智能的參考用書。
(1)強調(diào)大數(shù)據(jù)和人工智能之間的密切關系:本書強調(diào)大數(shù)據(jù)與人工智能的相互依賴和互補關系。大數(shù)據(jù)為人工智能系統(tǒng)提供了訓練和改進的基礎,人工智能則為大數(shù)據(jù)的分析和應用提供了支持。
(2)提供全面的內(nèi)容覆蓋:本書涵蓋大數(shù)據(jù)和人工智能的核心概念、技術及應用。從基礎知識到前沿技術,從技術角度到道德、倫理和數(shù)據(jù)安全等角度,內(nèi)容全面而詳細。
(3)構建極具邏輯性和連貫性的知識體系:本書的內(nèi)容按照邏輯順序進行組織,從第2章開始,每章都建立在前一章的基礎上,形成了連貫的知識體系,這樣讀者能夠系統(tǒng)地理解大數(shù)據(jù)和人工智能的相關概念、技術及應用。
(4)講解深入淺出:本書以深入淺出的方式分享相關研究的發(fā)展歷史、理論基礎、經(jīng)典算法和前沿應用。無論是已經(jīng)初步了解大數(shù)據(jù)和人工智能的讀者還是從未接觸過的讀者,通過學習本書都能擴展已有的大數(shù)據(jù)和人工智能的數(shù)據(jù)科學認知。
韓博:
西安交通大學網(wǎng)絡空間安全學院黨總支書記、研究員,兼任共建于浙江的西交網(wǎng)絡空間安全研究院副院長。曾任西安交通大學網(wǎng)絡與信息中心副主任、新聞與新媒體學院黨總支副書記等行政職務,曾掛任原西安市工業(yè)和信息化委員會副主任、原西安市中小企業(yè)促進局副局長、原西安市大數(shù)據(jù)資源管理局副局長。曾主導西安市大數(shù)據(jù)產(chǎn)業(yè)發(fā)展局成立,負責了西安市“最多跑一次”信息化項目;牽頭西安市相關委辦局編著人工智能、航空航天、光電芯片、新材料、新能源、智能制造、信息技術、生物醫(yī)藥等領域產(chǎn)業(yè)發(fā)展規(guī)劃和分管領域的規(guī)劃編制工作,協(xié)助負責國內(nèi)領頭的互聯(lián)網(wǎng)企業(yè)在西安市落地;一線參與西安市軍民融合暨大數(shù)據(jù)產(chǎn)業(yè)發(fā)展工作。現(xiàn)為管曉宏院士網(wǎng)絡化系統(tǒng)工程三秦楷模團隊暨全國高校黃大年式教師團隊核心成員,從事自主可控的網(wǎng)絡安全芯片及系統(tǒng)、數(shù)據(jù)安全和隱私保護等前沿技術研究。
【章名目錄】
第 1章 大數(shù)據(jù)與人工智能概述 1
第 2章 大數(shù)據(jù)與人工智能產(chǎn)業(yè)概況 14
第3章 大數(shù)據(jù)技術 34
第4章 人工智能技術 97
第5章 機器學習 106
第6章 強化學習、深度學習與集成學習 135
第7章 其他新興技術 148
第8章 人工智能與大數(shù)據(jù)人才概述 168
第9章 人工智能倫理 181
第 10章 數(shù)據(jù)安全 193
【詳細目錄】
第 1章 大數(shù)據(jù)與人工智能概述 1
1.1 大數(shù)據(jù)的概念、特征與發(fā)展歷程 1
1.1.1 大數(shù)據(jù)的概念與特征 1
1.1.2 大數(shù)據(jù)的發(fā)展歷程 3
1.2 人工智能的概念與發(fā)展歷程 4
1.2.1 人工智能的概念 4
1.2.2 人工智能的發(fā)展歷程 5
1.3 數(shù)字時代的思維變革與技術支持 7
1.3.1 數(shù)字時代的挑戰(zhàn)與數(shù)據(jù)思維模式的轉(zhuǎn)變 7
1.3.2 發(fā)展基石:算子、算力 8
1.4 大數(shù)據(jù)與人工智能的關系 10
1.4.1 大數(shù)據(jù)與人工智能 10
1.4.2 小數(shù)據(jù)與人工智能 11
1.5 本章小結 12
1.6 習題 13
第 2章 大數(shù)據(jù)與人工智能產(chǎn)業(yè)概況 14
2.1 大數(shù)據(jù)與人工智能的應用現(xiàn)狀 14
2.1.1 應用領域 14
2.1.2 發(fā)展趨勢 24
2.2 我國相關產(chǎn)業(yè)的布局 25
2.2.1 大數(shù)據(jù)產(chǎn)業(yè)相關布局 26
2.2.2 人工智能產(chǎn)業(yè)相關布局 27
2.3 大數(shù)據(jù)與人工智能產(chǎn)業(yè)的發(fā)展機遇與面臨的挑戰(zhàn) 27
2.3.1 大數(shù)據(jù)與人工智能產(chǎn)業(yè)的發(fā)展機遇 28
2.3.2 大數(shù)據(jù)與人工智能產(chǎn)業(yè)面臨的挑戰(zhàn) 30
2.4 本章小結 33
2.5 習題 33
第3章 大數(shù)據(jù)技術 34
3.1 大數(shù)據(jù)采集 34
3.1.1 大數(shù)據(jù)來源 34
3.1.2 大數(shù)據(jù)采集設備 35
3.1.3 大數(shù)據(jù)采集方法 36
3.2 大數(shù)據(jù)預處理 40
3.2.1 數(shù)據(jù)預處理技術基本概述 40
3.2.2 大數(shù)據(jù)預處理流程 42
3.3 大數(shù)據(jù)存儲與管理 48
3.3.1 大數(shù)據(jù)存儲的概念 49
3.3.2 大數(shù)據(jù)存儲技術 64
3.4 大數(shù)據(jù)可視化 80
3.4.1 數(shù)據(jù)可視化概念 81
3.4.2 大數(shù)據(jù)可視化方法 81
3.4.3 可視化工具 84
3.5 典型大數(shù)據(jù)計算平臺 86
3.5.1 Hadoop 86
3.5.2 Apache Spark 90
3.5.3 Apache Storm 95
3.6 本章小結 96
3.7 習題 96
第4章 人工智能技術 97
4.1 人工智能技術的概念 97
4.2 自然語言處理 97
4.2.1 自然語言處理的定義 98
4.2.2 自然語言處理的原理 98
4.2.3 自然語言處理的發(fā)展歷史 98
4.2.4 自然語言處理的前景 99
4.3 機器視覺 100
4.3.1 機器視覺的定義 100
4.3.2 機器視覺的原理 101
4.3.3 機器視覺的發(fā)展歷史 101
4.3.4 機器視覺的前景 102
4.4 語音識別 103
4.4.1 語音識別的定義 103
4.4.2 語音識別的原理 103
4.4.3 語音識別的發(fā)展歷史 104
4.4.4 語音識別的前景 104
4.5 本章小結 105
4.6 習題 105
第5章 機器學習 106
5.1 機器學習概述 106
5.1.1 機器學習的定義 106
5.1.2 機器學習的發(fā)展歷史 107
5.1.3 機器學習算法分類 109
5.2 機器學習基本概念 110
5.2.1 樣本數(shù)據(jù)、數(shù)據(jù)集和特征 110
5.2.2 分類、回歸與聚類 111
5.3 機器學習模型評估與性能度量 112
5.3.1 模型評估 113
5.3.2 性能度量 115
5.4 機器學習算法 118
5.4.1 線性模型 119
5.4.2 決策樹 123
5.4.3 神經(jīng)網(wǎng)絡 126
5.4.4 支持向量機 129
5.4.5 樸素貝葉斯 130
5.4.6 聚類 131
5.4.7 降維與度量學習 132
5.4.8 特征選擇 133
5.5 本章小結 134
5.6 習題 134
第6章 強化學習、深度學習與集成學習 135
6.1 強化學習 135
6.1.1 強化學習要素 136
6.1.2 K-臂游戲機 137
6.1.3 蒙特卡洛強化學習 138
6.1.4 時序差分學習 138
6.1.5 強化學習的相關技術 140
6.2 深度學習 141
6.2.1 走進深度學習 141
6.2.2 前饋神經(jīng)網(wǎng)絡 141
6.2.3 卷積網(wǎng)絡 142
6.2.4 循環(huán)網(wǎng)絡 142
6.2.5 Transformer 142
6.3 集成學習 143
6.3.1 Boosting 144
6.3.2 Bagging 145
6.3.3 其他集成學習技術 146
6.4 本章小結 147
6.5 習題 147
第7章 其他新興技術 148
7.1 物聯(lián)網(wǎng) 148
7.1.1 物聯(lián)網(wǎng)的概念及背景 148
7.1.2 物聯(lián)網(wǎng)的應用 148
7.2 云計算 152
7.2.1 云計算的概念及背景 152
7.2.2 云計算的應用 158
7.3 圖計算 159
7.3.1 圖計算的概念及背景 159
7.3.2 圖計算的應用 160
7.4 邊緣計算 161
7.4.1 邊緣計算的概念及背景 161
7.4.2 邊緣計算的應用 162
7.5 區(qū)塊鏈 163
7.5.1 區(qū)塊鏈的概念及背景 163
7.5.2 區(qū)塊鏈的應用 165
7.6 本章小結 167
7.7 習題 167
第8章 人工智能與大數(shù)據(jù)人才概述 168
8.1 人工智能與大數(shù)據(jù)人才現(xiàn)狀分析 168
8.1.1 人才現(xiàn)狀分析 168
8.1.2 人工智能與大數(shù)據(jù)人才地圖 173
8.2 人工智能與大數(shù)據(jù)人才能力要求 175
8.2.1 人工智能人才要求 175
8.2.2 大數(shù)據(jù)人才要求 178
8.3 本章小結 180
8.4 習題 180
第9章 人工智能倫理 181
9.1 人工智能倫理概述 181
9.1.1 人工智能——人類新前沿 181
9.1.2 人工智能倫理的歷史經(jīng)驗 182
9.2 人工智能倫理具體內(nèi)容 183
9.2.1 人工智能倫理是什么 183
9.2.2 人工智能道德與權利 184
9.2.3 人工智能安全問題 189
9.3 構建友好人機交互關系 189
9.3.1 構建人工智能道德 190
9.3.2 為人工智能道德設計架構 190
9.3.3 確保人工智能系統(tǒng)的安全和保障 190
9.4 本章小結 192
9.5 習題 192
第 10章 數(shù)據(jù)安全 193
10.1 數(shù)據(jù)安全內(nèi)涵與重要性 193
10.1.1 數(shù)據(jù)安全內(nèi)涵 193
10.1.2 數(shù)據(jù)安全重要性 195
10.2 數(shù)據(jù)安全需求與挑戰(zhàn) 196
10.2.1 數(shù)據(jù)產(chǎn)業(yè)新生態(tài)及發(fā)展趨勢 196
10.2.2 產(chǎn)業(yè)升級和技術發(fā)展下的數(shù)據(jù)安全新挑戰(zhàn) 197
10.2.3 數(shù)據(jù)安全產(chǎn)業(yè)人才需求 199
10.3 數(shù)據(jù)安全應對策略 201
10.3.1 管理——法規(guī)、政策的建立與執(zhí)行 201
10.3.2 技術——數(shù)據(jù)全生命周期安全 203
10.4 本章小結 205
10.5 習題 205
后記 206