處在大數(shù)據(jù)時(shí)代發(fā)展的重要節(jié)點(diǎn)上,面對(duì)數(shù)字化生活的新需求、數(shù)字化轉(zhuǎn)型的新格局及數(shù)字經(jīng)濟(jì)的新業(yè)態(tài),商務(wù)智能正在扮演著越來(lái)越重要的角色。商務(wù)智能通過(guò)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)從海量多模態(tài)數(shù)據(jù)中發(fā)現(xiàn)潛在、新穎和有用的知識(shí),以支持管理與決策。它是內(nèi)在技術(shù)的,同時(shí)也是面向管理決策問(wèn)題的。本書(shū)旨在把握前沿趨勢(shì),以基礎(chǔ)篇、方法篇、專(zhuān)題篇三大板塊的形式,為讀者提供一個(gè)技術(shù)與管理的融合視角,介紹和闡釋商務(wù)智能領(lǐng)域的主要知識(shí)內(nèi)涵,包括面向管理決策的商務(wù)智能基本原理、主流方法、應(yīng)用情境和發(fā)展前景,幫助讀者理解如何通過(guò)商務(wù)智能進(jìn)行大數(shù)據(jù)/人工智能分析和賦能,從而提升組織和個(gè)體的核心能力及其競(jìng)爭(zhēng)優(yōu)勢(shì)。
陳國(guó)青,清華大學(xué)經(jīng)濟(jì)管理學(xué)院教授。國(guó)家自然科學(xué)基金委大數(shù)據(jù)重大研究計(jì)劃指導(dǎo)專(zhuān)家組組長(zhǎng),教育部高等學(xué)校管理科學(xué)與工程類(lèi)專(zhuān)業(yè)教學(xué)指導(dǎo)委員會(huì)主任,國(guó)家信息化專(zhuān)家咨詢(xún)委員會(huì)成員,教育部新文科建設(shè)工作組成員。曾任國(guó)際模糊系統(tǒng)學(xué)會(huì)(IFSA)副主席,CNAIS創(chuàng)始主席,國(guó)際管理商學(xué)院聯(lián)盟(PIM)聯(lián)執(zhí)主席。曾多年擔(dān)任清華大學(xué)經(jīng)濟(jì)管理學(xué)院常務(wù)副院長(zhǎng)、學(xué)術(shù)委員會(huì)主任、講席教授。擔(dān)任/曾任中國(guó)信息經(jīng)濟(jì)學(xué)會(huì)等多個(gè)國(guó)內(nèi)一級(jí)學(xué)會(huì)副理事長(zhǎng)。曾主持國(guó)家自然科學(xué)基金委重大項(xiàng)目等多個(gè)國(guó)家級(jí)科研項(xiàng)目,以及多個(gè)國(guó)際合作項(xiàng)目、企業(yè)信息戰(zhàn)略管理項(xiàng)目等。
目 錄
基 礎(chǔ) 篇
第1章 引言 003
1.1 商務(wù)智能簡(jiǎn)介 004
1.2 商務(wù)智能與信息社會(huì) 007
1.2.1 信息技術(shù)提升信息社會(huì)發(fā)展水平 007
1.2.2 商務(wù)智能是信息社會(huì)的產(chǎn)物 010
1.2.3 商務(wù)智能是信息社會(huì)繁榮的推動(dòng)力 011
1.3 商務(wù)智能與企業(yè)管理 013
1.3.1 商務(wù)智能在企業(yè)管理中的作用 013
1.3.2 商務(wù)智能協(xié)助企業(yè)管理的方式 014
1.3.3 商務(wù)智能的商業(yè)價(jià)值 015
1.4 商務(wù)智能的方法 016
1.5 商務(wù)智能的數(shù)據(jù) 019
小結(jié) 020
思考與練習(xí) 021
第2章 商務(wù)智能應(yīng)用 022
2.1 制造領(lǐng)域應(yīng)用 023
2.2 金融領(lǐng)域應(yīng)用 026
2.3 通信領(lǐng)域應(yīng)用 029
2.4 生物和醫(yī)藥領(lǐng)域應(yīng)用 031
2.5 零售和營(yíng)銷(xiāo)領(lǐng)域應(yīng)用 033
2.6 移動(dòng)商務(wù)應(yīng)用 036
2.7 社會(huì)化商務(wù)應(yīng)用 037
小結(jié) 039
思考與練習(xí) 040
第3章 商務(wù)智能過(guò)程 041
3.1 數(shù)據(jù)庫(kù)與事務(wù)處理 043
3.1.1 數(shù)據(jù)庫(kù)與數(shù)據(jù)庫(kù)管理系統(tǒng) 043
3.1.2 在線事務(wù)處理 044
3.2 數(shù)據(jù)倉(cāng)庫(kù)與在線分析處理 045
3.2.1 從事務(wù)處理到分析處理 045
3.2.2 數(shù)據(jù)倉(cāng)庫(kù) 047
3.3 企業(yè)知識(shí)發(fā)現(xiàn) 050
3.3.1 OLAP與知識(shí)發(fā)現(xiàn) 051
3.3.2 企業(yè)內(nèi)部知識(shí)發(fā)現(xiàn) 052
3.3.3 企業(yè)外部知識(shí)發(fā)現(xiàn) 052
小結(jié) 054
思考與練習(xí) 054
第4章 數(shù)據(jù)平臺(tái) 055
4.1 數(shù)據(jù)處理技術(shù)演進(jìn) 056
4.2 數(shù)據(jù)倉(cāng)庫(kù)過(guò)程與體系結(jié)構(gòu) 058
4.3 數(shù)據(jù)集成、提取與轉(zhuǎn)換 060
4.3.1 數(shù)據(jù)提取 060
4.3.2 數(shù)據(jù)轉(zhuǎn)換 062
4.3.3 數(shù)據(jù)加載 063
4.3.4 ETL設(shè)計(jì)與開(kāi)發(fā) 063
4.4 數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)、管理與安全 064
4.4.1 數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)模式 064
4.4.2 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì) 066
4.4.3 數(shù)據(jù)倉(cāng)庫(kù)的邏輯數(shù)據(jù)模型 068
4.4.4 元數(shù)據(jù) 070
4.4.5 數(shù)據(jù)倉(cāng)庫(kù)的安全 072
4.5 分布式數(shù)據(jù)平臺(tái) 074
4.5.1 分布式數(shù)據(jù)平臺(tái)概念 074
4.5.2 分布式數(shù)據(jù)平臺(tái)與功能組件 075
4.6 云數(shù)據(jù)平臺(tái) 078
4.6.1 云數(shù)據(jù)平臺(tái)概念 078
4.6.2 云數(shù)據(jù)平臺(tái)與商務(wù)智能 079
小結(jié) 081
思考與練習(xí) 081
第5章 構(gòu)建商務(wù)智能環(huán)境 083
5.1 商務(wù)智能環(huán)境 084
5.1.1 確定數(shù)據(jù)可用的能力 084
5.1.2 數(shù)據(jù)挖掘的能力 085
5.1.3 用戶與系統(tǒng)交互的能力 085
5.2 商務(wù)智能組織 086
5.2.1 外包商務(wù)智能 088
5.2.2 內(nèi)給商務(wù)智能 089
5.2.3 商務(wù)智能組織成員 090
5.3 商務(wù)智能系統(tǒng) 090
5.3.1 商務(wù)智能基礎(chǔ)設(shè)施 090
5.3.2 商務(wù)智能系統(tǒng)軟件 091
5.3.3 商務(wù)智能系統(tǒng)產(chǎn)品 094
小結(jié) 096
思考與練習(xí) 096
方 法 篇
第6章 數(shù)據(jù)預(yù)處理 099
6.1 數(shù)據(jù)預(yù)處理簡(jiǎn)介 100
6.1.1 數(shù)據(jù)預(yù)處理的原因 100
6.1.2 數(shù)據(jù)預(yù)處理的目的 102
6.1.3 數(shù)據(jù)預(yù)處理的方法 102
6.2 數(shù)據(jù)清洗 103
6.2.1 缺失數(shù)據(jù)處理 103
6.2.2 噪聲數(shù)據(jù)處理 105
6.3 數(shù)據(jù)集成、規(guī)范與歸納 107
6.3.1 數(shù)據(jù)集成處理 107
6.3.2 數(shù)據(jù)規(guī)范化處理 108
6.3.3 數(shù)據(jù)歸納處理 110
6.4 數(shù)據(jù)消減 115
6.4.1 數(shù)據(jù)冗余清除 115
6.4.2 數(shù)據(jù)采樣 116
6.4.3 數(shù)據(jù)立方合計(jì) 117
6.4.4 數(shù)據(jù)屬性選取與生成 118
6.4.5 數(shù)據(jù)壓縮 120
6.4.6 數(shù)據(jù)離散化與概念分層 121
小結(jié) 124
思考與練習(xí) 125
第7章 關(guān)聯(lián)規(guī)則 126
7.1 關(guān)聯(lián)規(guī)則簡(jiǎn)介 127
7.2 關(guān)聯(lián)規(guī)則挖掘方法 130
7.3 關(guān)聯(lián)規(guī)則興趣性 133
7.4 關(guān)聯(lián)規(guī)則知識(shí)形式擴(kuò)展 136
7.4.1 廣義關(guān)聯(lián)規(guī)則 136
7.4.2 數(shù)量關(guān)聯(lián)規(guī)則 138
7.4.3 時(shí)態(tài)關(guān)聯(lián)規(guī)則 139
7.5 簡(jiǎn)單關(guān)聯(lián)規(guī)則 140
小結(jié) 143
思考與練習(xí) 144
第8章 分類(lèi)分析 145
8.1 分類(lèi)分析簡(jiǎn)介 146
8.2 決策樹(shù)分類(lèi) 147
8.2.1 決策樹(shù)構(gòu)建 148
8.2.2 決策樹(shù)剪枝 151
8.3 貝葉斯分類(lèi) 153
8.3.1 貝葉斯定理 153
8.3.2 簡(jiǎn)單貝葉斯分類(lèi)器 153
8.3.3 貝葉斯信念網(wǎng)絡(luò) 155
8.4 其他分類(lèi)方法 157
8.4.1 神經(jīng)元網(wǎng)絡(luò)分類(lèi) 157
8.4.2 支持向量機(jī)分類(lèi) 157
8.4.3 懶惰型分類(lèi)器 158
8.5 分類(lèi)準(zhǔn)確率 159
8.5.1 分類(lèi)準(zhǔn)確率比較與評(píng)估 159
8.5.2 提高分類(lèi)器的準(zhǔn)確率 164
小結(jié) 165
思考與練習(xí) 165
第9章 聚類(lèi)分析 167
9.1 聚類(lèi)分析簡(jiǎn)介 168
9.2 相似度與距離測(cè)度 169
9.3 聚類(lèi)分析方法 172
9.3.1 劃分方法 172
9.3.2 層次方法 173
9.3.3 基于密度的方法 175
9.3.4 基于網(wǎng)格的方法 175
9.3.5 基于模型的方法 176
9.4 k-means方法 176
9.5 DBSCAN方法 179
小結(jié) 184
思考與練習(xí) 185
第10章 社會(huì)網(wǎng)絡(luò)分析 186
10.1 社會(huì)網(wǎng)絡(luò)的中心性 187
10.1.1 度中心性 188
10.1.2 貼近中心性 188
10.1.3 中介中心性 189
10.2 社會(huì)網(wǎng)絡(luò)的權(quán)威 190
10.2.1 度權(quán)威 190
10.2.2 鄰近權(quán)威 191
10.2.3 等級(jí)權(quán)威 192
10.3 引用社會(huì)網(wǎng)絡(luò) 192
10.3.1 同引分析 192
10.3.2 引文耦合 193
10.4 社會(huì)網(wǎng)絡(luò)的鏈接分析 193
10.4.1 PageRank算法 194
10.4.2 HITS算法 196
10.5 社會(huì)網(wǎng)絡(luò)中的社區(qū) 198
小結(jié) 199
思考與練習(xí) 200
第11章 概率圖模型 201
11.1 概率圖模型簡(jiǎn)介 202
11.2 樸素貝葉斯模型 203
11.3 隱馬爾可夫模型 205
11.3.1 馬爾可夫過(guò)程 205
11.3.2 隱馬爾可夫建模與處理 206
11.4 高斯混合模型 209
11.5 LDA模型 211
小結(jié) 214
思考與練習(xí) 215
第12章 神經(jīng)元網(wǎng)絡(luò) 216
12.1 神經(jīng)元網(wǎng)絡(luò)簡(jiǎn)介 217
12.2 前饋神經(jīng)元網(wǎng)絡(luò) 218
12.2.1 神經(jīng)元 218
12.2.2 激活函數(shù) 218
12.2.3 前饋神經(jīng)元網(wǎng)絡(luò) 220
12.3 卷積神經(jīng)元網(wǎng)絡(luò) 222
12.3.1 卷積層 222
12.3.2 匯聚層 224
12.3.3 卷積神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu) 225
12.3.4 典型卷積神經(jīng)元網(wǎng)絡(luò) 225
12.4 循環(huán)神經(jīng)元網(wǎng)絡(luò) 226
12.4.1 循環(huán)神經(jīng)元網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu) 227
12.4.2 長(zhǎng)/短期記憶網(wǎng)絡(luò) 228
12.4.3 門(mén)控循環(huán)單元網(wǎng)絡(luò) 230
12.5 注意力機(jī)制 231
12.5.1 多頭注意力模型 232
12.5.2 自注意力模型 232
小結(jié) 234
思考與練習(xí) 234
第13章 多模態(tài)數(shù)據(jù)表征 236
13.1 文本表征 237
13.1.1 詞袋模型 237
13.1.2 Word2vec模型 239
13.1.3 Doc2vec模型 240
13.1.4 主題模型 241
13.2 圖像表征 243
13.3 音頻表征 244
13.4 視頻表征 247
小結(jié) 248
思考與練習(xí) 248
專(zhuān) 題 篇
第14章 信息提取與洞察 251
14.1 “大數(shù)據(jù)—小數(shù)據(jù)”問(wèn)題概述 252
14.2 代表性信息提取 254
14.2.1 代表性評(píng)估測(cè)度 254
14.2.2 代表性信息提取方法 255
14.3 一致性信息提取 257
14.3.1 一致性評(píng)估測(cè)度 258
14.3.2 一致性信息提取方法 259
14.4 多樣性信息提取 260
14.4.1 多樣性評(píng)估測(cè)度 261
14.4.2 多樣性信息提取方法 262
小結(jié) 263
思考與練習(xí) 264
第15章 關(guān)聯(lián)分類(lèi) 265
15.1 生成分類(lèi)關(guān)聯(lián)規(guī)則 266
15.2 分類(lèi)關(guān)聯(lián)規(guī)則剪枝 269
15.2.1 后剪枝方式 269
15.2.2 先剪枝方式 272
15.3 構(gòu)建分類(lèi)器 275
15.3.1 單一規(guī)則分類(lèi)器 275
15.3.2 多規(guī)則分類(lèi)器 277
15.4 混合型關(guān)聯(lián)分類(lèi) 278
15.5 GARC方法解析 278
15.5.1 GARC思路與算法框架 279
15.5.2 數(shù)據(jù)實(shí)驗(yàn)與方法比較 282
小結(jié) 285
思考與練習(xí) 286
第16章 不確定性知識(shí)發(fā)現(xiàn) 288
16.1 不確定性信息表達(dá) 289
16.2 分區(qū)中的邊界問(wèn)題 296
16.3 數(shù)據(jù)間的部分隸屬性 300
16.4 不完整數(shù)據(jù)依賴(lài) 303
小結(jié) 307
思考與練習(xí) 307
第17章 智能推薦 309
17.1 信息推薦方法 310
17.1.1 推薦系統(tǒng)概述 310
17.1.2 協(xié)同過(guò)濾推薦方法 312
17.1.3 推薦系統(tǒng)評(píng)測(cè)指標(biāo) 314
17.1.4 消費(fèi)者信息搜索過(guò)程中的推薦 316
17.2 多模態(tài)信息推薦 319
17.2.1 多模態(tài)信息表征 320
17.2.2 多視圖信息整合 322
17.2.3 商品推薦場(chǎng)景 322
17.3 序列推薦 323
17.4 捆綁推薦 325
小結(jié) 328
思考與練習(xí) 328
第18章 商務(wù)智能的經(jīng)濟(jì)社會(huì)影響與發(fā)展 329
18.1 商務(wù)智能與管理決策 330
18.2 商務(wù)智能的發(fā)展趨勢(shì) 332
18.2.1 移動(dòng)商務(wù)智能 332
18.2.2 人工智能賦能 333
18.2.3 數(shù)據(jù)安全與隱私保護(hù) 334
18.2.4 數(shù)據(jù)治理 336
小結(jié) 337
思考與練習(xí) 338
參考文獻(xiàn) 339
索引詞檢索目錄 362