本書采用知識(shí)理論與實(shí)驗(yàn)案例相結(jié)合的方式展開講述。在相應(yīng)知識(shí)點(diǎn)闡述過程中,以人們?cè)谌粘9ぷ鳌W(xué)習(xí)中經(jīng)常碰到的具體問題作為案例,結(jié)合大數(shù)據(jù)挖掘和處理的基本理論與知識(shí),展示解決問題的思路和基本方法,從而加強(qiáng)讀者對(duì)大數(shù)據(jù)的理解和感性認(rèn)知,找到大數(shù)據(jù)應(yīng)用背后的基本原理和邏輯路徑。本書內(nèi)容主要包括:大數(shù)據(jù)概述、大數(shù)據(jù)思維、大數(shù)據(jù)支撐技術(shù)、大數(shù)據(jù)采集與預(yù)處理、大數(shù)據(jù)分析與挖掘、深度學(xué)習(xí)與人工智能、大數(shù)據(jù)可視化。
郭清溥,教授,現(xiàn)任河南財(cái)經(jīng)政法大學(xué)現(xiàn)代教育技術(shù)中心主任兼計(jì)算機(jī)實(shí)驗(yàn)教學(xué)中心主任。近五年來,共承擔(dān)本科生《大學(xué)計(jì)算機(jī)》、《Visual Basic程序設(shè)計(jì)》、《Excel數(shù)據(jù)分析與應(yīng)用》等課程的教學(xué)任務(wù)。發(fā)表教改論文、主持和參加省、學(xué)校教改項(xiàng)目8項(xiàng),出版國家級(jí)規(guī)劃教材3部、河南省統(tǒng)編教材6部,在國際學(xué)術(shù)會(huì)議、全國性學(xué)術(shù)會(huì)議和多類科技期刊上發(fā)表學(xué)術(shù)論文20余篇,主持和參與河南省科技攻關(guān)計(jì)劃項(xiàng)目、河南省軟科學(xué)計(jì)劃項(xiàng)目等各類科研項(xiàng)目9項(xiàng)。擔(dān)任全國高等學(xué)校計(jì)算機(jī)基礎(chǔ)教育研究會(huì)常務(wù)理事,財(cái)經(jīng)管理專業(yè)委員會(huì)委員, 文科專業(yè)委員會(huì)委員兼文史分委會(huì)副主任。河南省高等學(xué)校計(jì)算機(jī)教育研究會(huì)常務(wù)理事,基礎(chǔ)教育委員會(huì)主任。中國大學(xué)生計(jì)算機(jī)設(shè)計(jì)大賽組織委員會(huì)委員。中國大學(xué)生計(jì)算機(jī)設(shè)計(jì)大賽河南省級(jí)賽組織委員會(huì)秘書長等社會(huì)兼職
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)時(shí)代
1.1.1 大數(shù)據(jù)時(shí)代的數(shù)據(jù)特征
1.1.2 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)服務(wù)
1.2 大數(shù)據(jù)相關(guān)概念
1.2.1 大數(shù)據(jù)定義
1.2.2 大數(shù)據(jù)空間
1.2.3 大數(shù)據(jù)處理
1.2.4 大數(shù)據(jù)系統(tǒng)
1.3 大數(shù)據(jù)應(yīng)用現(xiàn)狀
1.3.1 金融與財(cái)務(wù)大數(shù)據(jù)應(yīng)用案例
1.3.2 其他領(lǐng)域的大數(shù)據(jù)應(yīng)用案例
1.4 大數(shù)據(jù)相關(guān)技術(shù)
1.4.1 物聯(lián)網(wǎng)技術(shù)
1.4.2 云技術(shù)
1.4.3 移動(dòng)互聯(lián)網(wǎng)技術(shù)
1.4.4 人工智能技術(shù)
1.5 大數(shù)據(jù)解決方案
1.6 大數(shù)據(jù)與企業(yè)數(shù)字化轉(zhuǎn)型
1.6.1 財(cái)務(wù)智能化轉(zhuǎn)型的機(jī)遇與挑戰(zhàn)
1.6.2 數(shù)字化轉(zhuǎn)型案例
1.7 大數(shù)據(jù)面臨的挑戰(zhàn)與發(fā)展展望
第2章 大數(shù)據(jù)思維
2.1 大數(shù)據(jù)思維的重要意義
2.2 數(shù)據(jù)核心思維
2.3 數(shù)據(jù)決策思維
2.4 數(shù)據(jù)全樣思維
2.5 數(shù)據(jù)容錯(cuò)思維
2.6 數(shù)據(jù)關(guān)聯(lián)思維
2.7 數(shù)據(jù)傳遞思維
2.8 數(shù)據(jù)乘法思維
第3章 大數(shù)據(jù)支撐技術(shù)
3.1 虛擬化技術(shù)
3.1.1 虛擬化技術(shù)概述
3.1.2 虛擬化技術(shù)的發(fā)展與分類
3.1.3 虛擬化包含的組件與方法
3.1.4 虛擬化的優(yōu)勢(shì)
3.1.5 虛擬化的應(yīng)用
3.1.6 虛擬化與云計(jì)算
3.1.7 存儲(chǔ)虛擬化
3.1.8 系統(tǒng)虛擬化
3.1.9 桌面虛擬化
3.1.10 應(yīng)用虛擬化
3.1.11 典型虛擬化產(chǎn)品
3.1.12 虛擬化實(shí)現(xiàn)案例
3.2 云計(jì)算
3.2.1 云計(jì)算概述
3.2.2 云計(jì)算產(chǎn)業(yè)鏈發(fā)展
3.2.3 云計(jì)算架構(gòu)與模式
3.2.4 云計(jì)算的關(guān)鍵技術(shù)
3.3 存儲(chǔ)技術(shù)
3.3.1 存儲(chǔ)介質(zhì)的發(fā)展
3.3.2 存儲(chǔ)體系架構(gòu)的發(fā)展
3.3.3 云存儲(chǔ)技術(shù)
3.4 開源大數(shù)據(jù)生態(tài)系統(tǒng)
3.4.1 Linux
3.4.2 Hadoop
3.4.3 基于Linux+Hadoop的大數(shù)據(jù)云系統(tǒng)構(gòu)建
3.5 Spark
3.6 數(shù)據(jù)庫與數(shù)據(jù)倉庫技術(shù)
3.6.1 大數(shù)據(jù)與數(shù)據(jù)庫的關(guān)系
3.6.2 數(shù)據(jù)庫技術(shù)概述
3.6.3 數(shù)據(jù)倉庫技術(shù)概述
第4章 大數(shù)據(jù)采集與預(yù)處理
4.1 數(shù)據(jù)爬取
4.1.1 數(shù)據(jù)爬取概述
4.1.2 數(shù)據(jù)爬取案例
4.2 數(shù)據(jù)變換與集成
4.2.1 數(shù)據(jù)變換與集成概述
4.2.2 數(shù)據(jù)變換案例
4.3 數(shù)據(jù)規(guī)約
4.3.1 數(shù)據(jù)規(guī)約概述
4.3.2 數(shù)據(jù)規(guī)約案例
4.4 數(shù)據(jù)清洗
4.4.1 數(shù)據(jù)清洗概述
4.4.2 數(shù)據(jù)清洗案例
4.5 數(shù)據(jù)管理平臺(tái)
第5章 大數(shù)據(jù)分析與挖掘
5.1 數(shù)據(jù)挖掘概述
5.1.1 數(shù)據(jù)挖掘起源
5.1.2 數(shù)據(jù)挖掘定義
5.1.3 數(shù)據(jù)挖掘技術(shù)與應(yīng)用
5.1.4 數(shù)據(jù)挖掘流程與模型
5.2 數(shù)據(jù)挖掘工具
5.2.1 Sklearn
5.2.2 Spark MLlib
5.3 數(shù)據(jù)挖掘算法
5.3.1 關(guān)聯(lián)
5.3.2 分類
5.3.3 聚類
第6章 深度學(xué)習(xí)與人工智能
6.1 深度學(xué)習(xí)概述
6.1.1 深度學(xué)習(xí)定義
6.1.2 深度學(xué)習(xí)應(yīng)用領(lǐng)域
6.2 人工智能與大數(shù)據(jù)
6.2.1 人工智能與大數(shù)據(jù)的區(qū)別
6.2.2 人工智能與大數(shù)據(jù)的關(guān)聯(lián)
6.3 深度學(xué)習(xí)工具
6.3.1 TensorFlow
6.3.2 PyTorch
6.4 深度學(xué)習(xí)案例
6.4.1 手寫數(shù)字識(shí)別案例
6.4.2 語音識(shí)別案例
6.4.3 人工智能與企業(yè)運(yùn)營數(shù)字化
6.4.4 人工智能在企業(yè)財(cái)務(wù)工作中的應(yīng)用
第7章 大數(shù)據(jù)可視化
7.1 數(shù)據(jù)可視化概述
7.1.1 數(shù)據(jù)可視化的概念
7.1.2 數(shù)據(jù)可視化市場與發(fā)展
7.1.3 數(shù)據(jù)可視化的特征與趨勢(shì)
7.2 可視化工具與應(yīng)用案例
7.2.1 Excel
7.2.2 Matplotlib
7.2.3 Highcharts
7.2.4 可視化平臺(tái)—— 浪潮BA