定 價:32 元
叢書名:大數據技術與應用專業(yè)規(guī)劃教材
- 作者:婁巖
- 出版時間:2016/12/1
- ISBN:9787302451815
- 出 版 社:清華大學出版社
- 中圖法分類:TP274
- 頁碼:154
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書是將大數據這一計算機前沿科學和基本應用有機結合的典范教材,全面介紹大數據和相關的基礎知識,由淺入深地剖析大數據的分析處理方法和技術手段,突出介紹大數據*的發(fā)展趨勢和技術成果。
本書的一大亮點是每章中都使用圖表對大數據與傳統(tǒng)數據處理方式進行對比。另外,本書注重啟發(fā)式的學習策略,便于讀者理解和掌握。全書每章均包括實際應用案例與關鍵詞注釋,方便讀者查閱和自學,同時配備習題和參考答案。
本書體系完整、內容豐富、注重應用、前瞻性強、適用性好,并有開放式的課程教學網站(http://www.cmu.edu.cn/computer)提供技術支持。
本書既可以作為普通高校大數據技術的基礎教材,也可以作為職業(yè)培訓教育及相關技術人員的參考用書。
1.本書圍繞大數據及其相關技術這一主題,采用深入淺出的敘述方式,簡明扼要地闡述了大數據和云計算等新興技術的基本理論、知識內容、關鍵技術和實際應用,為廣大高校師生提供大數據方向計算機公共基礎課程的基礎知識和大數據的應用方法、案例剖析。2.在編寫原則上,本書既維持了大數據相關信息技術本身應有的系統(tǒng)性和理論性,又著重體現(xiàn)應用性與針對性。本書可以用于啟發(fā)式教學模式,同時適合混合式教學模式,且便于學生理解和掌握。IT產業(yè)在過去50多年的發(fā)展歷程中,已經經歷過幾輪技術浪潮。如今,新的一股浪潮正在迅速朝我們涌來,并將觸及IT行業(yè)的許多方面,這就是大數據浪潮。其將比之前發(fā)生過的浪潮更大、觸及面更廣,并將對人們的工作和生活產生新的影響。因此,在面對大數據之際,各個專業(yè)的在校大學生迫切需要充實自己原有的IT知識結構,掌握兩個本領,一是掌握大數據基本技術與應用,使大數據為我們所用的本領;二是掌握挖掘數據之間隱藏的規(guī)律與關系,使大數據更好地服務于社會發(fā)展的本領。
前言
IT產業(yè)在其發(fā)展歷程中,經歷過幾輪技術浪潮。如今,大數據浪潮正在迅速地朝人們涌來,并將觸及到各個行業(yè)和生活的許多方面。大數據浪潮將比之前發(fā)生過的浪潮更大、觸及面更廣,給人們的工作和生活帶來的變化和影響更深刻。大數據的應用激發(fā)了一場思想風暴,也悄然地改變了人們的生活方式和思維習慣。大數據正以前所未有的速度顛覆人們探索世界的方法,引起工業(yè)、商業(yè)、醫(yī)學、軍事等領域的深刻變革。因此,在當前大數據浪潮的猛烈沖擊下,各個專業(yè)的高校大學生迫切需要充實和完善自己原有的IT知識結構,掌握兩個本領: 一是掌握大數據基本技術與應用,使大數據能夠為我所用; 二是挖掘數據之間隱藏的規(guī)律與關系,使大數據更好地服務于社會發(fā)展。為此,本書圍繞大數據及其相關技術這一主題,采用深入淺出的敘述方式,簡明扼要地闡述大數據及其相關最新技術的基本理論、關鍵技術和實際應用,目的是讓廣大師生以計算機公共基礎課程為知識載體,對大數據在各個領域的應用方法和相關知識有所了解。將大數據相關課程納入大學基礎教育中,必將引領學生更好地把握時代科學發(fā)展的脈搏和歷史賦予的機遇。在編寫原則上,本書既維持了大數據技術本身應有的系統(tǒng)性和理論性,又著重體現(xiàn)其在各個領域內的應用性與針對性。本書的一大亮點是每章都使用圖表對大數據與傳統(tǒng)數據處理方式進行對比。另外,本書注重啟發(fā)式的學習策略,便于讀者理解和掌握。全書每章均包括實際應用案例與關鍵詞注釋,方便讀者查閱和自學,同時配備習題和參考答案。全書在內容上共分成11章: 第1章大數據概論由婁巖編寫,第2章大數據采集及預處理由鄭琳琳編寫,第3章大數據分析概論由劉尚輝編寫,第4章大數據可視化由李靜編寫,第5章Hadoop概論由馬瑾編寫,第6章HDFS和Common概論由丁林編寫,第7章MapReduce概論由徐東雨編寫,第8章NoSQL概論由曹陽編寫,第9章Spark概論由龐東興編寫,第10章云計算與大數據由張志常編寫,第11章典型大數據解決方案由霍妍編寫。清華大學出版社對本書的出版做了精心策劃,充分論證,在此向所有參加編寫的同事們及幫助和指導過我們工作的朋友們表示衷心的感謝!由于編者水平有限,加之時間倉促,書中難免存在疏漏之處,懇請廣大讀者批評斧正。
婁巖2016年9月
目錄
前言Ⅰ
第1章大數據概論
1.1大數據技術簡介
1.1.1IT產業(yè)的發(fā)展簡史
1.1.2大數據的主要來源
1.1.3數據生成的3種主要方式
1.1.4大數據的特點
1.1.5大數據的處理流程
1.1.6大數據的數據格式
1.1.7大數據的基本特征
1.1.8大數據的應用領域
1.2大數據的技術架構
1.3大數據的整體技術
1.4大數據分析的4種典型工具簡介
1.5大數據未來發(fā)展趨勢
1.5.1數據資源化
1.5.2數據科學和數據聯(lián)盟的成立
1.5.3大數據隱私和安全問題
1.5.4開源軟件成為推動大數據發(fā)展的動力
1.5.5大數據在多方位改善人們的生活
本章小結
習題1
第2章大數據采集及預處理
2.1數據采集簡介
2.1.1數據采集
2.1.2數據采集的數據來源
2.1.3數據采集的技術方法
2.2大數據的預處理
2.3大數據采集及預處理的主要工具
本章小結
習題2
第3章大數據分析概論
3.1大數據分析簡介
3.1.1大數據分析
3.1.2大數據分析的基本方法
3.1.3大數據處理流程
3.2大數據分析的主要技術
3.2.1深度學習
3.2.2知識計算
3.3大數據分析處理系統(tǒng)簡介
3.3.1批量數據及處理系統(tǒng)
3.3.2流式數據及處理系統(tǒng)
3.3.3交互式數據及處理系統(tǒng)
3.3.4圖數據及處理系統(tǒng)
3.4大數據分析的應用
本章小結
習題3
第4章大數據可視化
4.1大數據可視化簡介
4.2大數據可視化工具Tableau
本章小結
習題4
第5章Hadoop概論
5.1Hadoop簡介
5.1.1Hadoop簡史
5.1.2Hadoop應用和發(fā)展趨勢
5.2Hadoop的架構與組成
5.2.1Hadoop架構介紹
5.2.2Hadoop組成模塊
5.3Hadoop應用分析
本章小結
習題5
第6章HDFS和Common概論
6.1HDFS簡介
6.1.1HDFS的相關概念
6.1.2HDFS特性
6.1.3HDFS體系結構
6.1.4HDFS的工作原理
6.1.5HDFS的相關技術
6.2Common簡介
本章小結
習題6
第7章MapReduce概論
7.1MapReduce簡介
7.1.1MapReduce
7.1.2MapReduce功能、特征和局限性
7.2Map和Reduce任務
7.3MapReduce架構和工作流程
7.3.1MapReduce的架構
7.3.2MapReduce的工作流程
本章小結
習題7
第8章NoSQL概論
8.1NoSQL簡介
8.1.1NoSQL的含義
8.1.2NoSQL的產生
8.1.3NoSQL的特點
8.2NoSQL技術基礎
8.2.1大數據的一致性策略
8.2.2大數據的分區(qū)與放置策略
8.2.3大數據的復制與容錯技術
8.2.4大數據的緩存技術
8.3NoSQL的類型
8.3.1鍵值存儲
8.3.2列存儲
8.3.3面向文檔存儲
8.3.4圖形存儲
8.4典型的NoSQL工具
8.4.1Redis
8.4.2Bigtable
8.4.3CouchDB
本章小結
習題8
第9章Spark概論
9.1Spark平臺
9.1.1Spark簡介
9.1.2Spark發(fā)展
9.1.3Scala語言
9.2Spark與Hadoop
9.2.1Hadoop的局限與不足
9.2.2Spark的優(yōu)點
9.2.3Spark速度比Hadoop快的原因分解
9.3Spark處理框架及其生態(tài)系統(tǒng)
9.3.1底層的Cluster Manager和Data Manager
9.3.2中間層的Spark Runtime
9.3.3高層的應用模塊
9.4Spark的應用
9.4.1Spark的應用場景
9.4.2應用Spark的成功案例
本章小結
習題9
第10章云計算與大數據
10.1云計算簡介
10.1.1云計算
10.1.2云計算與大數據的關系
10.1.3云計算基本特征
10.1.4云計算服務模式
10.2云計算核心技術
10.2.1虛擬化技術
10.2.2虛擬化軟件及應用
10.2.3資源池化技術
10.2.4云計算部署模式
10.3云計算應用案例
本章小結
習題10
第11章典型大數據解決方案
11.1Intel大數據
11.1.1Intel大數據解決方案
11.1.2Intel大數據相關案例
11.2百度大數據
11.2.1百度大數據引擎
11.2.2百度大數據 平臺
11.2.3相關應用
11.2.4百度預測的使用方法
11.3騰訊大數據
11.3.1騰訊大數據解決方案
11.3.2相關實例
本章小結
習題11
附錄A習題答案
參考文獻