國之重器出版工程 大數(shù)據(jù)處理平臺
定 價(jià):89 元
叢書名:學(xué)術(shù)中國·大數(shù)據(jù)國之重器出版工程
- 作者:宋杰 著
- 出版時(shí)間:2017/12/1
- ISBN:9787115466891
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:219
- 紙張:膠版紙
- 版次:1
- 開本:小16開
本書從數(shù)據(jù)查詢、數(shù)據(jù)分析和迭代計(jì)算平臺3個(gè)方面對大數(shù)據(jù)處理平臺的體系結(jié)構(gòu)、基本原理、主流技術(shù)、國內(nèi)外研究進(jìn)展和成果進(jìn)行了全面、深入的闡述,對大數(shù)據(jù)實(shí)時(shí)處理平臺的架構(gòu)和核心技術(shù)進(jìn)行了展望。企業(yè)技術(shù)人員可參考本書選擇合適的技術(shù)構(gòu)建大數(shù)據(jù)處理平臺或?qū)ΜF(xiàn)有平臺進(jìn)行優(yōu)化;高校院所的科研人員可參考本書了解大數(shù)據(jù)管理的基本原理和現(xiàn)有研究成果;學(xué)生讀者可通過學(xué)習(xí)本書全面了解大數(shù)據(jù)處理平臺。同時(shí),本書也適用于對大數(shù)據(jù)技術(shù)擁有濃厚興趣的讀者。
適讀人群 :大數(shù)據(jù)相關(guān)領(lǐng)域的研究生、從事大數(shù)據(jù)研究的讀者、以及對于大數(shù)據(jù)處理平臺的設(shè)計(jì)人員和架構(gòu)人員
本書結(jié)合筆者自身的研究經(jīng)驗(yàn),從“學(xué)術(shù)研究”和“系統(tǒng)實(shí)現(xiàn)”相結(jié)合的角度,對平臺進(jìn)行全面的介紹,書中既有原理,又有學(xué)術(shù)前沿綜述,但不包含使用方法、編程技術(shù)、構(gòu)建步驟等類似工具書的內(nèi)容。對于大數(shù)據(jù)相關(guān)領(lǐng)域的研究生、對于從事大數(shù)據(jù)研究的讀者、以及對于大數(shù)據(jù)處理平臺的設(shè)計(jì)人員和架構(gòu)人員,本書均具有吸引力和獨(dú)特之處。
宋杰,博士,副教授,現(xiàn)任職于東北大學(xué)軟件學(xué)院云計(jì)算技術(shù)研究所。2003年畢業(yè)于東北大學(xué),獲學(xué)士學(xué)位,之后碩博連讀,就讀于東北大學(xué)計(jì)算機(jī)軟件與理論專業(yè)。2008年獲博士學(xué)位,隨后在法國圖盧茲第三大學(xué)的IRIT實(shí)驗(yàn)室由法方資助從事兩年的海外研究工作,2010年經(jīng)人才引進(jìn)方式回國任教,2013-2015年入東軟集團(tuán)博士后工作站。近6年,以**作者發(fā)表期刊論文30篇,其中SCI期刊7篇,《計(jì)算機(jī)學(xué)報(bào)》6篇,《軟件學(xué)報(bào)》6篇;以**發(fā)明人申請專利6項(xiàng),軟件著作權(quán)3項(xiàng),維護(hù)開源項(xiàng)目2項(xiàng);主持縱向科研項(xiàng)目10項(xiàng),其中國家自然科學(xué)基金青年科學(xué)基金項(xiàng)目、國家自認(rèn)科學(xué)基金面上項(xiàng)目、國家自然科學(xué)基金重點(diǎn)(子項(xiàng))項(xiàng)目各1項(xiàng),博士后基金項(xiàng)目1項(xiàng),省部級項(xiàng)目6項(xiàng),橫向科研項(xiàng)目3項(xiàng);與世界500強(qiáng)企業(yè)聯(lián)手開發(fā)智能家電核心算法并得以應(yīng)用,牽頭制定國家云計(jì)算相關(guān)標(biāo)準(zhǔn)一項(xiàng)。
主要研究方向?yàn)榇髷?shù)據(jù)存儲(chǔ)與管理、高效能計(jì)算和機(jī)器學(xué)習(xí)應(yīng)用。
第1 章 體系結(jié)構(gòu)
1.1 集群系統(tǒng)
1.1.1 Hadoop YARN
1.1.2 Apache Mesos
1.1.3 Apache ZooKeeper
1.2 文件系統(tǒng)
1.2.1 Google 分布式文件系統(tǒng)
1.2.2 Hadoop 分布式文件系統(tǒng)
1.2.3 其他分布式文件系統(tǒng)
1.3 NoSQL 和NewSQL
1.3.1 NoSQL 數(shù)據(jù)庫系統(tǒng)
1.3.2 NewSQL 數(shù)據(jù)庫系統(tǒng)
1.4 計(jì)算模型
1.4.1 MapReduce 編程模型
1.4.2 Spark 并行計(jì)算框架
參考文獻(xiàn)
第2 章 查詢平臺
2.1 基本原理
2.1.1 系統(tǒng)簡介
2.1.2 架構(gòu)組織
2.2 現(xiàn)有研究
2.2.1 大數(shù)據(jù)精確查詢系統(tǒng)
2.2.2 大數(shù)據(jù)近似查詢系統(tǒng)
2.2.3 大數(shù)據(jù)多維查詢系統(tǒng)
2.3 近期成果
2.3.1 Haery
2.3.2 Probery
參考文獻(xiàn)
第3 章 分析平臺
3.1 基本原理
3.1.1 OLAP 技術(shù)
3.1.2 系統(tǒng)架構(gòu)
3.2 現(xiàn)有研究
3.2.1 傳統(tǒng)OLAP 優(yōu)化方法
3.2.2 OLAP 存儲(chǔ)計(jì)算優(yōu)化
3.2.3 大數(shù)據(jù)OLAP 引擎
3.3 近期成果
3.3.1 DOLAP
3.3.2 MapReduce OLAP
3.3.3 HaoLap
參考文獻(xiàn)
第4 章 迭代計(jì)算平臺
4.1 基本原理
4.2 現(xiàn)有研究
4.2.1 MapReduce 迭代計(jì)算框架
4.2.2 其他迭代計(jì)算框架
4.2.3 增量迭代計(jì)算
4.2.4 迭代算法優(yōu)化
4.3 近期成果
4.3.1 增量迭代計(jì)算模型
4.3.2 歸并迭代計(jì)算
4.3.3 迭代初始點(diǎn)選擇
參考文獻(xiàn)
第5 章 實(shí)時(shí)處理平臺
5.1 基本原理
5.2 現(xiàn)有研究
5.2.1 Lambda 架構(gòu)
5.2.2 隊(duì)列
5.2.3 流處理
5.2.4 數(shù)據(jù)流處理框架
5.3 近期成果
5.3.1 實(shí)時(shí)數(shù)據(jù)遷移模型
5.3.2 數(shù)據(jù)源層的優(yōu)化方法
5.3.3 遷移系統(tǒng)設(shè)計(jì)
參考文獻(xiàn)
后記