精品久久久无码21p发布,亚洲人妻无码在线,久久精品中文字幕久久

本書采用理論實(shí)戰(zhàn)的形式編寫，全面介紹了Hadoop大數(shù)據(jù)挖掘的相關(guān)知識(shí)。本書共分為13章，涵蓋的主要內(nèi)容有：集群及開發(fā)環(huán)境搭建；快速構(gòu)建一個(gè)Hadoop項(xiàng)目并線上運(yùn)行；Hadoop套件實(shí)戰(zhàn)；Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群；游戲玩家的用戶行為分析特征提��；Hadoop平臺(tái)管理與維護(hù)；Hadoop異常處理解決方案；初識(shí)Hadoop核心源碼；Hadoop通信機(jī)制和內(nèi)部協(xié)議；Hadoop分布式文件系統(tǒng)剖析；ELK實(shí)戰(zhàn)案例游戲應(yīng)用實(shí)時(shí)日志分析平臺(tái)；Kafka實(shí)戰(zhàn)案例實(shí)時(shí)處理游戲用戶數(shù)據(jù)；Hadoop拓展Kafka剖析。本書不但適合剛?cè)腴T的初學(xué)者系統(tǒng)學(xué)習(xí)Hadoop的各種基礎(chǔ)語(yǔ)法和開發(fā)技巧，而且也適合有多年開發(fā)經(jīng)驗(yàn)的開發(fā)者進(jìn)階提高。另外，本書也適合社會(huì)培訓(xùn)機(jī)構(gòu)和相關(guān)院校作為教材或者教學(xué)參考書。

前言　　大數(shù)據(jù)時(shí)代，數(shù)據(jù)的存儲(chǔ)與挖掘至關(guān)重要。企業(yè)在追求高可靠性、高擴(kuò)展性及高容錯(cuò)性的大數(shù)據(jù)處理平臺(tái)的同時(shí)還希望能夠降低成本，而Hadoop為實(shí)現(xiàn)這些需求提供了解決方案。
　　Hadoop在分布式計(jì)算與存儲(chǔ)上具有先天優(yōu)勢(shì)。它作為Apache軟件基金會(huì)的頂級(jí)開源項(xiàng)目，其版本迭代持續(xù)至今，而且已經(jīng)擁有一個(gè)非常活躍的社區(qū)和全球眾多開發(fā)者，并且成為了當(dāng)前非常流行的大數(shù)據(jù)處理平臺(tái)。很多公司，特別是互聯(lián)網(wǎng)公司，都紛紛開始使用或者已經(jīng)使用Hadoop來(lái)做海量數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)挖掘。
　　Hadoop簡(jiǎn)單易學(xué)，其學(xué)習(xí)曲線平緩且學(xué)習(xí)周期短。它的操作命令和Linux命令非常相似。一個(gè)熟悉Linux的開發(fā)者只需要短短的一周時(shí)間，就可以學(xué)會(huì)Hadoop開發(fā)，完成一個(gè)高可用集群的部署和高可用應(yīng)用程序的編寫。
　　面對(duì)Hadoop的普及和學(xué)習(xí)熱潮，筆者愿意分享自己多年的開發(fā)經(jīng)驗(yàn)，帶領(lǐng)讀者比較輕松地掌握Hadoop數(shù)據(jù)挖掘的相關(guān)知識(shí)。這便是筆者編寫本書的原因。本書使用通俗易懂的語(yǔ)言進(jìn)行講解，從基礎(chǔ)部署到集群的管理，再到底層設(shè)計(jì)等內(nèi)容均有涉及。通過閱讀本書，讀者可以較為輕松地掌握Hadoop大數(shù)據(jù)挖掘與分析的相關(guān)技術(shù)。
本書特色　　1．提供專業(yè)的配套教學(xué)視頻，高效、直觀　　筆者曾接受過極客學(xué)院的專業(yè)視頻制作指導(dǎo)，并在極客學(xué)院錄制過多期Hadoop和Kafka實(shí)戰(zhàn)教學(xué)視頻課程，得到了眾多學(xué)習(xí)者的青睞及好評(píng)。為了便于讀者更加高效、直觀地學(xué)習(xí)本書內(nèi)容，筆者特意為本書實(shí)戰(zhàn)部分的內(nèi)容錄制了配套教學(xué)視頻，讀者可以在教學(xué)視頻的輔助下學(xué)習(xí)，從而更加輕松地掌握Hadoop。
　　2．分享大量來(lái)自一線的開發(fā)經(jīng)驗(yàn)，貼近實(shí)際開發(fā)　　本書給出的代碼講解和實(shí)例大多數(shù)來(lái)自于筆者多年的教學(xué)積累和技術(shù)分享，幾乎都是得到了學(xué)習(xí)者一致好評(píng)的干貨。另外，筆者還是一名開源愛好者，編寫了業(yè)內(nèi)著名的Kafka Eagle監(jiān)控系統(tǒng)。本書第13章介紹了該系統(tǒng)的使用，以幫助讀者掌握如何監(jiān)控大數(shù)據(jù)集群的相關(guān)知識(shí)。
　　3．分享多個(gè)來(lái)自一線的實(shí)例，有很強(qiáng)的實(shí)用性　　本書精心挑選了多個(gè)實(shí)用性很強(qiáng)的例子，如Hadoop套件實(shí)戰(zhàn)、Hive編程、Hadoop平臺(tái)管理與維護(hù)、ELK實(shí)戰(zhàn)和Kafka實(shí)戰(zhàn)等。讀者不但可以從這些例子中學(xué)習(xí)和理解Hadoop及其套件的相關(guān)知識(shí)點(diǎn)，而且還可以將這些例子應(yīng)用于實(shí)際開發(fā)中。
　　4．講解通俗易懂，力爭(zhēng)觸類旁通，舉一反三　　本書用通俗易懂的語(yǔ)言講解，避免云山霧罩，讓讀者不知所云。書中在講解一些常用知識(shí)點(diǎn)時(shí)將Hadoop命令與Linux命令進(jìn)行了對(duì)比，便于熟悉Linux命令的讀者能夠迅速掌握Hadoop的操作命令。
本書內(nèi)容　　第1章集群及開發(fā)環(huán)境搭建　　本章介紹的主要內(nèi)容包括：環(huán)境準(zhǔn)備；安裝Hadoop；演示Hadoop版Hello World示例程序，以及搭建Hadoop開發(fā)環(huán)境。
　　第2章實(shí)戰(zhàn)：快速構(gòu)建一個(gè)Hadoop項(xiàng)目并線上運(yùn)行　　本章首先介紹了快速構(gòu)建項(xiàng)目工程的方法，如Maven和Java Project；然后介紹了分布式文件系統(tǒng)的操作命令，以及利用IDE提交MapReduce作業(yè)的相關(guān)知識(shí)；最后介紹了編譯應(yīng)用程序并打包，以及部署與調(diào)度等內(nèi)容。
　　第3章 Hadoop套件實(shí)戰(zhàn)　　本章介紹了Hadoop生態(tài)圈中常見的大數(shù)據(jù)套件的背景知識(shí)和使用方法，涵蓋Sqoop、Flume、HBase、Zeppelin、Drill及Spark等套件。
　　第4章 Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群　　本章主要介紹了Hive數(shù)據(jù)倉(cāng)庫(kù)的相關(guān)內(nèi)容：Hive底層設(shè)計(jì)組成；安裝和配置Hive；基于Hive應(yīng)用接口進(jìn)行編程；開源監(jiān)控工具Hive Cube。
　　第5章游戲玩家的用戶行為分析特征提取　　本章首先對(duì)Hadoop的基礎(chǔ)知識(shí)進(jìn)行了梳理；然后介紹了項(xiàng)目的背景和平臺(tái)架構(gòu)；接著對(duì)項(xiàng)目進(jìn)行了整體分析與指標(biāo)設(shè)計(jì)，并進(jìn)行了技術(shù)選型；最后對(duì)分析的指標(biāo)進(jìn)行了編碼實(shí)踐。
　　第6章 Hadoop平臺(tái)管理與維護(hù)　　本章介紹了Hadoop平臺(tái)管理與維護(hù)的重要方法。本章首先介紹了Hadoop分布式文件系統(tǒng)的特性，然后介紹了HDFS的基礎(chǔ)命令，并對(duì)NameNode進(jìn)行了解讀。另外，本章對(duì)Hadoop平臺(tái)維護(hù)時(shí)的常規(guī)操作，如節(jié)點(diǎn)管理、HDFS快照和安全模式等內(nèi)容也進(jìn)行了講解。
　　第7章 Hadoop異常處理解決方案　　本章介紹了Hadoop異常處理解決方案的幾個(gè)知識(shí)點(diǎn)。主要內(nèi)容包括：跟蹤日志；分析異常信息；利用搜索引擎檢索關(guān)鍵字；查看Hadoop JIRA；閱讀Hadoop源代碼。
　　本章最后以實(shí)戰(zhàn)案例的形式分析了幾種異常情況：?jiǎn)?dòng)HBase集群失��；HBase表查詢失敗；Spark的臨時(shí)數(shù)據(jù)不自動(dòng)清理等。
　　第8章初識(shí)Hadoop核心源碼　　本章首先介紹了Hadoop源碼基礎(chǔ)環(huán)境準(zhǔn)備及源代碼編譯；接著介紹了Hadoop的起源和兩代MapReduce框架間的差異；最后介紹了Hadoop的序列化機(jī)制。
　　第9章 Hadoop通信機(jī)制和內(nèi)部協(xié)議　　本章首先介紹了Hadoop通信模型和Hadoop RPC的特點(diǎn)；然后通過編碼實(shí)踐介紹了Hadoop RPC的使用，同時(shí)還介紹了與之類似的開源RPC框架；最后介紹了MapReduce的通信協(xié)議和RPC協(xié)議的實(shí)現(xiàn)過程。
　　第10章 Hadoop分布式文件系統(tǒng)剖析　　本章主要介紹了Hadoop分布式文件系統(tǒng)的設(shè)計(jì)特點(diǎn)、命令空間和節(jié)點(diǎn)、數(shù)據(jù)備份策略

你還可能感興趣

我要評(píng)論