本書(shū)面向Hadoop大數(shù)據(jù)技術(shù),通過(guò)大量實(shí)例,循序漸進(jìn)地介紹了Hadoop生態(tài)系統(tǒng)常用組件的安裝及使用方法。 全書(shū)共15個(gè)項(xiàng)目,主要內(nèi)容包括:在虛擬機(jī)中安裝CentOS7、安裝Hadoop偽分布、配置平臺(tái)基礎(chǔ)環(huán)境、搭建Zookeeper分布式集群、搭建HDFS分布式集群、搭建YARN分布式集群、Hadoop分布式計(jì)算
本書(shū)較為系統(tǒng)地講解了大數(shù)據(jù)處理平臺(tái)Hadoop和Spark生態(tài)系統(tǒng)的相關(guān)技術(shù)原理、使用方法和開(kāi)發(fā)技術(shù),全書(shū)共11章,主要包括大數(shù)據(jù)技術(shù)概述、大數(shù)據(jù)處理平臺(tái)Hadoop、分布式文件系統(tǒng)HDFS、分布式計(jì)算框架MapReduce、Hadoop的發(fā)展和演化、數(shù)據(jù)倉(cāng)庫(kù)Hive、分布式數(shù)據(jù)庫(kù)HBase、Spark的基本概念和整體
本書(shū)以企業(yè)真實(shí)崗位的實(shí)際應(yīng)用和操作為主要背景,以飲料灌裝智能產(chǎn)線實(shí)訓(xùn)系統(tǒng)為載體,設(shè)置了七個(gè)學(xué)習(xí)情境,包括供料站調(diào)試、翻轉(zhuǎn)站調(diào)試、灌裝站調(diào)試、機(jī)器人站調(diào)試、立體庫(kù)站調(diào)試、智能生產(chǎn)線綜合調(diào)試、智能生產(chǎn)線維護(hù)等內(nèi)容。本書(shū)按照"收集信息、制訂計(jì)劃、做出決策、實(shí)施計(jì)劃、檢查控制、評(píng)價(jià)反饋”的教學(xué)過(guò)程組織內(nèi)容,并配有相關(guān)操作的視頻
本書(shū)講解了大數(shù)據(jù)查詢(xún)技術(shù)涉及的知識(shí)體系,主要是Hadoop生態(tài)圈體系中的各個(gè)組件,包括HDFS、Hive、Presto、HBase、Phoenix、Elasticsearch和dbeaver。本書(shū)采用項(xiàng)目任務(wù)驅(qū)動(dòng)的方式進(jìn)行講解,覆蓋組件的工作原理、部署安裝和使用方法,力求幫助讀者更有效地動(dòng)手實(shí)踐。
"本書(shū)結(jié)合國(guó)內(nèi)外**的研究成果和實(shí)踐經(jīng)驗(yàn),融合傳統(tǒng)紙質(zhì)媒體和新興數(shù)字媒體,系統(tǒng)地介紹大數(shù)據(jù)治理的基本概念、原則、框架、技術(shù)、工具和實(shí)踐等內(nèi)容,注重理論與實(shí)踐相結(jié)合,注重案例分析和應(yīng)用演練,幫助讀者全面掌握大數(shù)據(jù)治理的核心知識(shí)和方法。全書(shū)共分兩篇16章:第一篇大數(shù)據(jù)治理理論包括總論、大數(shù)據(jù)架構(gòu)管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的獲取、傳輸和存儲(chǔ)融入了人類(lèi)生產(chǎn)生活的方方面面,而大數(shù)據(jù)核心價(jià)值體現(xiàn)為人們對(duì)數(shù)據(jù)的分析、理解與應(yīng)用。面對(duì)如此海量、高速和異構(gòu)的數(shù)據(jù),僅靠人類(lèi)的認(rèn)知和理解能力遠(yuǎn)不能滿(mǎn)足價(jià)值發(fā)現(xiàn)的需要。同時(shí),計(jì)算機(jī)總是針對(duì)最細(xì)粒度數(shù)據(jù)進(jìn)行迭代優(yōu)化的求解模式在特定場(chǎng)景下也不能滿(mǎn)足數(shù)據(jù)分析的時(shí)限需求。粒計(jì)算作為一種模擬人類(lèi)知
"本書(shū)從職業(yè)院校學(xué)生理論、技能水平和企業(yè)應(yīng)用實(shí)際出發(fā),按照項(xiàng)目引領(lǐng)、任務(wù)驅(qū)動(dòng)的體例編寫(xiě),將自動(dòng)化生產(chǎn)線安裝與調(diào)試相關(guān)的知識(shí)點(diǎn)和實(shí)操技能點(diǎn)分解到不同項(xiàng)目中,力爭(zhēng)教師與學(xué)生真正實(shí)現(xiàn)“教、學(xué)、做一體化”。本書(shū)共設(shè)置了7個(gè)實(shí)訓(xùn)項(xiàng)目,14個(gè)實(shí)訓(xùn)任務(wù),每個(gè)項(xiàng)目以工作過(guò)程為導(dǎo)向、以任務(wù)為驅(qū)動(dòng),引導(dǎo)學(xué)生認(rèn)識(shí)YL-335B自動(dòng)化生產(chǎn)線,
復(fù)雜性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的本質(zhì)特性,也是當(dāng)前大數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理面臨的核心挑戰(zhàn)。本書(shū)圍繞大數(shù)據(jù)的復(fù)雜性開(kāi)展研究,旨在探索當(dāng)前數(shù)據(jù)資源建設(shè)與利用過(guò)程中面臨的挑戰(zhàn)和技術(shù)難題,促進(jìn)數(shù)據(jù)價(jià)值的充分釋放。全書(shū)分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數(shù)據(jù)控制技術(shù)的基本概念和任務(wù)定位,以及國(guó)內(nèi)外的研究進(jìn)展;
本書(shū)分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類(lèi)、線性回歸等內(nèi)容,每章都以一個(gè)具體的實(shí)際問(wèn)題開(kāi)始,其主要目的是激發(fā)對(duì)某一特定大數(shù)據(jù)分析技術(shù)的研究。接下來(lái)探討其背后的數(shù)學(xué)原理——包括重要的定義、輔助陳述和得出的結(jié)論。案例研究有助于將所學(xué)知識(shí)應(yīng)用于跨學(xué)科的環(huán)境中,包括對(duì)逐步任務(wù)的描述和有用的提示。每章之后都配有習(xí)題
討論大數(shù)據(jù)技術(shù)時(shí),首先需要了解大數(shù)據(jù)的基本處理流程,主要包括數(shù)據(jù)采集、存儲(chǔ)、分析和結(jié)果呈現(xiàn)等環(huán)節(jié)。數(shù)據(jù)無(wú)處不在,互聯(lián)網(wǎng)網(wǎng)站、政務(wù)系統(tǒng)、零售系統(tǒng)、辦公系統(tǒng)、自動(dòng)化生產(chǎn)系統(tǒng)、監(jiān)控?cái)z像頭、傳感器等,每時(shí)每刻都在不斷產(chǎn)生數(shù)據(jù)。這些分散在各處的數(shù)據(jù),需要采用相應(yīng)的設(shè)備或軟件進(jìn)行采集。采集到的數(shù)據(jù)通常無(wú)法直接用于后續(xù)的數(shù)據(jù)分析,因