本書講解了大數(shù)據(jù)查詢技術(shù)涉及的知識體系,主要是Hadoop生態(tài)圈體系中的各個組件,包括HDFS、Hive、Presto、HBase、Phoenix、Elasticsearch和dbeaver。本書采用項目任務(wù)驅(qū)動的方式進(jìn)行講解,覆蓋組件的工作原理、部署安裝和使用方法,力求幫助讀者更有效地動手實踐。
"本書結(jié)合國內(nèi)外**的研究成果和實踐經(jīng)驗,融合傳統(tǒng)紙質(zhì)媒體和新興數(shù)字媒體,系統(tǒng)地介紹大數(shù)據(jù)治理的基本概念、原則、框架、技術(shù)、工具和實踐等內(nèi)容,注重理論與實踐相結(jié)合,注重案例分析和應(yīng)用演練,幫助讀者全面掌握大數(shù)據(jù)治理的核心知識和方法。全書共分兩篇16章:第一篇大數(shù)據(jù)治理理論包括總論、大數(shù)據(jù)架構(gòu)管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理
在大數(shù)據(jù)時代,數(shù)據(jù)的獲取、傳輸和存儲融入了人類生產(chǎn)生活的方方面面,而大數(shù)據(jù)核心價值體現(xiàn)為人們對數(shù)據(jù)的分析、理解與應(yīng)用。面對如此海量、高速和異構(gòu)的數(shù)據(jù),僅靠人類的認(rèn)知和理解能力遠(yuǎn)不能滿足價值發(fā)現(xiàn)的需要。同時,計算機(jī)總是針對最細(xì)粒度數(shù)據(jù)進(jìn)行迭代優(yōu)化的求解模式在特定場景下也不能滿足數(shù)據(jù)分析的時限需求。粒計算作為一種模擬人類知
"本書從職業(yè)院校學(xué)生理論、技能水平和企業(yè)應(yīng)用實際出發(fā),按照項目引領(lǐng)、任務(wù)驅(qū)動的體例編寫,將自動化生產(chǎn)線安裝與調(diào)試相關(guān)的知識點和實操技能點分解到不同項目中,力爭教師與學(xué)生真正實現(xiàn)“教、學(xué)、做一體化”。本書共設(shè)置了7個實訓(xùn)項目,14個實訓(xùn)任務(wù),每個項目以工作過程為導(dǎo)向、以任務(wù)為驅(qū)動,引導(dǎo)學(xué)生認(rèn)識YL-335B自動化生產(chǎn)線,
復(fù)雜性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的本質(zhì)特性,也是當(dāng)前大數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理面臨的核心挑戰(zhàn)。本書圍繞大數(shù)據(jù)的復(fù)雜性開展研究,旨在探索當(dāng)前數(shù)據(jù)資源建設(shè)與利用過程中面臨的挑戰(zhàn)和技術(shù)難題,促進(jìn)數(shù)據(jù)價值的充分釋放。全書分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數(shù)據(jù)控制技術(shù)的基本概念和任務(wù)定位,以及國內(nèi)外的研究進(jìn)展;
本書分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類、線性回歸等內(nèi)容,每章都以一個具體的實際問題開始,其主要目的是激發(fā)對某一特定大數(shù)據(jù)分析技術(shù)的研究。接下來探討其背后的數(shù)學(xué)原理——包括重要的定義、輔助陳述和得出的結(jié)論。案例研究有助于將所學(xué)知識應(yīng)用于跨學(xué)科的環(huán)境中,包括對逐步任務(wù)的描述和有用的提示。每章之后都配有習(xí)題
討論大數(shù)據(jù)技術(shù)時,首先需要了解大數(shù)據(jù)的基本處理流程,主要包括數(shù)據(jù)采集、存儲、分析和結(jié)果呈現(xiàn)等環(huán)節(jié)。數(shù)據(jù)無處不在,互聯(lián)網(wǎng)網(wǎng)站、政務(wù)系統(tǒng)、零售系統(tǒng)、辦公系統(tǒng)、自動化生產(chǎn)系統(tǒng)、監(jiān)控攝像頭、傳感器等,每時每刻都在不斷產(chǎn)生數(shù)據(jù)。這些分散在各處的數(shù)據(jù),需要采用相應(yīng)的設(shè)備或軟件進(jìn)行采集。采集到的數(shù)據(jù)通常無法直接用于后續(xù)的數(shù)據(jù)分析,因
本書共分為六個部分:基礎(chǔ)入門、研究設(shè)計和基礎(chǔ)工具、文本挖掘基礎(chǔ)、人文社會科學(xué)與文本分析、計算機(jī)科學(xué)與文本挖掘、寫作和展示,在內(nèi)容安排上由淺入深、循序漸進(jìn)。相較于單一且詳盡的方法教程,本書的目的更多是在于指導(dǎo)學(xué)生運(yùn)用社會世界的文本數(shù)據(jù)來設(shè)計一項可行的社會科學(xué)研究。本書涵蓋了文本挖掘研究多個方面的關(guān)鍵問題,包括網(wǎng)絡(luò)抓取和爬
大數(shù)據(jù)技術(shù)與應(yīng)用發(fā)展不僅改變著網(wǎng)絡(luò)信息環(huán)境,而且決定數(shù)據(jù)的存在形態(tài)與數(shù)字信息資源的分布和利用結(jié)構(gòu),直接關(guān)系到用戶的認(rèn)知需求表達(dá)與數(shù)字信息交互機(jī)制。在這一背景下,本書從大數(shù)據(jù)技術(shù)基礎(chǔ)、數(shù)據(jù)內(nèi)容管理和數(shù)字信息利用出發(fā),按照大數(shù)據(jù)應(yīng)用與服務(wù)基礎(chǔ)構(gòu)架進(jìn)行理論和實踐的歸納;通過基本問題的分析和實證探索,圍繞大數(shù)據(jù)需求、數(shù)字資源形
本教材立足“大數(shù)據(jù)”的時代背景,面向企業(yè)數(shù)字化轉(zhuǎn)型升級對數(shù)字化人才的需求,堅持大數(shù)據(jù)通識教育核心理念,采用理論與實踐相結(jié)合的方式,選取了六個項目,助力讀者提升大數(shù)據(jù)分析相關(guān)的數(shù)字技能與數(shù)字素養(yǎng),培養(yǎng)學(xué)生的大數(shù)據(jù)意識、大數(shù)據(jù)思維、大數(shù)據(jù)安全和大數(shù)據(jù)基本處理能力。本教材根據(jù)行業(yè)企業(yè)大數(shù)據(jù)的實際應(yīng)用和高職學(xué)生認(rèn)知規(guī)律,選取了