《大數(shù)據(jù)技術與應用》內(nèi)容分為兩大部分:大數(shù)據(jù)技術篇(第1-4章)介紹了大數(shù)據(jù)的發(fā)展歷程、內(nèi)涵和外延、價值、意義與相關技術,對大數(shù)據(jù)關鍵技術進行講解,體現(xiàn)了技術的邏輯性和嚴密的科學思維;大數(shù)據(jù)技術應用篇(第5-8章)介紹了大數(shù)據(jù)在機器學習領域的典型應用。
《大數(shù)據(jù)技術與應用》主要面向大學計算機類專業(yè)的本科高年級學生與研究生,目的是幫助學生掌握大數(shù)據(jù)的基本原理和基本知識,熟悉大數(shù)據(jù)技術在多個行業(yè)應用中“能與不能”的邊界,培養(yǎng)學生在本專業(yè)應用大數(shù)據(jù)的能力。
同時,對于計算機相關專業(yè)的學生,《大數(shù)據(jù)技術與應用》也可作為大數(shù)據(jù)專業(yè)課程的導論課教材。
《大數(shù)據(jù)技術與應用》注重知識結構的基礎性與完整性,確保技術內(nèi)容的通用性、普適性與先進性,遵循教育規(guī)律,側(cè)重能力培養(yǎng),同時,精選行業(yè)真實案例,開闊學生視野,啟發(fā)創(chuàng)新思維。
《大數(shù)據(jù)技術與應用》期望為跨學科研究者提供大數(shù)據(jù)技術的方法論和技術概述,滿足培養(yǎng)新一代信息技術人才的要求。
當前,新一代信息技術正在全球孕育興起,科技創(chuàng)新、產(chǎn)業(yè)形態(tài)和應用格局正發(fā)生著重大變革。隨著數(shù)據(jù)獲取和計算技術的發(fā)展,大數(shù)據(jù)已成為一種新的國家戰(zhàn)略資源,引起了學術界、產(chǎn)業(yè)界、政府及行業(yè)用戶等的高度關注。世界主要發(fā)達國家已經(jīng)相繼制定了促進大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的政策法規(guī),積極構建大數(shù)據(jù)生態(tài),實施大數(shù)據(jù)國家戰(zhàn)略。
我國充分認識到大數(shù)據(jù)時代帶來的重大機遇,部署落實了一系列與大數(shù)據(jù)密切相關的規(guī)劃。2015年,國務院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《綱要》),系統(tǒng)部署大數(shù)據(jù)發(fā)展工作!毒V要》提出,信息技術與經(jīng)濟社會的交匯融合引發(fā)了數(shù)據(jù)迅猛增長,數(shù)據(jù)已成為國家基礎性戰(zhàn)略資源,大數(shù)據(jù)正日益對全球生產(chǎn)、流通、分配、消費活動以及經(jīng)濟運行機制、社會生活方式和國家治理能力產(chǎn)生重要影響。目前,我國在大數(shù)據(jù)發(fā)展和應用方面已具備一定基礎,擁有市場優(yōu)勢和發(fā)展?jié)摿Α?br> 目前,全國30多個省市出臺了大數(shù)據(jù)相關政策文件,一些地方政府專門設置了大數(shù)據(jù)管理部門,為大數(shù)據(jù)基礎設施、技術創(chuàng)新、產(chǎn)業(yè)發(fā)展營造了良好環(huán)境。黨的十九大報告在深化供給側(cè)結構性改革中指出:“加快建設制造強國,加快發(fā)展先進制造業(yè),推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合,在中高端消費、創(chuàng)新引領、綠色低碳、共享經(jīng)濟、現(xiàn)代供應鏈、人力資本服務等領域培育新增長點、形成新動能!边@更加明確了大數(shù)據(jù)應與各個行業(yè)深度融合。
本書內(nèi)容分為兩大部分:大數(shù)據(jù)技術篇(第1-4章)介紹了大數(shù)據(jù)的發(fā)展歷程、內(nèi)涵和外延、價值、意義與相關技術,對大數(shù)據(jù)關鍵技術進行講解,體現(xiàn)了技術的邏輯性和嚴密的科學思維;大數(shù)據(jù)技術應用篇(第5-8章)介紹了大數(shù)據(jù)在機器學習領域的典型應用。
本書主要面向大學計算機類專業(yè)的本科高年級學生與研究生,目的是幫助學生掌握大數(shù)據(jù)的基本原理和基本知識,熟悉大數(shù)據(jù)技術在多個行業(yè)應用中“能與不能”的邊界,培養(yǎng)學生在本專業(yè)應用大數(shù)據(jù)的能力。同時,對于計算機相關專業(yè)的學生,本書也可作為大數(shù)據(jù)專業(yè)課程的導論課教材。本書注重知識結構的基礎性與完整性,確保技術內(nèi)容的通用性、普適性與先進性,遵循教育規(guī)律,側(cè)重能力培養(yǎng),同時,精選行業(yè)真實案例,開闊學生視野,啟發(fā)創(chuàng)新思維。本書期望為跨學科研究者提供大數(shù)據(jù)技術的方法論和技術概述,滿足培養(yǎng)新一代信息技術人才的要求。
侯勇,博士,安徽蚌埠學院計算機工程學院副教授;出版教材3部,發(fā)表多篇文章被中國科學引文數(shù)據(jù)庫(CSCD)收錄或被EI檢索;獲大數(shù)據(jù)與人工智能類比賽(本科組)省賽一等獎、華信智原杯大學生程序設大賽三等獎。
大數(shù)據(jù)技術篇
第1章 Hadoop
1.1 大數(shù)據(jù)概述
1.2 大數(shù)據(jù)解決方案
1.3 Hadoop簡介
1.4 環(huán)境設置
1.5 多節(jié)點集群安裝
1.6 HDFS概述
1.7 HDFS操作
1.8 命令參考
1.9 MapReduce
1.10 MapReduce在Hadoop上的實現(xiàn)
1.11 MapReduce分區(qū)器
1.12 COmbiner
1.13 Hadoop管理
1.14 應用程序接口
1.15 HadoopStreaming
第2章 HBase
2.1 HBase概述
2.2 HBase的架構
2.3 HBase的安裝
2.4 HBaseShell
2.5 HBase的常用命令
2.6 Admin API
2.7 創(chuàng)建表
2.8 列表
2.9 禁用表
2.10 啟用表
2.11 Describe與Alter命令
2.12 Exists命令
2.13 刪除表
2.14 Exit命令
2.15 客戶端API
2.16 創(chuàng)建數(shù)據(jù)
2.17 更新數(shù)據(jù)
2.18 讀取數(shù)據(jù)
2.19 刪除數(shù)據(jù)
2.20 掃描
2.21 Count和Truncate
2.22 安全
……
第3章 Hive
第4章 Spark
大數(shù)據(jù)技術應用篇
參考文獻