本書以項目任務為載體串聯(lián)知識與技能,介紹基于SparkSQL技術的大數(shù)據分析方法,培養(yǎng)學習者使用SparkSQL技術解決實際數(shù)據分析問題的能力,主要內容有大數(shù)據分析概述、實踐環(huán)境準備、學生信息處理分析、房產大數(shù)據分析與探索、電商大數(shù)據分析與探索、Zepplin數(shù)據可視化。在實現(xiàn)任務的過程中詳細闡述了Scala語言基礎、
本書從初學者的角度詳細介紹大數(shù)據的核心技術。全書共11章,包括緒論、Linux的基礎操作、Hadoop大數(shù)據處理架構、HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架、ZooKeeper分布式協(xié)調服務、YARN資源管理器、HBase分布式數(shù)據庫、Hive數(shù)據倉儲、PySpark數(shù)據處理與分析及綜合案例。此外,本
架構大數(shù)據系統(tǒng)涉及的技術和工具種類繁多,但技術和工具背后的大數(shù)據處理需求和解決問題的思維邏輯卻恒久不變。本書采用軟件工程化方法,從大數(shù)據架構的需求出發(fā),籍由理性和常識的指引,推導和梳理大數(shù)據架構之術(大數(shù)據處理的基本原理和技術方法),進而討論大數(shù)據架構之器(具體軟件工具的功能、設計、實現(xiàn)以及使用方法),建立大數(shù)據架構教
本書以項目實踐作為主線,結合必需的理論知識,以任務的形式設計內容,每個任務都包含任務描述及任務實施的步驟,讀者按照實施步驟進行操作就可以完成相應的學習任務,從而不斷提升項目實踐能力。本書主要內容涉及流式數(shù)據的基礎知識、Flink的簡介及發(fā)展歷史、Flink的系統(tǒng)架構及FlinkAPI介紹、Flink的集群部署模式、Fl
《智能控制》(第2版)(ISBN為9787302581611)是全國工程碩士專業(yè)學位教育指導委員會推薦教材,全面涵蓋模糊控制、神經控制、專家控制、仿人智能控制、遞階智能控制、學習控制、**智能控制及其工程應用實例。本書配套于該教材,為智能控制研究生課程教學提供全面而系統(tǒng)的教學設計與指導,包括學習理論、指導教學的系統(tǒng)科學
數(shù)據是人類共同的財富數(shù)據是現(xiàn)代科學研究的基石。在當今這個大數(shù)據的時代,如何強調數(shù)據的重要性似乎都不為過。隨著互聯(lián)網及其應用的普及,傳統(tǒng)關系數(shù)據庫越來越難以滿足計算機應用對數(shù)據存儲、訪問和安全的需要,非關系數(shù)據庫和新興數(shù)據庫應運而生。本書主要面向新一代數(shù)據庫系統(tǒng),詳細介紹數(shù)據庫發(fā)展史、數(shù)據庫設計原則、NoSQL和NewS
本書以項目實踐作為主線,結合必需的理論知識,以任務的形式進行內容設計,每個任務都包含任務描述及任務實施的步驟,讀者按照實施步驟進行操作就可以完成相應的學習任務,從而不斷提升項目實踐能力。本書主要內容涉及Spark基本原理、基于IDEA搭建Spark開發(fā)環(huán)境、RDD基本原理、SparkSQL基本操作流程、電商業(yè)務系統(tǒng)的基
互聯(lián)網的快速發(fā)展,在方便用戶信息傳遞的過程中,也使大量犯罪活動從線下向線上轉移,黑灰產常常通過搭建和傳播欺詐、賭博、色情等惡意網站來牟取暴利。為了凈化網絡環(huán)境,必須加大對惡意網站的檢測和攔截。 本書主要介紹惡意網址的欺詐手段和對抗技術。本書分為5個部分,共11章。針對網址反欺詐這一領域,首先介紹萬維網的起源、工作原理和
本書主要講述自動控制原理及其應用,并系統(tǒng)介紹自動控制系統(tǒng)的基本概念、基本理論、分析與設計方法。全書共9章,第1章為緒論,第2章為控制系統(tǒng)的數(shù)學模型,第3章為控制系統(tǒng)時域分析,第4章為根軌跡技術,第5章為線性定常系統(tǒng)的頻域分析法,第6章為控制系統(tǒng)的校正設計,第7章為狀態(tài)變量系統(tǒng)分析與設計,第8章為數(shù)字控制系統(tǒng),第9章為自
近幾年,數(shù)據分析、人工智能、大數(shù)據平臺等概念十分火爆,有些人感嘆:雖然學會了調用軟件算法庫文件,在面對真實的業(yè)務問題時卻不知道從哪里下手;雖然接觸了一個又一個能做數(shù)據分析的軟件工具,真要處理一個業(yè)務問題時,卻發(fā)現(xiàn)自己需要什么樣的數(shù)據反而成了第一道門檻……“道不遠人”,好的東西不應該只作為高深莫測的內容讓人敬而遠之。本書