本書以數(shù)據(jù)處理為主線,介紹數(shù)據(jù)處理的基本原理、常見的算法思想、算法設(shè)計(jì)的可視化以及編程實(shí)現(xiàn)python語言。 全書共13章,主要內(nèi)容包括數(shù)據(jù)科學(xué)基礎(chǔ)實(shí)踐概論、數(shù)據(jù)表示、數(shù)據(jù)計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)可視化、算法可視化工具、算法設(shè)計(jì)基礎(chǔ)、Excel中的算法、Python程序設(shè)計(jì)基礎(chǔ)、算法在Python中的實(shí)現(xiàn)、Word文檔處理
本書以實(shí)戰(zhàn)案例為主,全面闡述了大數(shù)據(jù)開發(fā)領(lǐng)域中常用的技術(shù)原理和框架,以及框架對(duì)應(yīng)的實(shí)戰(zhàn)案例。全書共分為四大篇章:大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)離線批處理技術(shù)篇、大數(shù)據(jù)在線實(shí)時(shí)處理技術(shù)篇、大數(shù)據(jù)處理實(shí)戰(zhàn)案例篇。大數(shù)據(jù)基礎(chǔ)篇主要介紹了大數(shù)據(jù)的基礎(chǔ)知識(shí)、Hadoop和Storm的基礎(chǔ)知識(shí)及其發(fā)展現(xiàn)狀和應(yīng)用前景;大數(shù)據(jù)離線批處理技術(shù)篇主
本書詳細(xì)描述了PMML規(guī)范(Ver4.3)所支持的8種模型:神經(jīng)網(wǎng)絡(luò)模型、決策樹模型、規(guī)則集模型、序列模型、評(píng)分卡模型、支持向量機(jī)模型、時(shí)間序列模型和聚合模型。全書不是簡(jiǎn)單地介紹PMML語法,而是融合各種挖掘模型基礎(chǔ)知識(shí)和算法知識(shí),告訴開發(fā)者如何融會(huì)貫通地掌握、使用PMML語言,不僅能夠?qū)W習(xí)到標(biāo)準(zhǔn)的PMML模型表達(dá)方式
本書將古典、非線性和現(xiàn)代控制理論結(jié)合起來,借助MATLAB庫(kù)函數(shù)、仿真工具、硬件平臺(tái)對(duì)象完成控制理論的分析和設(shè)計(jì)實(shí)驗(yàn)。通過實(shí)時(shí)觀察實(shí)物的動(dòng)作,增強(qiáng)學(xué)生的興趣和感知能力,幫助學(xué)生更好理解自動(dòng)控制理論,并增強(qiáng)學(xué)生的研究能力和創(chuàng)新能力。學(xué)術(shù)價(jià)值體現(xiàn)在: (1)利用硬件實(shí)驗(yàn)平臺(tái),學(xué)生可以理解控制器參數(shù)的作用,掌握調(diào)整直流伺服
本書介紹了大數(shù)據(jù)的概念、特點(diǎn)、市場(chǎng)、技術(shù)、分析、應(yīng)用,還專門討論了云計(jì)算、人工智能和區(qū)塊鏈等熱點(diǎn)新技術(shù)及應(yīng)用,教學(xué)設(shè)計(jì)層次清晰,每個(gè)單元都遵循同樣的編排體系,內(nèi)容圖文并茂,對(duì)口語技能、閱讀技能、翻譯技能的學(xué)習(xí)任務(wù)進(jìn)行了合理的設(shè)計(jì)。而且,本書還對(duì)每個(gè)單元的教學(xué)重點(diǎn)和專業(yè)詞匯進(jìn)行了注釋,設(shè)置了基于內(nèi)容的閱讀理解練習(xí)、詞匯練
全書共有12章,從Hadoop概述開始,介紹了Hadoop的安裝與配置管理,并對(duì)Hadoop的生態(tài)體系架構(gòu)進(jìn)行了介紹,包括HDFS技術(shù)、YARN技術(shù)、MapReduce技術(shù)、HadoopI/O操作、海量數(shù)據(jù)庫(kù)技術(shù)HBase、ZooKeeper技術(shù)、分布式數(shù)據(jù)倉(cāng)庫(kù)技術(shù)Hive、分布式數(shù)據(jù)分析工具Pig,以及數(shù)據(jù)遷移工具S
本書是作者在多年科學(xué)研究的基礎(chǔ)上整理完善而成的,是自然語言處理技術(shù)在文本分類領(lǐng)域應(yīng)用的綜述和總結(jié),本書專業(yè)性較強(qiáng),注重對(duì)技術(shù)理論依據(jù)和解決思路的精細(xì)講解,讀者可通過對(duì)本書的學(xué)習(xí)了解和掌握人工智能相關(guān)技術(shù)在網(wǎng)絡(luò)文本處理時(shí)的實(shí)現(xiàn)方法和操作流程。本書的內(nèi)容包括:文本預(yù)處理、特征表示與降維、文本分類算法、多標(biāo)簽文本分類技術(shù)、短
本書圍繞大數(shù)據(jù)流處理領(lǐng)域,介紹FlinkDataStreamAPI、時(shí)間和窗口、狀態(tài)和檢查點(diǎn)、TableAPI和SQL等知識(shí)。本書以實(shí)踐為導(dǎo)向,使用大量真實(shí)業(yè)務(wù)場(chǎng)景案例來演示如何基于Flink進(jìn)行流處理。讀者最好有一定的Java或Scala編程基礎(chǔ),掌握計(jì)算機(jī)領(lǐng)域的常見技術(shù)概念。
共分11章,第1章對(duì)大數(shù)據(jù)及Hadoop進(jìn)行總體介紹,第2章講解了如何搭建Hadoop集群。第3-5章講解了HDFS分布式文件系統(tǒng)、MapReduce分布式計(jì)算框架以及Zookeeper分布式協(xié)調(diào)服務(wù)。第6章講解Hadoop2.0的新特性。第7-10章主要講解了Hadoop生態(tài)圈中的相關(guān)輔助系統(tǒng),包括Hive、HBas
本書是高校的大數(shù)據(jù)導(dǎo)論課程教材,清楚地介紹了大數(shù)據(jù)相關(guān)的概念、理論、術(shù)語與基礎(chǔ)技術(shù),并使用真實(shí)連貫的商業(yè)案例以及簡(jiǎn)單的圖表,幫助讀者更清晰地理解大數(shù)據(jù)技術(shù)。本書可作為高等院校相關(guān)專業(yè)“大數(shù)據(jù)基礎(chǔ)”“大數(shù)據(jù)導(dǎo)論”等課程的教材,也可供有一定實(shí)踐經(jīng)驗(yàn)的軟件開發(fā)人員、管理人員和所有對(duì)大數(shù)據(jù)感興趣的人士閱讀。