本書在R語言和Python的基礎(chǔ)上開發(fā)了基于云計算的可視化云平臺。全書內(nèi)容包括:大數(shù)據(jù)分析基礎(chǔ)、簡單數(shù)據(jù)挖掘、基本統(tǒng)計方法、統(tǒng)計分析模型、時間序列預(yù)測技術(shù)、多元決策分析方法、大數(shù)據(jù)分析進階七章。
"數(shù)據(jù)科學(xué)項目日益增多,每個項目在提出原型到生產(chǎn)的過程中都需要可靠的基礎(chǔ)設(shè)施。使用《Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》介紹的一些新技術(shù)和新工具,你將能建立一個適用于各類組織(無論是初創(chuàng)企業(yè)還是大型企業(yè))的基礎(chǔ)設(shè)施堆棧!禘ffective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》可幫助你建立數(shù)據(jù)流程和項目工作流,為你開發(fā)項目帶來強大動力!
從什么是數(shù)據(jù),數(shù)據(jù)與優(yōu)化的關(guān)系入手,以經(jīng)典的傳統(tǒng)數(shù)據(jù)分析方法和最新的深度學(xué)習(xí)算法為例,系統(tǒng)介紹了數(shù)據(jù)分析的算法設(shè)計思想及實現(xiàn)方法。內(nèi)容涉及了數(shù)據(jù)的可視化、特征選擇與降維、神經(jīng)網(wǎng)絡(luò)基本原理、無監(jiān)督學(xué)習(xí)、有監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)的魯棒性等,全書提供了豐富的實例以及完整的可實現(xiàn)的Pyth從什么是數(shù)據(jù),數(shù)據(jù)與優(yōu)化的關(guān)系入手,以經(jīng)典
本書以Hadoop3.3.0為核心,涵蓋Hadoop生態(tài)系統(tǒng)的常用組件,主要介紹各組件的架構(gòu)原理、Shell命令、常用API及編程等,并配有較多例題。全書共7章,內(nèi)容包含Hadoop概述、Hadoop偽分布式安裝、Hadoop分布式文件系統(tǒng)HDFS、分布式計算框架MapReduce、分布式數(shù)據(jù)庫HBase、數(shù)據(jù)倉庫Hi
本書由校企“雙元”合作開發(fā),以企業(yè)真實項目的實施流程為主線,通過“電商平臺用戶行為數(shù)據(jù)分析”項目實戰(zhàn),貫穿Hadoop大數(shù)據(jù)核心技術(shù),包括項目需求、大數(shù)據(jù)平臺部署、數(shù)據(jù)采集、離線數(shù)據(jù)倉庫設(shè)計與開發(fā)和項目數(shù)據(jù)可視化展示。本書內(nèi)容主要涉及VMware、Xshell、IDEA等軟件的安裝配置;Hadoop分布式集群環(huán)境搭建;
《大數(shù)據(jù)應(yīng)用基礎(chǔ)教程》旨在培養(yǎng)大學(xué)低年級本科生的大數(shù)據(jù)應(yīng)用能力,使其初步建立數(shù)據(jù)思維,以滿足“新工科”“新醫(yī)科”“新農(nóng)科”“新文科”建設(shè)背景下高校培養(yǎng)學(xué)生數(shù)據(jù)素養(yǎng)能力的新要求。全書共3篇;A(chǔ)篇(第1、2章)主要內(nèi)容為大數(shù)據(jù)概述、Python及常用類庫;數(shù)據(jù)分析篇(第3~7章)重點闡述數(shù)據(jù)獲取、存儲、預(yù)處理、可視化和分
最火熱、最前沿的科學(xué)新技術(shù)的科普書本系列特色:專家向孩子介紹最前沿、最火熱的科學(xué)技術(shù)1、不同于市面泛濫的大眾化科普,挑選了當今最火熱、最前沿的新技術(shù)進行科普,與時俱進,讓孩子輕松成為最時尚的科學(xué)小達人。2、文風(fēng)活潑靈動,用孩子讀得懂、喜歡讀的文字,三言兩語講清其中的科學(xué)道理。3、每個單頁都會配1-2幅搞怪插圖,對孩子的
本書主要圍繞Hadoop及其生態(tài)系統(tǒng)中的各種工具展開講解,重點介紹大數(shù)據(jù)分析處理的整體流程,剖析每個環(huán)節(jié)中所使用的不同組件的技術(shù)原理和特點。本書內(nèi)容共分為七個模塊:模塊一為大數(shù)據(jù)基礎(chǔ)概述,主要講述大數(shù)據(jù)的概念、來源、應(yīng)用場景、大數(shù)據(jù)時代的機遇和挑戰(zhàn)等相關(guān)內(nèi)容;模塊二至模塊六以Hadoop生態(tài)系統(tǒng)為基礎(chǔ),系統(tǒng)地講解了分布
本書圍繞數(shù)據(jù)正義理論展開。數(shù)據(jù)化并非僅是技術(shù),實為一種政治經(jīng)濟體制,應(yīng)優(yōu)先考慮數(shù)據(jù)化帶來的社會正義問題。數(shù)據(jù)正義要求找到應(yīng)對資本主義危害的方式;數(shù)據(jù)化嵌入政府治理導(dǎo)致社會成員權(quán)力弱化,數(shù)據(jù)正義要求政府機構(gòu)優(yōu)先考慮以人為本、團結(jié)建設(shè);數(shù)據(jù)正義概念必須是連接全球社會學(xué),絕非僅是西方的;數(shù)據(jù)正義要解決數(shù)據(jù)化帶來剝削、歧視、隱
本書以數(shù)據(jù)智能和數(shù)據(jù)思維為核心,圍繞數(shù)據(jù)的全生命周期管理概念,詳細介紹了基于Excel的數(shù)據(jù)處理、數(shù)據(jù)分析與可視化方法與實踐,以及數(shù)據(jù)管理和數(shù)據(jù)庫實踐。全書分為理論和實驗兩部分,內(nèi)容由淺入深,語言通俗易懂,案例貼近學(xué)生生活和學(xué)習(xí)真實場景,既體現(xiàn)了數(shù)據(jù)科學(xué)的技術(shù)熱點,又兼顧了案例的生動性和趣味性,適合全國高等學(xué)校各專業(yè)作