本書以大數據處理流程為主線,重點介紹大數據獲取、預處理、存儲管理、挖掘分析以及可視化等方面的基本理論、方法和關鍵技術,通過豐富的應用案例展示了行業(yè)大數據的應用場景以及數據價值。本書共7章:數據與大數據時代、大數據獲取和預處理、大數據存儲與管理、大數據挖掘分析、大數據可視化、大數據處理技術和行業(yè)大數據應用。本書深入淺出、
數據已經成為信息科技革命與數字應用時代重要的生產要素,不僅在經濟活動與市場運轉中發(fā)揮著舉足輕重的作用,而且日益成為保持并增強核心競爭力的重要媒介。本書聚焦數據要素的作用與應用,從數據要素與數字經濟、數據要素與政府治理、數據要素與全球共融、數據要素基礎建設和技術創(chuàng)新、數據要素行業(yè)應用和實踐探索等方面進行了深入論述。作品內
數據跨境流動對推動數字經濟發(fā)展和國際合作都有著重要促進意義。但考慮到數據的戰(zhàn)略價值,對公民隱私保護和國家安全等問題,各國也會對數據的跨境流動加以限制。我國應兼顧發(fā)展與安全,制定符合國情的跨境數據管理戰(zhàn)略。具體實踐中應重點考慮構建完整的跨境數據流動監(jiān)管政策框架,對個人數據和非個人數據建立完善的管理體系、構建政府與行業(yè)協(xié)同
PrinciplesofDataMining是數據挖掘領域具有重要影響的國外著名教材之一,原為斯普林格出版社計算機科學本科生系列教材中的一本。在讀者的期待中,本書的譯本得以出版。從數據集本身特性的探討,到分類、規(guī)劃挖掘及聚類等基本方法的闡明,再到數據科學的工程場景的融合,本書可幫助數據挖掘學習者形成清晰的學科觀。本書具
《Hadoop理論與實踐/大數據人工智能系列叢書》按照高等學校大數據、人工智能課程基本要求,以案例驅動的形式來組織內容,突出該課程的實踐性特點!禜adoop理論與實踐/大數據人工智能系列叢書》主要包含四大部分:Hadoop技術、數據倉庫與Hive、Flume分布式日志處理系統(tǒng)、Spark及其生態(tài)圈概述。其中,Hado
本書是一本專門介紹重復數據刪除技術的專業(yè)書籍。全書共分為8章,以大數據存儲為背景,介紹重復數據刪除的關鍵技術及其應用場景。通過學習本書,讀者能夠了解信息存儲技術基礎、大數據管理主流技術和高效能存儲管理基本知識,并可以深入理解重復數據刪除技術的概念、分類、存儲原理及關鍵技術,還可掌握前沿的應用,如感知源端重刪機制和高可擴
露西婭是個對世界充滿好奇心的小女孩,她喜歡觀察,更喜歡思考!自己家養(yǎng)了比格犬“小嘰咕”后,她就想知道全世界*受歡迎的狗狗排行是怎樣的?寫作業(yè)很痛苦的時候,她好想知道別的國家小朋友寫作業(yè)都要用多久呢?媽媽說暑假要出國旅游,她迫不及待要查查全世界*熱門的旅游城市是哪幾個?通過清晰易懂的大數據,露西婭講了全世界的寵物、家庭模
《Spark大數據分析技術(Scala版)》系統(tǒng)介紹了Spark大數據技術的相關知識,內容包括Spark概述、Scala基礎編程、基于Scala的Spark編程、Windows環(huán)境下的Spark綜合編程、SparkSQL結構化數據處理、SparkStreaming流計算、SparkGraphX圖計算、SparkMLli
與數據相關的能力——包括獲取數據、理解數據、處理數據、從數據中提取價值、用可視化方式展現數據、交流數據,不僅僅專業(yè)技術人員應該掌握它,即使是在我們的小學、中學和大學,也都應該傳授相關的技巧。因為,我們已經進入了大數據時代,數據無處不在,無孔不入。 本書以導論形式介紹與數據科學相關的各方面知識。全書由“數”開篇,“說”
本書為國家精品課程"過程控制與集散系統(tǒng)”的配套教材。本書系統(tǒng)地介紹了有關過程控制的理論與技術。全書共分11章,內容包括概述、過程控制系統(tǒng)建模方法、過程控制系統(tǒng)設計、PID調節(jié)原理、串級控制、特殊控制方法、補償控制、關聯分析與解耦控制、模糊控制、預測控制和先進控制。本書從基本概念出發(fā),深入淺出地闡述了過程控制系統(tǒng)的本質與