"本書是“新一代人工智能系列教材”之一,全面、詳細(xì)地介紹數(shù)據(jù)科學(xué)的基本問題、前沿技術(shù)及應(yīng)用系統(tǒng)。本書共分為11章。第1章概述數(shù)據(jù)科學(xué),介紹數(shù)據(jù)科學(xué)的現(xiàn)有技術(shù)與工具;第2章介紹數(shù)據(jù)治理,包括實體對齊、數(shù)據(jù)融合和數(shù)據(jù)清洗;第3章介紹數(shù)據(jù)定價,包括數(shù)據(jù)定價機制和模型定價機制;第4章至第7章介紹面向不同數(shù)據(jù)類型(地理空間數(shù)據(jù)、
本書編寫目的是向讀者介紹大數(shù)據(jù)技術(shù)的基本概念與應(yīng)用。本書一共10章,分別講述了大數(shù)據(jù)介紹、云計算與大數(shù)據(jù)、大數(shù)據(jù)架構(gòu)、大數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)安全、大數(shù)據(jù)的商業(yè)應(yīng)用以及綜合實訓(xùn)。本書將理論與實踐操作相結(jié)合,通過大量的案例及書中的二維碼幫助讀者快速了解和應(yīng)用大數(shù)據(jù)分析相關(guān)
"本書旨在引導(dǎo)讀者全面了解分布式系統(tǒng)的核心原理、關(guān)鍵技術(shù)和實際應(yīng)用。全書分為9章,內(nèi)容包括分布式系統(tǒng)概述、理論基礎(chǔ)、基礎(chǔ)架構(gòu),以及分布式文件系統(tǒng)HDFS、分布式計算模型MapReduce、分布式協(xié)調(diào)服務(wù)ZooKeeper、分布式數(shù)據(jù)庫HBase和分布式消息系統(tǒng)Kafka的工作原理與應(yīng)用,最后提供兩個實戰(zhàn)項目,幫助讀者將
"本書在第1版的基礎(chǔ)上,進行了全面更新和擴充,旨在反映測控技術(shù)的**發(fā)展和國家戰(zhàn)略需求。全書共分9章,第1章簡要介紹測控系統(tǒng)的基本概念、系統(tǒng)構(gòu)成以及發(fā)展趨勢;第2章介紹現(xiàn)代測控系統(tǒng)的理論方法;第3章介紹各種新型傳感器的原理及應(yīng)用;第4章介紹基于網(wǎng)絡(luò)的測控技術(shù)與系統(tǒng);第5章介紹基于計算機視覺的測控技術(shù)與系統(tǒng);第6、7章分
"大數(shù)據(jù)分析包括查詢型分析、描述性分析、探索性分析、挖掘型分析等。本書介紹基于R語言的大數(shù)據(jù)分析解決方案。全書分3篇共18章。第1篇R語言,包括第1~10章,分別為R語言概覽、表達式、字符串與正規(guī)表達式、函數(shù)、向量、矩陣、數(shù)據(jù)框、列表、面向?qū)ο蟪绦蛟O(shè)計、數(shù)據(jù)存儲;第2篇可視化,包括第11、12章,分別為統(tǒng)計繪圖、圖形文
《數(shù)據(jù)凈界》是一本由行業(yè)資深人士組成的團隊撰寫的全面指南,旨在提供關(guān)于管理永久性和可持續(xù)性數(shù)據(jù)清除的詳盡指導(dǎo),同時確保符合監(jiān)管、法律和行業(yè)標(biāo)準(zhǔn)。本書深入探討了數(shù)據(jù)凈化的原因、方法和時機,強調(diào)了數(shù)據(jù)凈化作為IT運營中實現(xiàn)循環(huán)的重要組成部分。作者還討論了關(guān)于數(shù)據(jù)清除的幾個新標(biāo)準(zhǔn),包括IEEE和ISO即將發(fā)布的標(biāo)準(zhǔn)數(shù)據(jù)凈化如
大數(shù)據(jù)時代悄然來臨,帶來了信息技術(shù)發(fā)展的巨大變革,并深刻影響著社會生產(chǎn)和人民生活的方方面面。大數(shù)據(jù)專業(yè)人才的培養(yǎng)是新一輪科技較量的基礎(chǔ),高等院校承擔(dān)著大數(shù)據(jù)人才培養(yǎng)的重任。因此,各高等院校重視大數(shù)據(jù)課程的開設(shè),大數(shù)據(jù)課程已經(jīng)成為計算機科學(xué)與技術(shù)專業(yè)的重要核心課程。本書從大數(shù)據(jù)開發(fā)技術(shù)與行業(yè)應(yīng)用為切入點,介紹了大數(shù)據(jù)的相
本書深入剖析了組織中數(shù)據(jù)質(zhì)量的重要性及提升方法,為組織打造優(yōu)質(zhì)數(shù)據(jù)提供了全面的指導(dǎo)。書中首先揭示了糟糕的數(shù)據(jù)質(zhì)量對企業(yè)流程、決策及合規(guī)的潛在影響,進而闡述了提高數(shù)據(jù)質(zhì)量的核心要素和端到端的實踐流程。詳細(xì)解析了數(shù)據(jù)質(zhì)量提升方案的每個步驟,從構(gòu)建業(yè)務(wù)案例到管理初期的繁忙階段,再到確定關(guān)鍵利益相關(guān)者并明確數(shù)據(jù)規(guī)則,為讀者提供
這是一本從點、線、面、體多個維度深度解讀性能優(yōu)化方法的專業(yè)工具書。其中,“點”指的是代碼中的單個語句或函數(shù),可以通過代碼級別的優(yōu)化來提升性能;“線”指的是代碼中的執(zhí)行路徑,可以通過算法和數(shù)據(jù)結(jié)構(gòu)的優(yōu)化來提升性能;“面”則上升到模塊、子系統(tǒng)級別;“體”則指的是整個系統(tǒng),可以通過整體性優(yōu)化來提升性能。本書首先介紹了性能優(yōu)化
本書是中國計算機學(xué)會青年計算機科技論壇在2021年舉辦的“大數(shù)據(jù)治理的關(guān)鍵技術(shù)路徑”深度思辨論壇的成果,著重討論大數(shù)據(jù)治理的內(nèi)涵和大數(shù)據(jù)治理的可行技術(shù)路徑,包括大數(shù)據(jù)治理的背景與內(nèi)涵、大數(shù)據(jù)安全和隱私保護、大數(shù)據(jù)管理和數(shù)據(jù)流轉(zhuǎn)、面向大數(shù)據(jù)應(yīng)用的算法治理等內(nèi)容。書后還收錄了深度思辨論壇的起源、論壇組織紀(jì)實與精彩觀點,梳理