本書以廣泛使用的Alluxio2.8.0版本為基礎(chǔ)編寫,深入介紹Alluxio相關(guān)技術(shù)原理與實踐案例。本書主要內(nèi)容包括Alluxio系統(tǒng)入門與使用、Alluxio系統(tǒng)內(nèi)核組件設(shè)計實現(xiàn)原理,同時詳細介紹了Alluxio在大型企業(yè)中的經(jīng)典應(yīng)用案例與生產(chǎn)實踐,并附有Alluxio的開源社區(qū)開發(fā)者指南。本書是工業(yè)界和學(xué)術(shù)界從事
本書為高等職業(yè)教育計算機類新形態(tài)——工作手冊式教材,內(nèi)容包括基礎(chǔ)環(huán)境的搭建與配置,Hadoop完全分布式集群的搭建與運行,Hadoop核心組件的應(yīng)用案例,Hive組件的安裝、配置與應(yīng)用,ZooKeeper的安裝、配置與應(yīng)用,HBase的安裝、配置與應(yīng)用,Sqoop組件的安裝、配置與應(yīng)用,F(xiàn)lume組件的安裝、配置與應(yīng)用
本書是數(shù)據(jù)標注領(lǐng)域領(lǐng)先的實訓(xùn)講義。本書著重對常見的文本、語音和圖像標注任務(wù)類型進行介紹,幫助從事標注工作的學(xué)習者快速地完成系統(tǒng)化學(xué)習,進行標注實戰(zhàn)。本書對文本、語音及圖像標注的多種任務(wù)類型逐一進行講解和分析,每種標注類型均配有對應(yīng)的規(guī)范、舉例分析、習題及解析。同時,本書還針對各類標注配套多種子任務(wù)類型或多個領(lǐng)域的實操練
本書是一本專門面向數(shù)據(jù)標注人才培養(yǎng)的實訓(xùn)教材,適用于有意從事人工智能訓(xùn)練師和數(shù)據(jù)標注工作的人員。為了使學(xué)習更具有針對性,本書特別選擇了能代表行業(yè)普遍需求的標注項目管理知識及典型文本、語音和圖像標注任務(wù)進行講解與訓(xùn)練,輔助學(xué)習者快速完成系統(tǒng)化學(xué)習,進行標注實戰(zhàn)工作。本書對文本的事件標注和關(guān)系標注、語音的采集和質(zhì)檢、圖像的
隨著“十四五”規(guī)劃綱要中提出“協(xié)同發(fā)展云服務(wù)與邊緣計算服務(wù)”的觀點,邊云智能已成為未來發(fā)展的重要趨勢。本書依托于政策大背景,旨在向讀者介紹邊云智能的基礎(chǔ)知識和應(yīng)用。書中分為四個篇章,第一篇章介紹了邊云架構(gòu)的骨架和基礎(chǔ)概念,第二篇章介紹了人工智能算法和深度學(xué)習模型,第三篇章介紹了云端決策算法和邊緣端輕量化算法,第四篇章介
本書系統(tǒng)講述ApacheSpark/PySpark大數(shù)據(jù)計算平臺的原理,以及如果將ApachePySpark應(yīng)用于大數(shù)據(jù)的實時流處理、批處理等各個場景。通過原理深入學(xué)習和實踐示例、案例的學(xué)習應(yīng)用,使讀者了解并掌握ApacheSpark/PySpark的基本原理和技能,接近理論與實踐的距離。全書共分為8章,主要內(nèi)容包括:
本書是一本全面介紹數(shù)據(jù)挖掘基本原理、核心算法以及典型應(yīng)用方法的專業(yè)書籍。第4版在前三版的基礎(chǔ)上,對數(shù)據(jù)挖掘的方法論和知識點進行了重新歸納,按照基礎(chǔ)篇、提高篇和應(yīng)用篇進行設(shè)計。從方法論上說,數(shù)據(jù)挖掘是一個方法和原理逐步演變的過程。首先,最基礎(chǔ)的數(shù)據(jù)挖掘方法主要有“關(guān)聯(lián)規(guī)則”“分類”“聚類”,它們是數(shù)據(jù)挖掘的靈魂和基礎(chǔ),因
數(shù)據(jù)作為數(shù)字經(jīng)濟的血液、知識經(jīng)濟的基石,是企業(yè)的戰(zhàn)略性資源。將數(shù)據(jù)轉(zhuǎn)化為可被企業(yè)直接使用的有價值的資產(chǎn),即“數(shù)據(jù)資產(chǎn)化”,已經(jīng)成為企業(yè)數(shù)字化轉(zhuǎn)型的重要目標。本書闡明了數(shù)據(jù)資產(chǎn)化的意義,圍繞數(shù)據(jù)資產(chǎn)的確認、登記、質(zhì)量評估、價值評估、入表,數(shù)據(jù)高效流通及價格發(fā)現(xiàn)等方面,系統(tǒng)闡述了數(shù)據(jù)資產(chǎn)化的理論和實踐問題。本書可以幫助讀者
本書共9章,采用總分總結(jié)構(gòu),首先整體介紹什么是畫像平臺,然后分模塊詳細介紹畫像平臺的實現(xiàn)方案,最后從實踐的角度介紹如何構(gòu)建和使用畫像平臺。各章詳細內(nèi)容介紹如下。第1章的重點是了解畫像平臺。第2章描述畫像平臺的主要功能、技術(shù)架構(gòu)和數(shù)據(jù)模型。第3-6章分別介紹了畫像平臺的四種主要功能(標簽生產(chǎn)、標簽服務(wù)、分群功能、畫像分析
本書介紹了人工智能與語言知識的結(jié)合特點。通過理論概念講解、具體實例分析,介紹語言知識的構(gòu)建方法、類型案例、應(yīng)用領(lǐng)域,輔助學(xué)習者快速了解行業(yè)基礎(chǔ)和發(fā)展動態(tài)。本書首先介紹語言知識庫的基本理論和構(gòu)建方法,通過例子介紹資源類語言知識、語料庫語言知識的概念和結(jié)構(gòu)。為了方便理解,本書結(jié)合大量案例介紹語言知識在自然語言處理及在司法、