關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
復(fù)雜數(shù)據(jù)質(zhì)量控制技術(shù)
復(fù)雜性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的本質(zhì)特性,也是當(dāng)前大數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理面臨的核心挑戰(zhàn)。本書(shū)圍繞大數(shù)據(jù)的復(fù)雜性開(kāi)展研究,旨在探索當(dāng)前數(shù)據(jù)資源建設(shè)與利用過(guò)程中面臨的挑戰(zhàn)和技術(shù)難題,促進(jìn)數(shù)據(jù)價(jià)值的充分釋放。
全書(shū)分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數(shù)據(jù)控制技術(shù)的基本概念和任務(wù)定位,以及國(guó)內(nèi)外的研究進(jìn)展; 第2部分實(shí)體分辨技術(shù)(第3~13章),研究了高維數(shù)據(jù)實(shí)體分辨、名稱分辨、XML數(shù)據(jù)實(shí)體分辨和跨模態(tài)數(shù)據(jù)實(shí)體分辨等; 第3部分真值發(fā)現(xiàn)技術(shù)(第14~18章),研究了單真值發(fā)現(xiàn)、多真值發(fā)現(xiàn)、文本數(shù)據(jù)真值發(fā)現(xiàn),以及基于多蟻群優(yōu)化和基于深度神經(jīng)網(wǎng)絡(luò)的真值發(fā)現(xiàn)等; 第4部分基于數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量控制技術(shù)(第19~21章),研究了數(shù)據(jù)錄入輔助預(yù)測(cè)與推理方法、不一致數(shù)據(jù)檢測(cè)與修復(fù)方法,以及有限先驗(yàn)知識(shí)下的全局?jǐn)?shù)據(jù)質(zhì)量評(píng)估; 第5部分系統(tǒng)與平臺(tái)(第22、23章),介紹了數(shù)據(jù)質(zhì)量控制系統(tǒng),以及數(shù)據(jù)治理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn); 第6部分結(jié)束語(yǔ)(第24章),歸納總結(jié)了當(dāng)前面臨的風(fēng)險(xiǎn)和挑戰(zhàn)。 本書(shū)務(wù)實(shí)求新,系統(tǒng)性強(qiáng),易讀性和可操作性好,既可作為數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理領(lǐng)域的進(jìn)階用書(shū),又可作為數(shù)據(jù)資源建設(shè)與利用、信息技術(shù)等相關(guān)學(xué)科領(lǐng)域的教學(xué)參考或工程實(shí)踐指導(dǎo)用書(shū)。
你還可能感興趣
我要評(píng)論
|