關(guān)于我們
書單推薦
新書推薦
|
實(shí)體識別關(guān)鍵技術(shù)的研究 實(shí)體識別在數(shù)據(jù)質(zhì)量管理中起著重要作用,它是數(shù)據(jù)質(zhì)量管理的重要研究方向。實(shí)體識別的目的是識別出數(shù)據(jù)集中描述同一真實(shí)世界實(shí)體的元組。實(shí)體識別的結(jié)果可以在數(shù)據(jù)質(zhì)量管理的其他階段(如數(shù)據(jù)清洗階段和數(shù)據(jù)質(zhì)量評估階段)得到廣泛應(yīng)用。在一個或多個數(shù)據(jù)庫中,同一個現(xiàn)實(shí)世界實(shí)體可能具有多種描述方式,這一問題在各種應(yīng)用領(lǐng)域的信息系統(tǒng)中普遍存在。本書以信息集成和互聯(lián)網(wǎng)搜索為背景,介紹對數(shù)據(jù)質(zhì)量管理中實(shí)體識別的關(guān)鍵技術(shù)的最新研究成果,以最大化實(shí)體識別結(jié)果精確度、最小化時間復(fù)雜性為目標(biāo),研究基于圖模型的實(shí)體識別、基于規(guī)則的實(shí)體識別、基于距離度量的實(shí)體識別和對冗余元組中實(shí)體描述的沖突評估。
你還可能感興趣
我要評論
|