關(guān)于我們
書單推薦
新書推薦
|
數(shù)據(jù)工程理論與技術(shù)
《數(shù)據(jù)工程理論與技術(shù)》以數(shù)據(jù)的生命周期為主線,重點研究數(shù)據(jù)建模、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用和數(shù)據(jù)庫安全有關(guān)理論和技術(shù)。數(shù)據(jù)建模主要介紹了數(shù)據(jù)建模的理論、方法和工具;數(shù)據(jù)標(biāo)準(zhǔn)化重點研究了數(shù)據(jù)標(biāo)準(zhǔn)化的內(nèi)容和數(shù)據(jù)標(biāo)準(zhǔn)化方法;數(shù)據(jù)管理介紹了數(shù)據(jù)存儲、備份與容災(zāi)基礎(chǔ)知識和基本技術(shù),以及數(shù)據(jù)質(zhì)量管理的方法;數(shù)據(jù)應(yīng)用研究了數(shù)據(jù)集成、數(shù)據(jù)挖掘、數(shù)據(jù)服務(wù)、數(shù)據(jù)可視化和信息檢索的方法和技術(shù);數(shù)據(jù)庫安全重點研究了數(shù)據(jù)庫安全威脅和安全機制。
《數(shù)據(jù)工程理論與技術(shù)》著重理論、技術(shù)和實踐相結(jié)合,內(nèi)容實用、覆蓋面廣,可作為相關(guān)專業(yè)研究生和高年級本科生的教材,也可作為工程技術(shù)人員的參考書。
數(shù)據(jù)是人類社會活動、科技活動、經(jīng)濟(jì)活動和軍事活動的產(chǎn)物,它凝聚著重要的科學(xué)價值、經(jīng)濟(jì)價值、社會價值和軍事價值,是當(dāng)代社會進(jìn)步、經(jīng)濟(jì)發(fā)展、科技創(chuàng)新、新軍事變革的重要資源和基礎(chǔ),數(shù)據(jù)資源的開發(fā)和利用已成為推動社會發(fā)展和進(jìn)步的重要力量。
隨著信息技術(shù)的迅猛發(fā)展,我們面臨許多新的數(shù)據(jù)問題。首先,數(shù)據(jù)量爆炸式增長,數(shù)據(jù)管理的難度和壓力日益增加;其次,社會信息化發(fā)展導(dǎo)致不同的信息系統(tǒng)的交流日益廣泛,我們對數(shù)據(jù)共享共用的要求越來越高,以業(yè)務(wù)為中心的傳統(tǒng)信息系統(tǒng)開發(fā)模式難以適應(yīng)這種要求;最后,很多信息系統(tǒng)本身功能強大,但由于缺乏有效數(shù)據(jù)的支撐,導(dǎo)致其應(yīng)有的效益難以發(fā)揮,數(shù)據(jù)資源的建設(shè)發(fā)展已成為制約信息系統(tǒng)效益發(fā)揮的瓶頸。數(shù)據(jù)工程正是在這種背景下產(chǎn)生的一門新興學(xué)科。 數(shù)據(jù)工程是信息系統(tǒng)的基礎(chǔ)工程,圍繞數(shù)據(jù)的生命周期,規(guī)范數(shù)據(jù)從產(chǎn)生到應(yīng)用的全過程,目標(biāo)是為信息系統(tǒng)的運行提供可靠的數(shù)據(jù)保障和服務(wù),為信息系統(tǒng)之間的數(shù)據(jù)共享提供安全、高效的支撐環(huán)境,為信息系統(tǒng)實現(xiàn)互連、互通、互操作提供有力的數(shù)據(jù)支撐。它是實現(xiàn)這些目標(biāo)的一系列技術(shù)、方法和工程建設(shè)活動的總稱。主要研究內(nèi)容包括數(shù)據(jù)建模、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用和數(shù)據(jù)安全有關(guān)理論和技術(shù)。 數(shù)據(jù)建模是對現(xiàn)實世界中具體的人、物、活動、概念進(jìn)行抽象、表示和處理,變成計算機可處理的數(shù)據(jù),也就是把現(xiàn)實世界中的數(shù)據(jù)從現(xiàn)實世界抽象到信息世界和計算機世界。數(shù)據(jù)建模主要研究如何運用關(guān)系數(shù)據(jù)庫設(shè)計理論,利用數(shù)據(jù)建模工具,建立既能正確反映客觀世界,又便于計算機處理的數(shù)據(jù)模型。 數(shù)據(jù)標(biāo)準(zhǔn)化主要為復(fù)雜的信息表達(dá)、分類和定位建立相應(yīng)的原則和規(guī)范,并在信息化建設(shè)中予以宣傳、貫徹和執(zhí)行的過程。數(shù)據(jù)標(biāo)準(zhǔn)化重點研究數(shù)據(jù)標(biāo)準(zhǔn)化的內(nèi)容、數(shù)據(jù)標(biāo)準(zhǔn)化的方法等。 數(shù)據(jù)管理是保證數(shù)據(jù)有效性的前提。首先要通過合理、安全、有效的方式將數(shù)據(jù)保存到數(shù)據(jù)存儲介質(zhì)上,實現(xiàn)數(shù)據(jù)的長期保存;然后,需要對數(shù)據(jù)進(jìn)行維護(hù)管理,提高數(shù)據(jù)的質(zhì)量。數(shù)據(jù)管理研究的主要內(nèi)容包括數(shù)據(jù)存儲、備份與容災(zāi)的技術(shù)和方法,以及數(shù)據(jù)質(zhì)量管理方法。 數(shù)據(jù)應(yīng)用通過數(shù)據(jù)集成、數(shù)據(jù)挖掘、數(shù)據(jù)服務(wù)、數(shù)據(jù)可視化、信息檢索等手段,將數(shù)據(jù)轉(zhuǎn)為信息或知識,輔助人們進(jìn)行決策。數(shù)據(jù)應(yīng)用研究的主要內(nèi)容包括數(shù)據(jù)集成、數(shù)據(jù)挖掘、數(shù)據(jù)服務(wù)、數(shù)據(jù)可視化和信息檢索的相關(guān)技術(shù)和方法。 數(shù)據(jù)安全是采取一定的安全措施,確保合法用戶采用正確的方式、在正確的時間對相應(yīng)的數(shù)據(jù)進(jìn)行正確的操作,確保數(shù)據(jù)的機密性、完整性、可用性和合法使用。數(shù)據(jù)安全包括數(shù)據(jù)訪問安全、數(shù)據(jù)傳輸安全、數(shù)據(jù)存儲安全和數(shù)據(jù)庫安全。
第1章 緒論
1.1 數(shù)據(jù) 1.1.1 數(shù)據(jù)的定義與生命周期 1.1.2 數(shù)據(jù)的特性 1.1.3 數(shù)第1章 緒論 1.1 數(shù)據(jù) 1.1.1 數(shù)據(jù)的定義與生命周期 1.1.2 數(shù)據(jù)的特性 1.1.3 數(shù)據(jù)與信息、知識、智慧的關(guān)系 1.2 數(shù)據(jù)工程概述 1.2.1 數(shù)據(jù)工程產(chǎn)生的背景 1.2.2 數(shù)據(jù)工程的內(nèi)涵 1.2.3 數(shù)據(jù)工程研究的對象 1.3 數(shù)據(jù)工程的現(xiàn)狀與發(fā)展 1.3.1 美軍數(shù)據(jù)管理策略的演進(jìn) 1.3.2 我國數(shù)據(jù)工程建設(shè)現(xiàn)狀 第2章 數(shù)據(jù)建模 2.1 關(guān)系數(shù)據(jù)庫設(shè)計理論 2.1.1 關(guān)系模型的基本概念 2.1.2 數(shù)據(jù)依賴 2.1.3 范式 2.1.4 關(guān)系模式規(guī)范化 2.2 數(shù)據(jù)模型 2.2.1 概念模型 2.2.2 邏輯模型 2.2.3 物理模型 2.2.4 數(shù)據(jù)模型標(biāo)記符號 2.3 數(shù)據(jù)建模方法 2.3.1 數(shù)據(jù)需求分析 2.3.2 概念模型設(shè)計 2.3.3 邏輯模型設(shè)計 2.3.4 物理模型設(shè)計 2.4 PowerDesigner建模工具 2.4.1 PowerDesigner主界面 2.4.2 構(gòu)建概念模型 2.4.3 從概念模型創(chuàng)建邏輯模型 2.4.4 從邏輯模型創(chuàng)建物理模型 2.4.5 生成模型報告 2.4.6 創(chuàng)建數(shù)據(jù)庫 第3章 數(shù)據(jù)標(biāo)準(zhǔn)化 3.1 概述 3.1.1 標(biāo)準(zhǔn)和標(biāo)準(zhǔn)化 3.1.2 數(shù)據(jù)標(biāo)準(zhǔn)化的概念 3.2 元數(shù)據(jù)標(biāo)準(zhǔn)化 3.2.1 元數(shù)據(jù)的定義、作用和結(jié)構(gòu) 3.2.2 信息資源元數(shù)據(jù)標(biāo)準(zhǔn) 3.2.3 數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)內(nèi)容 3.3 數(shù)據(jù)元標(biāo)準(zhǔn)化 3.3.1 數(shù)據(jù)元基本概念和組成 3.3.2 數(shù)據(jù)元基本屬性及描述符 3.3.3 數(shù)據(jù)元命名規(guī)則 3.3.4 數(shù)據(jù)元標(biāo)準(zhǔn)制定 3.4 數(shù)據(jù)模式標(biāo)準(zhǔn)化 3.4.1 數(shù)據(jù)模式標(biāo)準(zhǔn)化內(nèi)容及作用 3.4.2 數(shù)據(jù)模式規(guī)范化描述方法 3.4.3 數(shù)據(jù)模式標(biāo)準(zhǔn)化實例 3.5 數(shù)據(jù)分類與編碼標(biāo)準(zhǔn)化 3.5.1 數(shù)據(jù)分類與編碼的定義和作用 3.5.2 數(shù)據(jù)分類的基本原則和方法 3.5.3 數(shù)據(jù)編碼的基本原則和方法 3.6 數(shù)據(jù)標(biāo)準(zhǔn)化管理 3.6.1 確定數(shù)據(jù)需求 3.6.2 制定數(shù)據(jù)標(biāo)準(zhǔn) 3.6.3 批準(zhǔn)數(shù)據(jù)標(biāo)準(zhǔn) 3.6.4 實施數(shù)據(jù)標(biāo)準(zhǔn) 第4章 數(shù)據(jù)存儲、備份與容災(zāi) 4.1 數(shù)據(jù)存儲 4.1.1 數(shù)據(jù)存儲介質(zhì) 4.1.2 數(shù)據(jù)存儲技術(shù) 4.1.3 存儲管理 4.2 數(shù)據(jù)備份 4.2.1 備份結(jié)構(gòu) 4.2.2 備份策略 4.2.3 備份軟件 4.2.4 數(shù)據(jù)庫備份 4.3 數(shù)據(jù)容災(zāi) 4.3.1 數(shù)據(jù)容災(zāi)與數(shù)據(jù)備份的關(guān)系 4.3.2 數(shù)據(jù)容災(zāi)的國際標(biāo)準(zhǔn) 4.3.3 數(shù)據(jù)容災(zāi)的關(guān)鍵技術(shù) 4.3.4 數(shù)據(jù)容災(zāi)的典型案例 第5章 數(shù)據(jù)質(zhì)量管理 5.1 數(shù)據(jù)質(zhì)量管理思想 5.2 數(shù)據(jù)質(zhì)量描述 5.2.1 數(shù)據(jù)質(zhì)量定量元素 5.2.2 數(shù)據(jù)質(zhì)量非定量元素 5.3 數(shù)據(jù)質(zhì)量評價 5.3.1 數(shù)據(jù)質(zhì)量評價過程 5.3.2 數(shù)據(jù)質(zhì)量評價方法 5.4 數(shù)據(jù)質(zhì)量控制 5.4.1 數(shù)據(jù)生命周期各階段對質(zhì)量的影響 5.4.2 數(shù)據(jù)質(zhì)量控制過程 5.4.3 數(shù)據(jù)質(zhì)量控制實施 5.5 數(shù)據(jù)清理 5.5.1 數(shù)據(jù)清理的處理流程 5.5.2 數(shù)據(jù)清理的主要工具 5.5.3 相似重復(fù)數(shù)據(jù)的清理 5.5.4 不完整數(shù)據(jù)的清理 5.5.5 錯誤數(shù)據(jù)的清理 第6章 數(shù)據(jù)集成 6.1 數(shù)據(jù)集成概述 6.2 數(shù)據(jù)集成的常用方法 6.2.1 模式集成方法 6.2.2 數(shù)據(jù)復(fù)制方法 6.2.3 混合型集成方法 6.3 數(shù)據(jù)集成的常見標(biāo)準(zhǔn)與技術(shù) 6.3.1 數(shù)據(jù)訪問接口 6.3.2 Web Services技術(shù) 6.3.3 數(shù)據(jù)網(wǎng)格技術(shù) 6.4 數(shù)據(jù)集成的典型結(jié)構(gòu) 6.4.1 IBM信息集成平臺 6.4.2 ORACLE數(shù)據(jù)集成架構(gòu) 第7章 數(shù)據(jù)挖掘 7.1 數(shù)據(jù)挖掘概述 7.1.1 數(shù)據(jù)挖掘的內(nèi)涵和任務(wù) 7.1.2 數(shù)據(jù)挖掘的過程 7.1.3 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫 7.2 數(shù)據(jù)挖掘的方法 7.2.1 數(shù)據(jù)總結(jié)方法 7.2.2 關(guān)聯(lián)分析方法 7.2.3 分類和預(yù)測方法 7.2.4 聚類分析方法 7.3 多維數(shù)據(jù)分析 7.3.1 多維數(shù)據(jù)模型 7.3.2 多維數(shù)據(jù)分析基本操作 第8章 數(shù)據(jù)應(yīng)用 8.1 數(shù)據(jù)服務(wù) 8.1.1 數(shù)據(jù)目錄服務(wù) 8.1.2 數(shù)據(jù)查詢、瀏覽和下載服務(wù) 8.1.3 數(shù)據(jù)分發(fā)服務(wù) 8.2 數(shù)據(jù)可視化 8.2.1 一維數(shù)據(jù)可視化 8.2.2 二維數(shù)據(jù)可視化 8.2.3 三維數(shù)據(jù)可視化 8.2.4 多維數(shù)據(jù)可視化 8.2.5 其他數(shù)據(jù)可視化 8.3 信息檢索 8.3.1 信息檢索簡介 8.3.2 數(shù)據(jù)庫搜索引擎技術(shù) 8.3.3 互聯(lián)網(wǎng)搜索引擎技術(shù) 第9章 數(shù)據(jù)庫安全 9.1 數(shù)據(jù)庫安全概述 9.1.1 數(shù)據(jù)庫安全威脅 9.1.2 數(shù)據(jù)庫安全對策 9.2 數(shù)據(jù)庫安全機制 9.2.1 身份認(rèn)證 9.2.2 存取控制 9.2.3 數(shù)據(jù)庫加密 9.2.4 數(shù)據(jù)庫審計 9.2.5 推理控制與隱私保護(hù) 9.2.6 入侵容忍技術(shù) 9.3 Oracle安全措施 9.3.1 身份認(rèn)證 9.3.2 授權(quán)與檢查機制 9.3.3 數(shù)據(jù)加密 9.3.4 數(shù)據(jù)審計 9.3.5 用戶定義的安全性措施 參考文獻(xiàn)據(jù)與信息、知識、智慧的關(guān)系 1.2 數(shù)據(jù)工程概述 1.2.1 數(shù)據(jù)工程產(chǎn)生的背景 1.2.2 數(shù)據(jù)工程的內(nèi)涵 1.2.3 數(shù)據(jù)工程研究的對象 1.3 數(shù)據(jù)工程的現(xiàn)狀與發(fā)展 1.3.1 美軍數(shù)據(jù)管理策略的演進(jìn) 1.3.2 我國數(shù)據(jù)工程建設(shè)現(xiàn)狀 第2章 數(shù)據(jù)建模 2.1 關(guān)系數(shù)據(jù)庫設(shè)計理論 2.1.1 關(guān)系模型的基本概念 2.1.2 數(shù)據(jù)依賴 2.1.3 范式 2.1.4 關(guān)系模式規(guī)范化 2.2 數(shù)據(jù)模型 2.2.1 概念模型 2.2.2 邏輯模型 2.2.3 物理模型 2.2.4 數(shù)據(jù)模型標(biāo)記符號 2.3 數(shù)據(jù)建模方法 2.3.1 數(shù)據(jù)需求分析 2.3.2 概念模型設(shè)計 2.3.3 邏輯模型設(shè)計 2.3.4 物理模型設(shè)計 2.4 PowerDesigner建模工具 2.4.1 PowerDesigner主界面 2.4.2 構(gòu)建概念模型 2.4.3 從概念模型創(chuàng)建邏輯模型 2.4.4 從邏輯模型創(chuàng)建物理模型 2.4.5 生成模型報告 2.4.6 創(chuàng)建數(shù)據(jù)庫 第3章 數(shù)據(jù)標(biāo)準(zhǔn)化 3.1 概述 3.1.1 標(biāo)準(zhǔn)和標(biāo)準(zhǔn)化 3.1.2 數(shù)據(jù)標(biāo)準(zhǔn)化的概念 3.2 元數(shù)據(jù)標(biāo)準(zhǔn)化 3.2.1 元數(shù)據(jù)的定義、作用和結(jié)構(gòu) 3.2.2 信息資源元數(shù)據(jù)標(biāo)準(zhǔn) 3.2.3 數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)內(nèi)容 3.3 數(shù)據(jù)元標(biāo)準(zhǔn)化 3.3.1 數(shù)據(jù)元基本概念和組成 3.3.2 數(shù)據(jù)元基本屬性及描述符 3.3.3 數(shù)據(jù)元命名規(guī)則 3.3.4 數(shù)據(jù)元標(biāo)準(zhǔn)制定 3.4 數(shù)據(jù)模式標(biāo)準(zhǔn)化 3.4.1 數(shù)據(jù)模式標(biāo)準(zhǔn)化內(nèi)容及作用 3.4.2 數(shù)據(jù)模式規(guī)范化描述方法 3.4.3 數(shù)據(jù)模式標(biāo)準(zhǔn)化實例 3.5 數(shù)據(jù)分類與編碼標(biāo)準(zhǔn)化 3.5.1 數(shù)據(jù)分類與編碼的定義和作用 3.5.2 數(shù)據(jù)分類的基本原則和方法 3.5.3 數(shù)據(jù)編碼的基本原則和方法 3.6 數(shù)據(jù)標(biāo)準(zhǔn)化管理 3.6.1 確定數(shù)據(jù)需求 3.6.2 制定數(shù)據(jù)標(biāo)準(zhǔn) 3.6.3 批準(zhǔn)數(shù)據(jù)標(biāo)準(zhǔn) 3.6.4 實施數(shù)據(jù)標(biāo)準(zhǔn) 第4章 數(shù)據(jù)存儲、備份與容災(zāi) 4.1 數(shù)據(jù)存儲 4.1.1 數(shù)據(jù)存儲介質(zhì) 4.1.2 數(shù)據(jù)存儲技術(shù) 4.1.3 存儲管理 4.2 數(shù)據(jù)備份 4.2.1 備份結(jié)構(gòu) 4.2.2 備份策略 4.2.3 備份軟件 4.2.4 數(shù)據(jù)庫備份 4.3 數(shù)據(jù)容災(zāi) 4.3.1 數(shù)據(jù)容災(zāi)與數(shù)據(jù)備份的關(guān)系 4.3.2 數(shù)據(jù)容災(zāi)的國際標(biāo)準(zhǔn) 4.3.3 數(shù)據(jù)容災(zāi)的關(guān)鍵技術(shù) 4.3.4 數(shù)據(jù)容災(zāi)的典型案例 第5章 數(shù)據(jù)質(zhì)量管理 5.1 數(shù)據(jù)質(zhì)量管理思想 5.2 數(shù)據(jù)質(zhì)量描述 5.2.1 數(shù)據(jù)質(zhì)量定量元素 5.2.2 數(shù)據(jù)質(zhì)量非定量元素 5.3 數(shù)據(jù)質(zhì)量評價 5.3.1 數(shù)據(jù)質(zhì)量評價過程 5.3.2 數(shù)據(jù)質(zhì)量評價方法 5.4 數(shù)據(jù)質(zhì)量控制 5.4.1 數(shù)據(jù)生命周期各階段對質(zhì)量的影響 5.4.2 數(shù)據(jù)質(zhì)量控制過程 5.4.3 數(shù)據(jù)質(zhì)量控制實施 5.5 數(shù)據(jù)清理 5.5.1 數(shù)據(jù)清理的處理流程 5.5.2 數(shù)據(jù)清理的主要工具 5.5.3 相似重復(fù)數(shù)據(jù)的清理 5.5.4 不完整數(shù)據(jù)的清理 5.5.5 錯誤數(shù)據(jù)的清理 第6章 數(shù)據(jù)集成 6.1 數(shù)據(jù)集成概述 6.2 數(shù)據(jù)集成的常用方法 6.2.1 模式集成方法 6.2.2 數(shù)據(jù)復(fù)制方法 6.2.3 混合型集成方法 6.3 數(shù)據(jù)集成的常見標(biāo)準(zhǔn)與技術(shù) 6.3.1 數(shù)據(jù)訪問接口 6.3.2 Web Services技術(shù) 6.3.3 數(shù)據(jù)網(wǎng)格技術(shù) 6.4 數(shù)據(jù)集成的典型結(jié)構(gòu) 6.4.1 IBM信息集成平臺 6.4.2 ORACLE數(shù)據(jù)集成架構(gòu) 第7章 數(shù)據(jù)挖掘 7.1 數(shù)據(jù)挖掘概述 7.1.1 數(shù)據(jù)挖掘的內(nèi)涵和任務(wù) 7.1.2 數(shù)據(jù)挖掘的過程 7.1.3 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫 7.2 數(shù)據(jù)挖掘的方法 7.2.1 數(shù)據(jù)總結(jié)方法 7.2.2 關(guān)聯(lián)分析方法 7.2.3 分類和預(yù)測方法 7.2.4 聚類分析方法 7.3 多維數(shù)據(jù)分析 7.3.1 多維數(shù)據(jù)模型 7.3.2 多維數(shù)據(jù)分析基本操作 第8章 數(shù)據(jù)應(yīng)用 8.1 數(shù)據(jù)服務(wù) 8.1.1 數(shù)據(jù)目錄服務(wù) 8.1.2 數(shù)據(jù)查詢、瀏覽和下載服務(wù) 8.1.3 數(shù)據(jù)分發(fā)服務(wù) 8.2 數(shù)據(jù)可視化 8.2.1 一維數(shù)據(jù)可視化 8.2.2 二維數(shù)據(jù)可視化 8.2.3 三維數(shù)據(jù)可視化 8.2.4 多維數(shù)據(jù)可視化 8.2.5 其他數(shù)據(jù)可視化 8.3 信息檢索 8.3.1 信息檢索簡介 8.3.2 數(shù)據(jù)庫搜索引擎技術(shù) 8.3.3 互聯(lián)網(wǎng)搜索引擎技術(shù) 第9章 數(shù)據(jù)庫安全 9.1 數(shù)據(jù)庫安全概述 9.1.1 數(shù)據(jù)庫安全威脅 9.1.2 數(shù)據(jù)庫安全對策 9.2 數(shù)據(jù)庫安全機制 9.2.1 身份認(rèn)證 9.2.2 存取控制 9.2.3 數(shù)據(jù)庫加密 9.2.4 數(shù)據(jù)庫審計 9.2.5 推理控制與隱私保護(hù) 9.2.6 入侵容忍技術(shù) 9.3 Oracle安全措施 9.3.1 身份認(rèn)證 9.3.2 授權(quán)與檢查機制 9.3.3 數(shù)據(jù)加密 9.3.4 數(shù)據(jù)審計 9.3.5 用戶定義的安全性措施 參考文獻(xiàn)
1.數(shù)據(jù)工程概念
數(shù)據(jù)工程是以數(shù)據(jù)作為研究對象、以數(shù)據(jù)活動為研究內(nèi)容,以實現(xiàn)數(shù)據(jù)重用、共享與應(yīng)用為目標(biāo)的科學(xué)。 從應(yīng)用的觀點出發(fā),數(shù)據(jù)工程是關(guān)于數(shù)據(jù)生產(chǎn)和數(shù)據(jù)使用的信息系統(tǒng)工程。數(shù)據(jù)的生產(chǎn)者將經(jīng)過規(guī)范化處理的、語義清晰的數(shù)據(jù)提供給數(shù)據(jù)應(yīng)用者使用。 從生命周期的觀點出發(fā),數(shù)據(jù)工程是關(guān)于數(shù)據(jù)定義、標(biāo)準(zhǔn)化、采集、處理、運用、共享與重用、存儲和容災(zāi)備份的信息系統(tǒng)工程,強調(diào)對數(shù)據(jù)的全壽命管理。 從學(xué)科發(fā)展角度看,數(shù)據(jù)工程是設(shè)計和實現(xiàn)數(shù)據(jù)庫系統(tǒng)及數(shù)據(jù)庫應(yīng)用系統(tǒng)的理論、方法和技術(shù),是研究結(jié)構(gòu)化數(shù)據(jù)表示、數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用的一門學(xué)科。 2.數(shù)據(jù)工程研究的內(nèi)容 數(shù)據(jù)工程研究的主要內(nèi)容包括數(shù)據(jù)建模、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用和數(shù)據(jù)安全等。 (1)數(shù)據(jù)建!,F(xiàn)實世界中的數(shù)據(jù)描述現(xiàn)實世界中的一些事物的某些方面的特征及其相互聯(lián)系,是原始的、非規(guī)范化的。通過數(shù)據(jù)建模,對現(xiàn)實世界中具體的人、物、活動、概念進(jìn)行抽象、表示和處理,變成計算機可處理的數(shù)據(jù),也就是把現(xiàn)實世界中的數(shù)據(jù)抽象到信息世界和計算機世界。數(shù)據(jù)建模主要研究如何運用關(guān)系數(shù)據(jù)庫設(shè)計理論,利用數(shù)據(jù)建模工具,建立既能正確反映客觀世界,又便于計算機處理的數(shù)據(jù)模型。 (2)數(shù)據(jù)標(biāo)準(zhǔn)化。數(shù)據(jù)標(biāo)準(zhǔn)化主要為復(fù)雜的信息表達(dá)、分類和定位建立相應(yīng)的原則和規(guī)范,使其簡單化、結(jié)構(gòu)化和標(biāo)準(zhǔn)化,從而實現(xiàn)信息的可理解、可比較和可共享,為信息在異構(gòu)系統(tǒng)之間實現(xiàn)語義互操作提供基礎(chǔ)支撐。 數(shù)據(jù)標(biāo)準(zhǔn)化主要是在現(xiàn)有國家、部門、地方和企業(yè)的現(xiàn)有標(biāo)準(zhǔn)規(guī)范基礎(chǔ)上,結(jié)合國際相關(guān)標(biāo)準(zhǔn),制定數(shù)據(jù)標(biāo)準(zhǔn),并在信息化建設(shè)中宣傳、貫徹和執(zhí)行。數(shù)據(jù)標(biāo)準(zhǔn)化重點研究數(shù)據(jù)標(biāo)準(zhǔn)化的組成和方法等內(nèi)容。 (3)數(shù)據(jù)管理。數(shù)據(jù)管理是保證數(shù)據(jù)有效性的前提。首先要通過合理、安全、有效的方式將數(shù)據(jù)保存到數(shù)據(jù)存儲介質(zhì)上,實現(xiàn)數(shù)據(jù)的長期保存;然后對數(shù)據(jù)進(jìn)行維護(hù)管理,提高數(shù)據(jù)的質(zhì)量。數(shù)據(jù)管理研究的主要內(nèi)容包括數(shù)據(jù)存儲、備份與容災(zāi)的技術(shù)和方法,以及數(shù)據(jù)質(zhì)量因素、數(shù)據(jù)質(zhì)量評價方法和數(shù)據(jù)清理方法。
你還可能感興趣
我要評論
|