模式識(shí)別:數(shù)據(jù)質(zhì)量視角
定 價(jià):79 元
叢書名:智能科學(xué)與技術(shù)叢書
- 作者:
- 出版時(shí)間:2020/3/1
- ISBN:9787111646754
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:O235
- 頁(yè)碼:0
- 紙張:
- 版次:
- 開(kāi)本:16開(kāi)
幾十年來(lái),實(shí)際需求激發(fā)了對(duì)模式識(shí)別的大量理論和應(yīng)用研究。在這個(gè)過(guò)程中,限制因素和恒久問(wèn)題一直是數(shù)據(jù)——它的多樣性、豐富性和可變質(zhì)量是模式識(shí)別創(chuàng)新的主要挑戰(zhàn)。本書關(guān)注高級(jí)數(shù)據(jù)分析和數(shù)據(jù)挖掘,創(chuàng)新之處是對(duì)數(shù)據(jù)質(zhì)量的重新定位——將數(shù)據(jù)質(zhì)量看作一個(gè)可以處理的因素,而非當(dāng)作需要克服的困難。
譯者序
前言
第一部分 基礎(chǔ)知識(shí)
第1章 模式識(shí)別:特征空間的構(gòu)建2
1.1 概念2
1.2 從樣本到特征5
1.2.1 向量型特征7
1.2.2 特征變換:從向量型到向量型8
1.2.3 特征變換:從向量型到數(shù)值型9
1.2.4 數(shù)值型特征10
1.3 特征尺度化12
1.3.1 特征歸一化13
1.3.2 標(biāo)準(zhǔn)化14
1.3.3 特征尺度的經(jīng)驗(yàn)評(píng)價(jià)15
1.4 特征評(píng)估和選擇18
1.4.1 相關(guān)性18
1.4.2 特征評(píng)估:兩種方法20
1.4.3 基于指數(shù)的特征評(píng)估:?jiǎn)翁卣髋c特征集21
1.4.4 特征評(píng)估指數(shù)21
1.4.5 基于指數(shù)的方法和基于包裝的方法23
1.4.6 使用指數(shù)和分類器的單特征評(píng)估方案24
1.4.7 特征子集的選擇27
1.4.8 特征子集的生成29
1.5 結(jié)論37
附錄1.A38
附錄1.B40
參考文獻(xiàn)40
第2章 模式識(shí)別:分類器42
2.1 概念42
2.2 最近鄰分類方法43
2.3 支持向量機(jī)分類算法45
2.3.1 線性可分類的線性劃分46
2.3.2 線性不可分類的線性劃分48
2.3.3 線性不可分類的非線性劃分50
2.4 分類問(wèn)題中的決策樹(shù)52
2.4.1 決策樹(shù)一覽52
2.4.2 特征分解57
2.4.3 度量類的差異性57
2.4.4 選擇一個(gè)分解特征60
2.4.5 限制樹(shù)的結(jié)構(gòu)61
2.5 集成分類器62
2.5.1 袋裝63
2.5.2 提升64
2.5.3 隨機(jī)森林65
2.6 貝葉斯分類器67
2.6.1 應(yīng)用貝葉斯理論67
2.6.2 最小化錯(cuò)分概率68
2.6.3 最小化損失69
2.6.4 拒絕不確定樣本70
2.6.5 類條件概率分布71
2.7 結(jié)論79
參考文獻(xiàn)79
第3章 分類拒絕問(wèn)題規(guī)范及概述82
3.1 概念82
3.2 拒絕架構(gòu)的概念87
3.3 基于原始樣本的拒絕91
3.3.1 構(gòu)建拒絕機(jī)制91
3.3.2 全局拒絕架構(gòu)下的拒絕機(jī)制92
3.3.3 局部拒絕架構(gòu)下的拒絕機(jī)制95
3.3.4 嵌入式拒絕架構(gòu)下的拒絕機(jī)制96
3.4 原始樣本數(shù)據(jù)集中的拒絕選項(xiàng):案例研究97
3.4.1 數(shù)據(jù)集97
3.4.2 構(gòu)建一個(gè)樹(shù)形二值分類器100
3.4.3 針對(duì)手寫數(shù)字?jǐn)?shù)據(jù)集構(gòu)建一個(gè)樹(shù)形二值分類器101
3.4.4 針對(duì)手寫數(shù)字?jǐn)?shù)據(jù)集構(gòu)建一個(gè)帶拒絕的樹(shù)形二值分類器103
3.4.5 拒絕被錯(cuò)分的原始樣本:一些想法105
3.5 結(jié)論106
參考文獻(xiàn)106
第4章 評(píng)估模式識(shí)別問(wèn)題108
4.1 評(píng)估帶拒絕項(xiàng)的識(shí)別:基本概念108
4.1.1 評(píng)估拒絕的效率108
4.1.2 不平衡原始集與異類集109
4.1.3 度量拒絕質(zhì)量的有效性110
4.1.4 分離原始樣本和異類樣本111
4.1.5 對(duì)多類原始樣本的適應(yīng)112
4.1.6 評(píng)估帶拒絕項(xiàng)的多類分類問(wèn)題113
4.1.7 說(shuō)明性示例114
4.2 沒(méi)有異類樣本時(shí)帶拒絕的分類問(wèn)題117
4.3 帶拒絕的分類:局部特征120
4.3.1 多類問(wèn)題的特性描述120
4.3.2 說(shuō)明性示例122
4.4 結(jié)論125
參考文獻(xiàn)126
第5章 帶拒絕的識(shí)別:經(jīng)驗(yàn)分析127
5.1 實(shí)驗(yàn)結(jié)果127
5.1.1 拒絕架構(gòu)的對(duì)比128
5.1.2 減少特征集數(shù)量131
5.1.3 分類器質(zhì)量與拒絕性能133
5.1.4 用于處理不平衡數(shù)據(jù)集的帶拒絕的分類137
5.2 幾何方法140
5.2.1 超矩形141
5.2.2 橢球體142
5.2.3 在幾何模型中限制為原始樣本保留的區(qū)域143
5.2.4 文獻(xiàn)評(píng)論153
5.3 結(jié)論155
參考文獻(xiàn)155
第二部分 高級(jí)主題:粒度計(jì)算框架
第6章 信息粒的概念158
6.1 信息粒度和粒度計(jì)算158
6.2 信息粒度的正式平臺(tái)161
6.3 區(qū)間和區(qū)間微積分164
6.4 模糊集微積分166
6.4.1 模糊集的隸屬函數(shù)和類167
6.4.2 三角范數(shù)和三角余模作為模糊集上運(yùn)算的模型170
6.5 信息粒的特征:覆蓋率和特異性173
6.6 信息粒匹配176
6.7 結(jié)論177
參考文獻(xiàn)177
第7章 信息粒:基本構(gòu)造179
7.1 合理粒度原則179
7.1.1 一般觀察182
7.1.2 加權(quán)數(shù)據(jù)182
7.1.3 抑制性數(shù)據(jù)183
7.2 對(duì)設(shè)計(jì)有價(jià)值的信息粒度184
7.2.1 粒映射184
7.2.2 信息粒度分配協(xié)議187
7.2.3 粒度聚合:通過(guò)分配信息粒度增強(qiáng)聚合操作187
7.3 時(shí)間序列模型中暫存數(shù)據(jù)的單步和多步預(yù)測(cè)188
7.4 高級(jí)類型的粒模型的開(kāi)發(fā)189
7.5 粒樣本的分類192
7.5.1 分類問(wèn)題的公式化193
7.5.2 從數(shù)值數(shù)據(jù)到粒數(shù)據(jù)193
7.5.3 粒分類器:增強(qiáng)問(wèn)題195
7.6 結(jié)論195
參考文獻(xiàn)196
第8章 聚類197
8.1 模糊c均值聚類方法197
8.2 k均值聚類算法201
8.3 帶有聚類和變量加權(quán)的增強(qiáng)模糊聚類201
8.4 基于知識(shí)的聚類202
8.5 聚類結(jié)果的質(zhì)量202
8.6 信息粒與聚類結(jié)果解釋204
8.6.1 數(shù)字原型的粒度描述符的形成204
8.6.2 數(shù)據(jù)粒度及其在FCM算法中的融合205
8.7 層次聚類205
8.8 隱私問(wèn)題中的信息粒:微聚集的概念208
8.9 更高類型信息粒的開(kāi)發(fā)208
8.10 實(shí)驗(yàn)研究209
8.11 結(jié)論217
參考文獻(xiàn)218
第9章 數(shù)據(jù)質(zhì)量:填補(bǔ)和數(shù)據(jù)平衡219
9.1 數(shù)據(jù)填補(bǔ):基本概念和關(guān)鍵問(wèn)題219
9.2 填補(bǔ)方法的選定類別220
9.3 利用信息粒進(jìn)行填補(bǔ)221
9.4 基于合理粒度原則的顆粒填補(bǔ)222
9.5 基于模糊聚類的顆粒填補(bǔ)225
9.6 系統(tǒng)建模中的數(shù)據(jù)填補(bǔ)226
9.7 不平衡數(shù)據(jù)及其粒度特征227
9.7.1 數(shù)據(jù)平衡的主要方法:概述228
9.7.2 過(guò)采樣數(shù)據(jù)的粒度表示229
9.8 結(jié)論231
參考文獻(xiàn)231