實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析
定 價(jià):78 元
叢書名:現(xiàn)代物理基礎(chǔ)叢書
- 作者:朱永生編著
- 出版時(shí)間:2017/3/1
- ISBN:9787030236760
- 出 版 社:科學(xué)出版社
- 中圖法分類:O212.4
- 頁碼:
- 紙張:膠版紙
- 版次:31
- 開本:B5
《現(xiàn)代物理基礎(chǔ)叢書·典藏版:實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析》介紹實(shí)驗(yàn)或測(cè)量數(shù)據(jù)的多元統(tǒng)計(jì)分析方法,內(nèi)容包括:貝葉斯決策、線性判別方法、決策樹判別、人工神經(jīng)網(wǎng)絡(luò)、近鄰法、概率密度估計(jì)量法、H矩陣判別、函數(shù)判別分析、支持向量機(jī)法等,以及不同判別方法的比較。此外,還簡(jiǎn)要介紹了將多種多元統(tǒng)計(jì)分析方法的計(jì)算機(jī)程序匯集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理實(shí)驗(yàn)數(shù)據(jù)分析中應(yīng)用多元統(tǒng)計(jì)分析方法的一些實(shí)例。
《現(xiàn)代物理基礎(chǔ)叢書·典藏版:實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析》可供實(shí)驗(yàn)物理工作者和大專院校相關(guān)專業(yè)師生、理論物理研究人員、工程技術(shù)人員及從事自然科學(xué)和社會(huì)科學(xué)的數(shù)據(jù)測(cè)量和分析研究人員參考。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
導(dǎo)語_點(diǎn)評(píng)_推薦詞
復(fù)雜大系統(tǒng)的科學(xué)研究往往都需要收集和處理大量反映系統(tǒng)特征和運(yùn)行狀態(tài)的數(shù)據(jù)信息,這類原始數(shù)據(jù)集合由于樣本數(shù)量巨大,刻畫系統(tǒng)特征的指標(biāo)變量眾多,并且?guī)в须S機(jī)性質(zhì),以致于形成了規(guī)模宏大、復(fù)雜難辨的數(shù)據(jù)海洋。利用統(tǒng)計(jì)學(xué)和數(shù)學(xué)方法對(duì)多維復(fù)雜數(shù)據(jù)集合進(jìn)行科學(xué)的分析,挖掘出隱藏在復(fù)雜海量數(shù)據(jù)中的規(guī)律和信息,就是多元統(tǒng)計(jì)分析研究的基本內(nèi)容。
大型高能物理實(shí)驗(yàn)就是典型的復(fù)雜大系統(tǒng)的科學(xué)研究工作。20世紀(jì)80年代末北京正負(fù)電子對(duì)撞機(jī)(BEPC)和北京譜儀(BES)的建成,是中國高能加速器實(shí)驗(yàn)物理的真正開端。在北京譜儀上進(jìn)行實(shí)驗(yàn)工作的研究組是以譜儀的名稱(Beijing Spectrometer)命名的,簡(jiǎn)稱BES合作組,它是由多國物理學(xué)家組成的國際合作研究組,我國物理學(xué)家在其中占有主導(dǎo)性的地位。北京譜儀成功地運(yùn)行到2004年,獲取了-粲能區(qū)海量的高能物理實(shí)驗(yàn)數(shù)據(jù)。在此基礎(chǔ)上,應(yīng)用多元統(tǒng)計(jì)分析方法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,獲得了大量居于當(dāng)時(shí)世界領(lǐng)先水平的物理成果。其中,輕子質(zhì)量的精確測(cè)量、2-5GeV能區(qū)R值的精確測(cè)量、共振態(tài)X(1835)的實(shí)驗(yàn)觀察、粒子的實(shí)驗(yàn)確定,更是引起當(dāng)時(shí)國際高能物理界廣泛矚目的重大成就。
為了保持和發(fā)展我國在高能物理粲能區(qū)實(shí)驗(yàn)研究的領(lǐng)先地位,我國政府又撥巨資對(duì)北京正負(fù)電子對(duì)撞機(jī)和北京譜儀進(jìn)行升級(jí)改進(jìn),稱為BEPCII和BESIII。BEPCII的設(shè)計(jì)指標(biāo)是產(chǎn)生粒子反應(yīng)的強(qiáng)度約為原對(duì)撞機(jī)的100倍,BESIII的性能則比原北京譜儀有大幅度的提高。目前,BEPCII和BESIII已經(jīng)完成安裝,并在2008年開始實(shí)驗(yàn)取數(shù)。有理由期望,利用升級(jí)改進(jìn)后的BESIII,可以獲得比原北京譜儀更多、更精細(xì)、更重要的物理成果。為了達(dá)到這一目標(biāo),應(yīng)用比原北京譜儀數(shù)據(jù)分析更為精細(xì)、更為有效的多元統(tǒng)計(jì)分析方法成為一個(gè)十分重要和急迫的任務(wù)。事實(shí)上,多元統(tǒng)計(jì)分析方法應(yīng)用于高能物理實(shí)驗(yàn)數(shù)據(jù)分析近年來已經(jīng)成為國際高能物理界的一種普遍趨勢(shì)。
本書對(duì)于實(shí)驗(yàn)數(shù)據(jù)分析中,特別是高能物理實(shí)驗(yàn)數(shù)據(jù)分析中涉及的多元統(tǒng)計(jì)分析方法作一概略的介紹。重點(diǎn)討論統(tǒng)計(jì)識(shí)別的基本原理以及進(jìn)行統(tǒng)計(jì)識(shí)別的具體方法;對(duì)于復(fù)雜的數(shù)學(xué)理論,只介紹其結(jié)果,而不作深?yuàn)W的證明。目的是希望讀者能夠通過本書掌握多元統(tǒng)計(jì)分析的方法并將其付諸實(shí)施,特別是能在BESIII的數(shù)據(jù)
目錄
前言
第一章 緒論 1
1.1 模式和模式識(shí)別 1
1.2 模式識(shí)別系統(tǒng) 2
1.2.1 原始數(shù)據(jù)獲取 3
1.2.2 原始數(shù)據(jù)的預(yù)處理 3
1.2.3 特征提取和選擇 6
1.2.4 分類決策 6
1.3 數(shù)據(jù)矩陣與樣本空間 9
1.3.1 數(shù)據(jù)矩陣與樣本空間 9
1.3.2 模式的相似性度量 11
1.3.3 樣本點(diǎn)的權(quán)重和特征向量數(shù)據(jù)的預(yù)處理 12
1.4 主成分分析 15
1.4.1 主成分分析的基本思想 16
1.4.2 主成分分析算法 17
1.4.3 降維處理及信息損失 19
第二章 貝葉斯決策 21
2.1 基于最小錯(cuò)誤率的貝葉斯決策 21
2.1.1 決策規(guī)則 21
2.1.2 錯(cuò)誤率 23
2.1.3 分類器設(shè)計(jì) 25
2.2 Neyman-Pearson決策 26
2.3 正態(tài)分布時(shí)的貝葉斯決策 28
2.4 分類器的效率和錯(cuò)誤率 30
2.4.1 分類器的效率、錯(cuò)誤率和判選率矩陣 30
2.4.2 錯(cuò)誤率的上界 32
2.4.3 利用檢驗(yàn)樣本集估計(jì)判選率矩陣和錯(cuò)誤率 33
2.4.4 訓(xùn)練樣本集和檢驗(yàn)樣本集的劃分 35
2.4.5 利用判選率矩陣估計(jì)各類“真實(shí)”樣本數(shù) 37
2.4.6 分類器判定的“信號(hào)”樣本中錯(cuò)判事例的扣除 39
2.5 討論 41
第三章 線性判別方法 43
3.1 線性判別函數(shù) 43
3.1.1 線性判別函數(shù)的基本概念 43
3.1.2 廣義線性判別函數(shù) 46
3.1.3 線性分類器的設(shè)計(jì) 48
3.2 Fisher線性判別 48
3.3 感知準(zhǔn)則函數(shù) 54
3.3.1 幾個(gè)基本概念 54
3.3.2 感知準(zhǔn)則函數(shù) 56
3.4 最小錯(cuò)分樣本數(shù)準(zhǔn)則函數(shù) 58
3.5 最小平方誤差準(zhǔn)則函數(shù) 60
3.5.1 平方誤差準(zhǔn)則函數(shù)及其MSE解 60
3.5.2 MSE準(zhǔn)則函數(shù)的梯度下降算法 62
3.5.3 隨機(jī)MSE準(zhǔn)則函數(shù)及其隨機(jī)逼近算法 63
3.6 多類問題 65
第四章 決策樹判別 68
4.1 超長方體分割法 68
4.1.1 超長方體分割法的基本思想 68
4.1.2 超長方體分割法中閾值的確定 69
4.1.3 超長方體分割法的優(yōu)缺點(diǎn)及其改進(jìn) 71
4.1.4 超長方體分割法用于高能物理實(shí)驗(yàn)分析 73
4.2 決策樹法 79
4.2.1 決策樹法的基本思想 79
4.2.2 信號(hào)/本底二元決策樹的構(gòu)建 81
4.2.3 決策樹的修剪 83
4.3 決策樹林法 84
4.3.1 決策樹林的構(gòu)建 85
4.3.2 決策樹林對(duì)輸入事例的分類 86
4.3.3 重抽樣法構(gòu)建決策樹林 87
第五章人工神經(jīng)網(wǎng)絡(luò) 88
5.1 概述 88
5.1.1 生物神經(jīng)元和人工神經(jīng)元 88
5.1.2 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成和學(xué)習(xí)規(guī)則 90
5.2 感知器 93
5.2.1 單輸出單元感知器 93
5.2.2 多輸出單元感知器 94
5.3 多層前向神經(jīng)網(wǎng)絡(luò)和誤差逆?zhèn)鞑ニ惴?96
5.3.1 BP網(wǎng)絡(luò)學(xué)習(xí)算法 97
5.3.2 BP網(wǎng)絡(luò)學(xué)習(xí)算法的改進(jìn) 100
5.4 Hopfield神經(jīng)網(wǎng)絡(luò) 103
5.4.1 離散 Hopfield網(wǎng)絡(luò) 103
5.4.2 連續(xù) Hopfield網(wǎng)絡(luò) 109
5.4.3 Hopfield網(wǎng)絡(luò)在優(yōu)化計(jì)算中的應(yīng)用 111
5.5 隨機(jī)神經(jīng)網(wǎng)絡(luò) 115
5.5.1 隨機(jī)神經(jīng)網(wǎng)絡(luò)的基本思想 115
5.5.2 模擬退火算法 116
5.5.3 Boltzmann機(jī)及其工作規(guī)則 118
5.5.4 Boltzmann機(jī)學(xué)習(xí)規(guī)則 120
5.5.5 隨機(jī)神經(jīng)網(wǎng)絡(luò)小結(jié) 126
5.6 神經(jīng)網(wǎng)絡(luò)用于粒子鑒別 127
5.6.1 用于帶電粒子鑒別的特征變量 127
5.6.2 帶電粒子鑒別的神經(jīng)網(wǎng)絡(luò)的架構(gòu) 130
5.6.3 網(wǎng)絡(luò)的訓(xùn)練和粒子鑒別效果 132
第六章 近鄰法 135
6.1 最近鄰法 135
6.2 k近鄰法 136
6.3 剪輯近鄰法 138
6.3.1 兩分剪輯近鄰法 139
6.3.2 重復(fù)剪輯近鄰法 141
6.4 可作拒絕決策的近鄰法 143
6.4.1 具有拒絕決策的k近鄰法 143
6.4.2 具有拒絕決策的剪輯近鄰法 144
第七章 其他非線性判別方法 146
7.1 概率密度估計(jì)量方法 146
7.1.1 基本思想 146
7.1.2 總體概率密度的非參數(shù)估計(jì) 147
7.1.3 投影似然比估計(jì) 153
7.1.4 多維概率密度估計(jì) 155
7.1.5 近鄰體積中樣本數(shù)的確定 155
7.1.6 概率密度估計(jì)法與神經(jīng)網(wǎng)絡(luò)的性能對(duì)比 157
7.2 H矩陣判別 161
7.3 函數(shù)判別分析 162
7.4 支持向量機(jī) 165
7.4.1 最優(yōu)分類面 165
7.4.2 廣義最優(yōu)分類面 168
7.4.3 支持向量機(jī) 169
第八章 不同判別方法的比較 173
8.1 不同判別方法的特點(diǎn) 173
8.2 多元統(tǒng)計(jì)分析程序包TMVA簡(jiǎn)介 178
參考文獻(xiàn) 186