發(fā)散維度下若干復(fù)雜模型的加權(quán)平均估計
定 價:48 元
叢書名:統(tǒng)計前沿系列叢書
- 作者:鄒家輝著,張寶學,裴艷波編
- 出版時間:2023/3/1
- ISBN:9787523001059
- 出 版 社:中國統(tǒng)計出版社
- 中圖法分類:C815
- 頁碼:140
- 紙張:膠版紙
- 版次:1
- 開本:16開
《發(fā)散維度下若干復(fù)雜模型的加權(quán)平均估計》第1章給出了模型平均方法的研究背景和研究現(xiàn)狀。在第2章中基于Stein引理和似然函數(shù),針對發(fā)散維度的Poisson回歸模型提出了一種具有無偏性的**權(quán)重選取準則。在候選模型全被誤設(shè)的情形下,本章證明了模型平均估計的漸近**性,在候選模型集合中包含正確模型的情況下,證明了參數(shù)模型平均估計的相合性。特別地,在該研究中候選模型的維數(shù)以及個數(shù)都可以隨著樣本量的增加而增加,故該模型平均方法能夠處理發(fā)散維度數(shù)據(jù)的情形。
針對單指標模型,《發(fā)散維度下若干復(fù)雜模型的加權(quán)平均估計》第3章基于交叉驗證方法提出了**權(quán)重的選取準則,為了更好地利用不同形式的連接函數(shù)并提升整合后模型的預(yù)測能力,這里的權(quán)重聚焦于候選模型的預(yù)測值而非參數(shù)的估計。在允許協(xié)變量和候選模型個數(shù)可以發(fā)散的情形下,本章給出了模型平均估計漸近**性的結(jié)論,當候選模型集合中存在正確模型時證明了權(quán)重值將漸近地全部分配在這些正確模型上,為了處理協(xié)變量維數(shù)大于樣本量的情形,本章還提出了基于正則化的模型平均方法并證明了漸近**性。第4章考慮到支撐向量機模型可以很好地應(yīng)用于高維分類數(shù)據(jù),利用模型平均方法處理了該模型在變量選擇上的不確定性并提高了分類精度。為了減輕計算負擔,還提供了一種包含預(yù)篩選過程的模型平均算法,并證明了該模型平均估計在hinge風險意義下的漸近**性。第5章提出了許多需要進一步研究的問題。《發(fā)散維度下若干復(fù)雜模型的加權(quán)平均估計》除了理論研究之外,還進行了大量的模擬研究并將模型平均方法應(yīng)用于經(jīng)濟相關(guān)領(lǐng)域,其結(jié)果表明《發(fā)散維度下若干復(fù)雜模型的加權(quán)平均估計》中所提出的模型平均方法在預(yù)測能力以及穩(wěn)健性上常常優(yōu)于其他常見的模型選擇/平均方法。
模型平均是處理模型不確定性的一種重要方法,通過給不同的候選模型賦予不同的權(quán)重來提升整合后模型的穩(wěn)健性和預(yù)測能力。在近幾十年間被國內(nèi)外眾多學者進行了廣泛的理論研究,其應(yīng)用領(lǐng)域也遍布統(tǒng)計學、經(jīng)濟學、生物醫(yī)學等等。隨著大數(shù)據(jù)時代的到來,發(fā)散維度和高維數(shù)據(jù)給模型平均的研究帶來了新的挑戰(zhàn)和機遇,然而模型平均在這方面的研究工作相對較少。故此,本書將聚焦于發(fā)散維度和高維情形下的模型平均理論研究。
本書第1章給出了模型平均方法的研究背景和研究現(xiàn)狀。在第2章中基于Stein引理和似然函數(shù),針對發(fā)散維度的Poisson回歸模型提出了一種具有無偏性的最優(yōu)權(quán)重選取準則。在候選模型全被誤設(shè)的情形下,本章證明了模型平均估計的漸近最優(yōu)性,在候選模型集合中包含正確模型的情況下,證明了參數(shù)模型平均估計的相合性。特別地,在該研究中候選模型的維數(shù)以及個數(shù)都可以隨著樣本量的增加而增加,故該模型平均方法能夠處理發(fā)散維度數(shù)據(jù)的情形。針對單指標模型,本書第3章基于交叉驗證方法提出了最優(yōu)權(quán)重的選取準則,為了更好地利用不同形式的連接函數(shù)并提升整合后模型的預(yù)測能力,這里的權(quán)重聚焦于候選模型的預(yù)測值而非參數(shù)的估計。在允許協(xié)變量和候選模型個數(shù)可以發(fā)散的情形下,本章給出了模型平均估計漸近最優(yōu)性的結(jié)論,當候選模型集合中存在正確模型時證明了權(quán)重值將漸近地全部分配在這些正確模型上,為了處理協(xié)變量維數(shù)大于樣本量的情形,本章還提出了基于正則化的模型平均方法并證明了漸近最優(yōu)性。第4章考慮到支撐向量機模型可以很好地應(yīng)用于高維分類數(shù)據(jù),利用模型平均方法處理了該模型在變量選擇上的不確定性并提高了分類精度。為了減輕計算負擔,還提供了一種包含預(yù)篩選過程的模型平均算法,并證明了該模型平均估計在hinge風險意義下的漸近最優(yōu)性。第5章提出了許多需要進一步研究的問題。本書除了理論研究之外,還進行了大量的模擬研究并將模型平均方法應(yīng)用于經(jīng)濟相關(guān)領(lǐng)域,其結(jié)果表明本書中所提出的最優(yōu)模型平均方法在預(yù)測能力以及穩(wěn)健性上常常優(yōu)于其他常見的模型選擇/平均方法。
本書的撰寫得到了首都師范大學鄒國華教授和中國科學院張新雨研究員的指導(dǎo)和建議,也得到了首都經(jīng)濟貿(mào)易大學統(tǒng)計學院及國家自然科學基金青年項目(編號:12201431)的資助。
由于時間倉促及作者的水平有限,書中的錯誤和缺點在所難免,希望廣大讀者給予批評指正。
鄒家輝,首都經(jīng)濟貿(mào)易大學統(tǒng)計學院講師,中國科學院數(shù)學與系統(tǒng)科學研究院博士,香港城市大學訪問學者。研究方向包括:模型平均、集成學習、子抽樣。在Econometnc Reviews,IEEE Transactions on Information Theory,Journal of Systems Science and Complexity等期刊以及會議AISTATS上發(fā)表多篇學術(shù)論文,并主持一項國家自然科學基金青年項目。
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.3 本書主要內(nèi)容與創(chuàng)新點
第2章 發(fā)散維度Poisson回歸模型的模型平均方法
2.1 引言
2.2 模型框架與估計
2.2.1 Poisson回歸的模型平均估計
2.2.2 權(quán)重選取準則
2.3 漸近性質(zhì)
2.3.1 漸近最優(yōu)性
2.3.2 回歸系數(shù)平均估計的相合性
2.3.3 高維模型的模型平均方法
2.4 蒙特卡洛模擬
2.4.1 模擬的設(shè)計和實施
2.4.2 模擬結(jié)果
2.5 飛行員CEO和企業(yè)創(chuàng)新能力的關(guān)系
2.6 總結(jié)
2.7 附錄
2.7.1 相關(guān)引理及證明
2.7.2 定理2.1的證明
2.7.3 定理2.2的證明
2.7.4 實際數(shù)據(jù)的其他結(jié)果
第3章 發(fā)散維度的單指標模型的模型平均方法
3.1 引言
3.2 模型框架與估計
3.2.1 單指標模型的模型平均方法
3.2.2 模型平均框架
3.3 漸近性質(zhì)
3.3.1 漸近最優(yōu)性
3.3.2 權(quán)重的收斂性
3.4 基于正則化條件和預(yù)篩選的模型平均方法
3.4.1 正則化的模型平均估計
3.4.2 基于預(yù)篩選的模型平均方法
3.5 模擬研究
3.5.1 模擬設(shè)置
3.5.2 比較方法與評價指標
3.5.3 模擬結(jié)果
3.5.4 高維情況的設(shè)計
3.6 實際例子的結(jié)果
3.6.1 金融發(fā)展與收入分布
3.6.2 公司的銷售增長
3.7 總結(jié)
3.8 附錄
3.8.1 推論3.2所需的條件
3.8.2 相關(guān)引理及證明
3.8.3 定理3.1的證明
3.8.4 定理3.2的證明
3.8.5 推論3.1的證明
3.8.6 推論3.2的證明
……
第4章 支撐向量機的模型平均方法
第5章 總結(jié)與展望
參考文獻