再生權(quán)最小二乘法穩(wěn)健估計(jì)
《再生權(quán)最小二乘法穩(wěn)健估計(jì)》根據(jù)作者多年從事測(cè)量數(shù)據(jù)處理的教學(xué)與研究工作成果撰寫(xiě)而成。首先,介紹了再生權(quán)最小二乘法的基本原理和計(jì)算方法,討論了再生權(quán)最小二乘法穩(wěn)健估計(jì)在測(cè)量控制網(wǎng)平差、多元線性回歸和坐標(biāo)系統(tǒng)轉(zhuǎn)換中的具體應(yīng)用。然后,介紹了一種確定穩(wěn)健估計(jì)方法的穩(wěn)健特性的仿真實(shí)驗(yàn)方法,并通過(guò)仿真實(shí)驗(yàn),討論了再生權(quán)最小二乘法和13種常用穩(wěn)健估計(jì)方法的穩(wěn)健特性以及它們中相對(duì)更為有效的穩(wěn)健估計(jì)方法。最后,對(duì)測(cè)量控制網(wǎng)平差、一元線性和非線性回歸的有關(guān)問(wèn)題進(jìn)行了討論。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
第1章 穩(wěn)健估計(jì)
1.1 穩(wěn)健估計(jì)概述
測(cè)量都具有觀測(cè)誤差,觀測(cè)誤差分為三類(lèi):一類(lèi)是具有隨機(jī)性的偶然誤差;一類(lèi)是帶有規(guī)律性的系統(tǒng)誤差;此外還有粗差(outlier或grosserror),泛指離群的誤差。統(tǒng)計(jì)學(xué)家根據(jù)大量觀測(cè)數(shù)據(jù)分析指出,在生產(chǎn)實(shí)踐和科學(xué)實(shí)驗(yàn)中,粗差出現(xiàn)的概率約占觀測(cè)總數(shù)的。這些少量的粗差會(huì)對(duì)參數(shù)估計(jì)結(jié)果造成嚴(yán)重的干擾。隨著科學(xué)技術(shù)的進(jìn)步,人們對(duì)測(cè)量結(jié)果的精度要求越來(lái)越高。因此,尋求有效的方法消除或減弱粗差顯得越來(lái)越重要。
目前,對(duì)含粗差觀測(cè)值的處理主要采用兩種方法:其一是將含粗差觀測(cè)值視為期望異常,用統(tǒng)計(jì)檢驗(yàn)方法剔除含粗差的觀測(cè)值后再用最小二乘法進(jìn)行處理;其二是將含粗差觀測(cè)值視為方差異常,采用穩(wěn)健估計(jì)方法處理。最早引起重視的是統(tǒng)計(jì)檢驗(yàn)法,歸納起來(lái)是一個(gè)辨別、定位和調(diào)節(jié)改正的過(guò)程。其實(shí)質(zhì)是假設(shè)觀測(cè)誤差服從均值漂移模型,將粗差歸于函數(shù)模型處理。當(dāng)存在多個(gè)粗差,且系統(tǒng)結(jié)構(gòu)不佳時(shí),僅僅依靠最小二乘法的殘差檢測(cè)來(lái)定位粗差的辦法具有很大的局限性。有鑒于此,穩(wěn)健估計(jì)的理論和方法應(yīng)運(yùn)而生。
穩(wěn)健估計(jì)(robustestimation)也稱(chēng)抗差估計(jì),是指在粗差不可避免的情況下,選擇適當(dāng)?shù)墓烙?jì)方法,使參數(shù)估值盡可能地減免其影響,得出正常模式下的最優(yōu)或接近最優(yōu)的參數(shù)估值。
早在19世紀(jì)初,已有學(xué)者提出了減免粗差干擾的估計(jì)方法。但直到20世紀(jì)五六十年代,隨著電子計(jì)算機(jī)的發(fā)展,穩(wěn)健估計(jì)理論和方法的研究才得以深入。Box于1953年首次提出“穩(wěn)健性”(robustness)的概念。隨后,Tukey于1960年提出了污染分布模式。Hub [5]于1964年發(fā)表“定位參數(shù)的穩(wěn)健估計(jì)”一文,提出了M估計(jì)理論。Hampel于196)年提出了影響函數(shù)和崩潰點(diǎn)的概念。Holland和界613:11[6]于1977年提出了選權(quán)迭代法。Stigerra于同年提出了中位數(shù)估計(jì)法。之后,Stiger與Bloomfield又提出了估計(jì)法(本書(shū)中記為法)。HuberHam-pet Rousseeuw和Ler等均對(duì)穩(wěn)健估計(jì)進(jìn)行了卓有成效的研究,并先后發(fā)表了有影響力的論著,為穩(wěn)健估計(jì)奠定了理論基礎(chǔ)。經(jīng)過(guò)眾多數(shù)理統(tǒng)計(jì)學(xué)家不斷地開(kāi)拓和研究,穩(wěn)健估計(jì)理論深入發(fā)展,成為應(yīng)用到眾多學(xué)科的分支科學(xué)。
丹麥的Kramp和Kubik等于1980年將穩(wěn)健估計(jì)理論引入測(cè)量界,提出了著名的“丹麥法”由于穩(wěn)健估計(jì)方法能夠較好地處理測(cè)量數(shù)據(jù)中含有粗差的問(wèn)題,大地測(cè)量界掀起了穩(wěn)健估計(jì)的研究熱潮,產(chǎn)生了大量有價(jià)值的研究成果。
1983年,Rousseeuw等提出了最小剪切二乘法(LTS法)。LTS法對(duì)杠桿點(diǎn)具有很好的抵抗性,但是計(jì)算效率比較低。隨后,Rousseeuw[11]等又提出了最小中位數(shù)二乘法(LMS法)、S估計(jì)法和"估計(jì)法。Yohai于1987年提出MM估計(jì)法,在保證M估計(jì)穩(wěn)健性的前提下,提高了M估計(jì)的計(jì)算效率。1989年,周江文[12,13]提出等價(jià)權(quán)的概念,將M估計(jì)最小二乘化,使傳統(tǒng)最小二乘法具備了抗差能力,并提出兩種有效的估計(jì)方案——IGGI方案和IGGII方案。楊元喜[14,15]對(duì)等價(jià)權(quán)原理進(jìn)行了擴(kuò)充,提出了IGGIII方案,并且針對(duì)相關(guān)等價(jià)權(quán)不對(duì)稱(chēng)的問(wèn)題,構(gòu)造了雙因子方差膨脹模型和雙因子等價(jià)權(quán)模型,導(dǎo)出了各種平差模型的參數(shù)抗差估計(jì)公式。徐培亮[16]也給出了相關(guān)觀測(cè)的穩(wěn)健估計(jì)方法。劉經(jīng)南和姚宜斌等[17]提出了基于等價(jià)方差-協(xié)方差陣的穩(wěn)健最小二乘估計(jì)理論,這種方法不僅可以控制觀測(cè)異常的影響,而且保持了原有觀測(cè)的相關(guān)性不變。歐吉坤[18]提出了一種三步抗差方案,用分步變常數(shù)法提高了參數(shù)估值的計(jì)算效率。為了控制設(shè)計(jì)空間誤差的影響,提出了杠桿點(diǎn)評(píng)估和設(shè)計(jì)空間抗差的IGGIV方案。徐培亮[19]提出了符號(hào)約束的抗差估計(jì)。王志忠和朱建軍[2e]等研究了適合污染誤差模型估計(jì)的最優(yōu)性準(zhǔn)則,提出了均方差極小原則下的參數(shù)抗差估計(jì)。楊元喜[21,22]提出了依據(jù)誤差分布實(shí)際情形的自適應(yīng)抗差估計(jì)和抗差方差分量估計(jì),導(dǎo)出了抗差擬合推估解法。針對(duì)病態(tài)性與粗差同時(shí)存在的問(wèn)題,Nyquist和Slvapulle提出了基于M估計(jì)的抗差嶺估計(jì)。隋立芬[23,24]對(duì)其原理和性質(zhì)進(jìn)行了研究,提出了抗差組合主成分估計(jì)和抗差單參數(shù)主成分估計(jì)。歸慶明等[25]運(yùn)用有偏估計(jì)的壓縮變換方法,提出了壓縮型抗差估計(jì)。彭軍還[26]證明了基于誤差方差膨脹模型與基于誤差均值漂移模型所得到的無(wú)偏估計(jì)公式的等價(jià)性。估計(jì)作為一類(lèi)重要的抗差估計(jì),也得到了廣泛而深入的研究。孫海燕[27]和周世健[28,29]等研究了?m范分布的密度函數(shù),估計(jì)的抗差性和效率,誤差分布和估計(jì)方法之間的關(guān)系。周秋生[30]提出了利用線性規(guī)劃求解估計(jì)問(wèn)題的方法,并且依據(jù)線性規(guī)劃的對(duì)偶原理給出了求解問(wèn)題的實(shí)用方法。在動(dòng)態(tài)數(shù)據(jù)處理方面,楊元喜[31~33]提出了抗差Kalman濾波,分析了多種抗差濾波的理論基礎(chǔ),討論了抗差自適應(yīng)濾波解的性質(zhì),構(gòu)建了抗差自系。
1.2最小N乘法原理
1.最小二乘法
最小二乘法,又稱(chēng)最小平方法,是一種數(shù)學(xué)優(yōu)化技術(shù)。它是通過(guò)最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。自Gauss于1809年提出以來(lái),最小二乘法廣泛應(yīng)用于測(cè)量及其他科學(xué)工程領(lǐng)域。
在測(cè)量數(shù)據(jù)處理中,Gauss-Markov模型是最常見(jiàn)的模型之一。其基本模型是模型(1-1)還可表示為
測(cè)量平差中一般將式(1-2)表示為
式(1-3)稱(chēng)為誤差方程。上式中,L表示nX1階觀測(cè)值矩陣;P(XW)表示觀測(cè)值L的權(quán)陣;Dl表示觀測(cè)值L的協(xié)方差陣表示單位權(quán)方差表示觀測(cè)值L的真誤差;V表示觀測(cè)值L的改正數(shù),是真誤的估值表示階系數(shù)矩陣;表示以1階未知數(shù)真值矩陣階未知數(shù)估值矩陣。
按最小二乘法求解Gauss-Markov模型中的參數(shù)估值V,即是要求準(zhǔn)則函數(shù)將對(duì)X求導(dǎo)并令其為零,得
將式(1-3)代入得令
則式(1-7)寫(xiě)成
式稱(chēng)為法方程(normalequations),其解為
由式(1-9)求得的參數(shù)估值確保了VTPV=min。
將式(1-9)代入式(1-3)得觀測(cè)值的改正數(shù)V和觀測(cè)值的估值L:
單位權(quán)中誤差的估值
未知數(shù)的協(xié)因數(shù)陣:
應(yīng)用最小二乘準(zhǔn)則時(shí),并不需要知道觀測(cè)向量服從何種概率分布,而只需知道它的先驗(yàn)權(quán)陣即可!
當(dāng)P為非對(duì)角陣時(shí),表示觀測(cè)值相關(guān),按VTPV=min進(jìn)行的平差稱(chēng)為相關(guān)觀測(cè)平差。
當(dāng)P為對(duì)角陣時(shí),表示觀測(cè)值不相關(guān),此時(shí)最小二乘準(zhǔn)則可表示為純量形式,即
特別地,當(dāng)觀測(cè)值不相關(guān)且等精度時(shí),權(quán)陣P為單位陣,此時(shí)最小二乘準(zhǔn)則可表為
2.最小N乘法
當(dāng)觀測(cè)值不相關(guān)且等精度時(shí),最/J、?s準(zhǔn)則函數(shù)為
當(dāng)N=1時(shí),即為最小一乘法的準(zhǔn)則函數(shù):
當(dāng)N=2時(shí),即為最小二乘法的準(zhǔn)則函數(shù):
當(dāng)N=3時(shí),即為最小三乘法的準(zhǔn)則函數(shù):
當(dāng)N=4時(shí),即為最小四乘法的準(zhǔn)則函數(shù):
當(dāng)尺時(shí),即為最小無(wú)窮乘法的準(zhǔn)則函數(shù):
3.算例
設(shè)有線性方程組
式(1-21)中,方程的數(shù)量r=3,未知數(shù)的數(shù)量n=6。未知數(shù)的數(shù)量大于方程的數(shù)量,所以未知數(shù)具有無(wú)窮多組解。表1.1列出了N為1、2、3、4和無(wú)窮大時(shí)式(1-21)未知數(shù)(精確到0.1)的部分解。由表1.1可知,當(dāng)未知數(shù)的解精確到0.1時(shí),最小一乘法有31組解(第1-31行),約束條件式(1-16)的值為14.0;最小二乘法有1組解(第32行),約束條件式(1-17)的值為59.0;最小三乘法有1組解(第33行),約束條件式(1-1))的值為214.3;最小四乘法有1組解(第34行),約束條件式(1-19)的值為765.7;最小無(wú)窮乘法有25組解(第35!59行),約束條件式(1-20)的值為3.7。
。1)不同的約束條件下未知數(shù)的解是不盡相同的。
……