• 沒有找到結果。

第一章 緒論

第三節 論文架構

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第三節 論文架構

本論文共分為五個章節,各章節內容簡述如下:

一、緒論:

包含本論文的研究背景與動機闡述,並提出本論文的最後目的。

二、文獻回顧:

本論文文獻回顧,由粗差對LS 的影響開始,再對單一至多個粗差的偵 測方法進行回顧,並介紹OWM 與 LAD。

三、研究方法:

介紹本研究進行比較的方法,分為五類,分別為:

(一)等權最小二乘法 (二)最小一乘法

(三)以最小二乘法為初值的李德仁權法 (四)以最小一乘法為初值的李德仁權迭代法 (五)最佳化權矩陣

四、實驗成果與分析:

透過模擬資料及實測資料,分析在觀測量數量不同時各法之成果,並 透過權重、多餘觀測分量及標準化殘差評估各方法之定位粗差的能力。

五、結論與建議:

對研究成果進行討論,並提出結論及未來研究方向之建議。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y 第二章 文獻回顧

第一節 粗差對最小二乘法的影響

Gauss 於 1809 年利用似然函數模型推導出 LS,並於 1823 年指出 LS 解 為最佳估值;而Markov 於 1912 年利用最佳線性無偏估計估求模型參數亦 得到相同結論,因而有高斯-馬可夫定理(Gauss-Markov Theorem)。間接觀測 方程式透過LS 模型應滿足:

E(L) = AX̃ 且 D(L) = σ02P−1 ( 1 ) E(L)為觀測量之期望值;A 為設計矩陣;X̃為估計參數的最優估值;D(L) 為方差-協方差矩陣;P 為觀測量之權矩陣;σ0為單位權中誤差。透過此模 型能夠求得未知參數的估值,並且進行精度評估。

測量上的誤差種類分為三種,系統誤差、偶然誤差及粗差;系統誤差的 來源為某種機械性、物理性等固定模式所造成的;偶然誤差則是隨機且在 大小及正負號上沒有規律性,只有當觀測量相當多時才能體現一定的統計 規律;粗差則是由於觀測者的疏忽所造成的錯誤結果或超限的誤差。例如:

觀測目標錯誤、讀數錯誤和記錄錯誤等。粗差的存在將影響平差結果的可 靠性,甚至導致錯誤的結果。

在實際測量中,粗差確實存在,有時甚至無法避免。在進行測量外業和 內業的過程中,雖然可以透過幾何條件、閉合差等限制來發現粗差,但仍 有可能有部分粗差存在。就統計層面而言,粗差為與研究中樣本的分布不 相同的觀測量,“An outlier is an observation which deviates so much from the other observations as to arouse suspicions that it was generated by a different mechanism.” Hawkins D (1980),意即粗差為某觀測量與其他觀測量差異過 大,懷疑該觀測量是由不同機制所產生。因此,粗差不應與其他樣本共同 進行計算,應於平差前對觀測量進行檢驗,避免影響估值的解算。(方楊 等,2009)

分別與第I 類錯誤(type I decision error)及第 II 類錯誤(type II decision error) 有關,其關係如表 1。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

當觀測量不含粗差,但卻因為ωi > 𝐾而被判斷為含有粗差的觀測量,

被稱為第 I 類錯誤發生的機率為α0;而當觀測量含有粗差,卻因為ωi≤ K 而被判斷為不含粗差的觀測量,被稱為第II 類錯誤發生的機率為1 − βp。 由標準常態分布的所畫出圖形H0,為觀測量在不含粗差的情形之下所 形成的標準常態分布,再由Hawkins D

圖 1 不含粗差及含粗差的兩個常態分布模型

在H0中位於K 值以外的資料,為第 I 類錯誤,即原本屬於布含粗差的 觀測量卻被判斷為含有粗差,如圖 2 中的黑色部分。

圖 2 第 I 類錯誤

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

在Ha中位於K 以外的資料,為第 II 類錯誤,即應屬於含有粗差的觀測 量卻被判斷為不含有粗差,如圖 3 的黑色部分。

圖 3 第 II 類錯誤

在非中心化參數δ固定時,信心水準α0越大,檢驗功效βp越大,K 值越 小。透過α0及βp的選擇,可決定臨界值的K 值,如表 2。

表 2 α0及βp與臨界值K 的關係(δ = 4)

α0 K βp

0.1%

0.3%

1%

5%

3.29 3.00 2.56 1.96

76%

84%

93%

98%

顯著水準α0會決定臨界值 K 所在的位置,表示在分布 I 中會因為該統 計量ωi >K 值,而產生的第 I 類錯誤的比例;而檢驗功效βp即為在分布 II 中,能夠透過K 值所判斷出屬於分布 II 中的觀測量的比例,因此1 − βp即 為因ωi ≤ K,而被判斷為分布 I 的分布 II 的比例。

資料探測法中的基本假設為"單個一維的備選假設",為觀測量中僅含 有一個粗差的情況之下;在觀測量含有多個粗差時,Schwarz 等人於 1993 透過多次的資料探測法進行迭代,逐步剔除標準化殘差最大的觀測量,直 到觀測量整體精度達到標準,而此種方法又稱為迭代的資料探測法(Iterated Data Snooping)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第三節 多個粗差時的偵測方法

當觀測量含有多個粗差時,雖然理論上能夠透過迭代的數據探測法進 行計算,在每次迭代後剔除標準化殘差最大的觀測量,直到精度符合標準,

但此種方法忽略了各觀測量之間的相關性,而每次計算後標準化殘差最大 的觀測量並不一定為粗差,若是將其剔除容易產生錯誤的結果(李德仁,

1984)。當觀測量含有多個粗差時,粗差偵測方法將不再剔除粗差,而是利 用隨機模型減弱粗差對平差系統的影響,而權迭代法為最常見的方法之一,

其概念為將含有粗差的觀測量當作與其他觀測量期望值差異相當大的母體 子樣本,利用不同權函數做為下一次迭代計算時的配權依據,使含有粗差 的觀測量的權重越來越小,此種方法除了能夠偵測含有粗差的觀測量外,

還能透過降權的方式,降低含有粗差對求解估值的影響。因此,如何給定 權函數是相當重要的環節 (劉文生等,2016)。 。

以下對權法中的不同權函數進行簡單的介紹。以下將對權迭代法中的 不同權函數進行簡單的介紹。

一、Huber 法

P(Vi) = {

1 , |Vi| ≤ C C

|𝑉𝑖| , |Vi| > C ( 3 ) 由Huber 於 1981 年所提出,P(Vi)為權函數、Vi為觀測量改正數、C 為 一選定的常數。透過 Huber 的權函數,當改正數大於選定的臨界值時,給 予相對應倒數的權重,若是偏移量相當大,|Vi|大於 C 相當多時,其權重將 會接近0,表示該偏移量過大的觀測量對最終平差成果的影響非常小。

二、丹麥法(the Danish method)

P(Vi) = {1 , |Vi| ≤ 2σ

e|Vi| , |Vi| > 2𝜎 ( 4 ) 由Krarup 於 1980 所提出,P(Vi)為權函數、Vi為觀測量改正數、σ為單 位權中誤差、e 為自然對數。透過式( 4 )中的|Vi|判斷是否收斂(即兩次計算 之改正數已無明顯變化)做為迭代終止條件,此時被降權之觀測量,其相應 之改正數大約即為錯誤的量(張裕民,1993)。

抗差估計法(Institute of Geodesy & Geophysics, IGG-I 方法)在粗差偵測 中的應用(牛國軍等,2005),由於 LS 中的 V^T PV 矩陣對粗差過於敏感,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

P(v) = {

1 , 𝑇𝑖

1 2 ≤ 𝑘 1

Ti , 𝑇𝑖

1 2 > 𝑘

( 7 )

其中,Ti = vi2

σ̂02∙ri,k = { 1 , n = 2,3

3.29 , n > 3 ,P 為權函數,𝑉i為改正數,

σ

̂0為後驗標準差,ri為多餘觀測分量。

Lehmann(2013)對於測量界常使用的三倍中誤差為標準提出質疑。無論 是將粗差視為隨機性亦或是系統性,將臨界值(Critical value)設定為三倍中 誤差忽略了背後所隱含的風險,由於臨界值的給定會連帶決定第 I 類錯誤 及第II 類錯誤的機率,在統計假說上,每個觀測量是否為粗差都會建立一 個備選假設,使得第I 類誤差會隨著觀測量增加而倍增。因此,Lehmann 認 為,在大量觀測量的情況下,僅僅使用三倍中誤差為準則判定粗差有可能 會誤判許多正確的資料。李德仁等人(1984)將粗差視為隨機模型的一部分,

利用標準化殘差等統計檢定量進行判斷,雖然比利用殘差進行判斷更準確,

但仍存在著假設錯誤的可能。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第四節 最佳化演算法與最佳化權矩陣

最佳化權矩陣為以標準化殘差總和最小為目標函數,利用最佳化演算 法進行計算,求得此時各觀測量的權重(蔡名曜,2014),並透過各觀測量 的權值及標準化殘差的大小來判斷該觀測量是否可能包含粗差,藉此達到 粗差定位的效果。

所謂的最佳化問題,是指一個問題具有無限多組解,但只有一個解為 符合條件的最佳解。在過去為了找到最佳解,須列出所有的可能並進行比 較,此種方法稱為窮舉法。但在實務上窮舉法並不可行,為了解決此類的 問題,因而開始發展出許多不同的最佳化演算法。

早期的最佳化演算法大多以梯度方式進行搜尋,對於問題的極值進行 求解具有很好的計算效率,但此種求解方法的成果好壞與初值有關,若搜 尋的初值位於全域最佳解的周圍,則能夠快速收斂到全域最佳解;反之,

若起始的搜尋位置不好,則容易陷入局部最佳解中。(郭信川,2000) 為了避免梯度法因初值而導致成果不佳的缺點,因而陸續發展出不依 賴梯度的最佳化演算法,如:基因遺傳演算法(Genetic Algorithms, GA)、模 擬退火法(Simulate Anneal, SA)、螞蟻演算法(Ant Colony Optimization, ACO)、

粒子群優化演算法(Particle Swarm Optimization, PSO)及和諧搜尋演算法 (Harmony Search, HS)等,以上的演算法能在不依賴初值的情況下,得到比 傳統梯度法更好的全域搜尋能力,在無梯度資訊下也能找到比使用傳統梯 度法要更好的全域最佳解(顏上堯,2007)。

粒子群演算法(Particle Swarm Optimization, PSO)為一種具有群體智 慧概念的仿生演算法,在問題空間中透過迭代的運算來搜尋全域最佳解,

其主要特色在於需要設定的參數較少及收斂速度快,且具有分散式搜尋、

記憶性及容易與其他演算法結合等特性,故粒子群優化演算法極具求解組 合最佳化問題的潛力(顏上堯,2007)。

量子行為粒子群演算法(Quantum-behaved Particle Swarm Optimization, QPSO)則是 PSO 的優化演算法。Kenned 與 Eberhart 於 1997 年在 Swarm Intelligence 中提到”隨機性的程度決定了智能的高低”,透過隨機因子影響

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

的速度會影響其搜尋範圍及收斂效果。因此,相當多的研究對粒子速度提 出了不同的方法,例如Shii 與 Eberhart 在 1998 年提出了帶有慣性權重ω的 PSO 演算法,利用時間方程式描述粒子速度的變化,但此種模式僅能用於 模擬低智能的動物群體,而人類的智能行為與量子空間中的粒子行為較為 相似。因此,孫俊等人於 2011 提出利用量子模型優化 PSO 演算法,並對 QPSO 與 PSO 進行比較。

在PSO 與 QPSO 進行比較前,須先了解以下四個名詞:

一、 模擬測試:利用電腦模擬,對演算法進行測試,在已知最優解的 情形下,利用演算法進行求解。

二、 精確度:經由演算法所求得的最優解與實際最優解的接近程度。

三、 收斂速度:在預定好的精度之下,演算法計算之最優解收斂至符 合精度的收斂次數即為收斂速度。

四、 成功率:在演算法進行中,所有的全局最優解能夠被成功找到的

四、 成功率:在演算法進行中,所有的全局最優解能夠被成功找到的

相關文件