• 沒有找到結果。

第3章 震波特徵搜尋與前處理

3.3 前處理

在將訓練類神經網路所用的特徵向量餵入網路訓練之前,仍需經過一連串的前處理 程序,目地在於將數據統一處理以增加網路的收斂性、增加辨識率、將所蒐集來的震測 資料整理成我們想要的輸入向量格式,下圖為本研究所提出的亮點辨識前處理流程圖。

圖 3.3 前處理流程圖

STEP1 SEG-Y 檔案資料轉換

震測剖面圖資料處理的基本格式為SEG-Y 格式,探採地球物理學會 (Society of Exploration Geophysicists,SEG)所制定,本研究建立於 Matlab 上,所有數學運算都在此 平台上做處理,而SEG-Y 的資料記錄資料的數據型式為 IBM32,和一般 PC 所使用的 IEEE 型式不同,故之間需要做一個轉換的程序,下圖為資料轉換示意圖。

圖 3.4 資料轉換示意圖

在擷取檔案之前,我們必須先對SEG-Y 格式有所了解,如圖左邊為一個 SEG-Y 檔 案的檔案格式分成三部分,分別為SEG-Y 檔頭、binary header、binary trace header:

1. 第一部分,首先 3200byte 以 EBCDIC 方式儲存的開頭描述,EBCDIC (Extended Code Decimal Interchange Code ),是美國 IBM 公司所制定的編碼系統,

EBCDIC 碼的每一個字元是由 8 個位元所組成,共有 28 種組合,可以表示 256 個字元。此部分所記錄的資訊,如:檔案的名稱、檔案的儲存時間以及使 用者想要對檔案紀錄的資訊。

2. 第二部分是 400byte 的 binary header 紀錄了檔案中描述的資訊內容的資料,如 附錄一所示。

3. 第三部份,前 240byte 是每一條 trace 的 binary trace header,如:每一條 trace

的資料量大小及記錄每一條trace 接收資料的頻率,如附錄二所示;而接下來 是trace data 也就是我們主要想得到的震測資料-R 值 (反射係數),以 32-bit IBM floating point (IBM32)格式儲存其數值。

ReadSegy.m 用來取得.segy 檔中 Header、traceHeader 跟 traceData 的資料,

包含測線編號、接收站數目,幾秒接收一次等數值,而其下 GetSegyHeader.m、

GetSegyHeaderBasics.m、GetSegyTraceData.m、GetSegyTraceHeader.m、

ReadSegyHeader.m,這些用來幫助 ReadSegy()函數根據 SEG-Y 檔的儲存格式 來得到Header、traceHeader 跟 traceData 的資料。

ibm2num.m 因為目前 PC 的儲存格式以 IEEE 的標準格式來儲存,電氣電 子工程師協會IEEE(Institute of Electrical and Electronics Engineers)所制定的 電腦標準ASCII 格式,將原來使用 IBM32 儲存格式的 trace data 轉成 IEEE 才 能得到正確的數值,為此以ibm2num()函數來對 ReadSegy.m 所擷取出的數據 做處理轉換,若不將值轉換直接讀取會造成數據錯誤,最後儲存成MATLAB 的矩陣儲存格式.mat 檔。

STEP2 除去異常極大值

震測資料處理過程中,由於圖面資料點數目的龐大,動則上萬筆,處理人員 可能因為處理過程中的疏漏而在圖面上留下一筆明顯異於其他資料點的極大 值,如9.532х10 ,在所選取的五種特徵震測資料圖面上都有可能出現,若 不將此類數值在訓練網路之前剔除,貿然將數據餵入,容易使網路權重更新 時,突然變得很大,經過網路反覆疊代仍無法達到收斂,而提供的不佳的辨 識結果。

本研究剔除異常極大值的方法為,找到異常極大值的資料點,以同一條trace 下方的資料點代替,此方法根據地層的反射係數隨著深度變化為一個漸變的 過程,上下資料點只差0.004 秒的間隔,反射係數變化並不會太大,故以異常 值的下方資料點取代。

STEP3 除去極端異常值

本步驟為針對震波原始訊號與震幅強度,此二項和油氣出現與否的相關度很 高,偶爾會在圖面局部弱震幅的地區出現極大的震幅,純屬不合理現象,因 為強震幅出現通常為叢生,而並非單一出現,故本研究計算整張圖面震幅的

平均數μ與標準差σ,將平均值加減3σ以外的震波原始訊號與震幅強度,取

代為平均值加減3σ。

if 震波原始訊號 > μ+3σ,震波原始訊號=μ+3σ if 震波原始訊號 < μ-3σ,震波原始訊號=μ-3σ

STEP4 正規化

震測資料的值域分布範圍,會隨野地震波勘測、處理人員的不同而有不同的 值域範圍,如:震幅強度(Envelope)的範圍介於+20 到-20 之間,而震波阻抗

(Inversion Impedance)的範圍則介於 3,178,724 到 6,861,993 之間,為了降低 各種環境因素對辨識結果的影響,我們採取一種在類神網路上廣泛使用的前 處理方式正規化,意指將各特徵的最大值到最小值的分佈映射到1 到 0 之間,

將數據正規化後,任何一比震測資料經過四步驟的前處理都能當做網路輸入 加以訓練或回想,正規化的數學計算如下式,以瞬間頻率為例:

瞬間頻率’= 瞬間頻率 瞬間頻率

瞬間頻率 瞬間頻率

0≦瞬間頻率≦ 1 STEP5 建立各種特徵組合矩陣

本研究所選取的五項特徵為亮點相關的特徵,根據研究目的第三項,為了測試 出能提供最佳辨識率的特徵組合,本研究將測試五項特徵任何包含兩種特徵以 上的組合,共C C C C =26 種,我們將經前四步驟處理完之震測資料 分別依照 26 種不同的組合需求,儲存成 26 個.mat 檔案以便後續網路訓練作業。

圖 3.5 建立特徵組合矩陣

本研究所選取的特徵如下:

1. 震波原始訊號(Seismic Signal),以 S 代表 2. 震幅強度 (Envelope),以 A 代表

3. 瞬間相位(Instantaneous Phase),以 P 代表 4. 瞬時頻率(Instantaneous Frequency),以 F 代表 5. 逆推阻抗(Inversion Impedance) ,以 I 代表 26 種特徵組合如表 3.1:

表 3.1 特徵組合表

特徵組合 特徵組合 特徵組合 特徵組合

五個一組

SFAPI

四個一組

SFAP

三個一組

SAP

二個一組

SF

SAI SA

SFAI SPI SP

FAP SI

SFPI FPI FA

FAI FP

SAPI API FI

SFA AP

FAPI SFI AI

SFP PI

相關文件