• 沒有找到結果。

利用類神經方法建構晶圓缺陷點群聚圖案之辨識系統

N/A
N/A
Protected

Academic year: 2021

Share "利用類神經方法建構晶圓缺陷點群聚圖案之辨識系統"

Copied!
49
0
0

加載中.... (立即查看全文)

全文

(1)

國立交通大學

工業工程與管理學系

碩士論文

利用類神經方法建構晶圓缺陷點群聚圖

案之辨識系統

The Identification System of Wafer Defects

Clustering Patterns Constructed by Artificial

Neural Network

研 究 生:張喬凱

指導教授:唐麗英 博士

張永佳 博士

中華民國九十五年六月

(2)

利用類神經方法建構晶圓缺陷點群聚圖案之辨識系統

The Identification System of Wafer Defects Clustering Patterns

Constructed by Artificial Neural Network

研 究 生:張喬凱 Student:Chaio-Kai Chang

指導教授:唐麗英 博士 Advisor:Lee-Ing Tong

張永佳 博士 Yung-Chia Chang

國立交通大學

工業工程與管理學系

碩士論文

A Thesis

Submitted to Department of Industrial Engineering and Management

College of Management

National Chiao Tung University

In Partial Fulfillment of the Requirements

For the Degree of Master of Science

In

Industrial Engineering

June 2006

Hsin-Chu, Taiwan, Republic of China

(3)

利用類神經方法建構晶圓缺陷點群聚圖案之辨識系統

學生:張喬凱 指導教授:唐麗英 博士 張永佳 博士

國立交通大學工業工程與管理學系碩士班

摘要

如何提升晶圓的良率(yield)一直是半導體廠最關注的問題之一。而良率問題 往往和晶圓上缺陷點數和缺陷點群聚現象息息相關,其中缺陷點群聚現象的產生 主要是由於晶圓尺寸越作越大,製程越來越複雜而造成缺陷點出現群聚現象。因 為製程問題的不同,群聚圖案就會有不同的形狀,因此製程工程師若能準確地判 斷出晶圓上的群聚圖案,即可以迅速找到製程的問題來提升良率。目前有一些中 外文獻利用類神經方法辨識晶圓缺陷點之群聚圖案,效果不錯,但這些文獻所提 之方法在類神經的輸入變數擷取上往往需要花費很多時間。因此本研究的主要目 的是利用類神經方法建構出一套簡單好用且辨識率高的晶圓缺陷點圖案判別系 統,能夠簡單擷取類神經輸入變數以及有效辨識缺陷點群聚圖案。本研究將以模 擬資料進行類神經網路方法的訓練,以找到表現最佳的類神經網路方法及其參數 組合,最後再以新竹科學園區某半導體廠商之實際晶圓資料來驗證本研究之辨識 系統的有效性及可行性。 【關鍵詞】晶圓、良率、缺陷點、群聚現象、群聚圖案、類神經網路、自組性演 算法

(4)

Student:Chaio-Kai Chang Advisor:Lee-Ing Tong

Yung-Chia Chang

Department of Industrial Engineering and Management

National Chiao Tung University

Abstract

Being a semiconductor manufacturer, knowing how to improve the yield of wafer production has been regarded as the focus. However the causes of yield problems have much to do with the total number of defects on a wafer and defects clustering phenomenon. As the wafer size increases, the wafer processes get complicated and the defects clustering phenomenon tends to be apparent. Different problems of wafer processes always make different clustering patterns, so process engineers could find the process problems rapidly to improve the yield by identifying the clustering patterns correctly. Some papers make use of Artificial Neural Network (ANN) to identify wafer defects clustering patterns and come to the acceptable effects. However, it costs much time while transferring wafer defects data into input variables of ANN. This study constructs a wafer defects identification system by ANN, which characterize well identification rate and the method for easily getting input variables of ANN. Simulation data is used for training ANN and then to find out the combination of parameters of the best performance. The Real wafer defects data verify the effectiveness and feasibility of the identification system.

【Key Words】Wafer, Yield, Defect, Clustering Phenomenon, Clustering Pattern, Artificial Neural Network, Group Method of Data Handling

(5)

誌謝

兩年的研究生生涯,隨著論文的完成,到達尾聲。在踏出校門的前夕,回想 起這兩年的點點滴滴,心中充滿了許多的感謝。論文能夠順利的完成,最主要要 感謝指導教授唐麗英教授和張永佳教授在課業上的諄諄教誨以及生活上的悉心 指導,讓我在進行研究的同時,還能擁有快樂且豐富的碩士生涯。也要感謝梁高 榮教授在論文口試時所提供的寶貴意見,使我的論文更臻完善。 其次,要感謝在這兩年來,一直陪伴在我身邊的實驗室伙伴跟朋友們。感謝 細心體貼的實驗室助理正琪、善解人意的水果部姑娘莉安、小太陽般散發耀眼光 芒的俊榮、成熟穩重的實驗室大哥盈杰、學業與嘴炮兼具的的啟峰、主修造型副 修烹飪的碩鴻、溫柔婉約的女羽高手幸穎、時常頭痛但其實身體很健康的修來、 看到鏡頭會失控的長科、瘦下來保證是大帥哥的昱皓、人美個性又超好的小班、 以及風赤的同期和家族的學弟妹們。因為你們,豐富了我兩年的碩士生活,留下 了人生當中美麗的回憶。

最後,要感謝我的家人:老媽、老姊和老妹,因為你們無怨無悔的支持, 讓我可以毫無後顧之憂的專注於學業上,進而順利的取得碩士學位。僅將此研究 成果獻給你們以及那已在天上的老爸。 張喬凱 謹誌於 交通大學工業工程與管理研究所 2006年 6月14號

(6)

目 錄

中文摘要...i 英文摘要...ii 誌謝... iii 目錄...iv 圖目錄...v 表目錄...vi 第一章 緒論...1 1.1 研究動機...1 1.2 研究目的...3 1.3 研究假設...3 1.4 研究架構...3 第二章 文獻探討...5 2.1 積體電路良率控制之探討...5 2.2 晶圓常見缺陷點圖案和成因...7 2.3 群聚指標...10 2.4 類神經網路介紹...12 2.4.1 倒傳遞類神經網路...13 2.4.2 半徑式函數網路...15 2.4.3 自組性演算法...16 2.5 以類神經網路方法辨識晶圓缺陷圖案之相關文獻...18 第三章 研究方法與步驟...20 3.1 缺陷點圖案辨識系統建構流程...20 3.2 晶圓缺陷點群聚圖案辨識流程...22 第四章 系統實作與驗證分析...24 4.1 電腦模擬資料與特徵值擷取...24 4.2 三種類神經方法的最佳參數設定與驗證...27 4.2.1 倒傳遞網路的訓練及結果...27 4.2.2 半徑式函數網路的訓練及結果...29 4.2.3 自組性演算法的訓練及結果...31 4.2.4 三項類神經方法的最佳參數設定及結果比較...33 4.3 實例驗證...34 4.4 實驗結果總結...36 第五章 結論...37 5.1 貢獻...37 5.2 未來研究方向...37 參考文獻...39

(7)

圖目錄

圖1.1 本論文架構與流程圖...4 圖2.1 積體電路製程圖...6 圖2.2 常見的四種群聚圖案...8 圖2.3 缺陷分佈圖與兩軸的投影...10 圖2.4 夾角示意圖... 11 圖2.5 倒傳遞類神經網路架構圖...13 圖2.6 自組性演算法學習流程圖...18 圖3.1 晶圓缺陷點圖案辨識流程...23 圖4.1 不同群聚圖案在不同百分比因子水準下之散佈圖...25

(8)

表目錄

表2.1 常見的四種群聚圖案及成因...9 表2.2 群聚指標CIT指數與群聚嚴重程度對照表...12 表3.1 四種群聚圖案的特性...21 表4.1 缺陷圖案特徵值擷取範例...26 表4.2 倒傳遞網路訓練結果(動量係數=0.85)...28 表4.3 半徑式函數網路在不同分類數下的RMSE值...30 表4.4 半徑式函數網路訓練結果(隱藏層數=0,動量係數=0.9) ...30 表4.5 半徑式函數網路訓練結果(隱藏層數=1,動量係數=0.9,學習率=0.15) ...30 表4.6 自組性演算法分類結果-以其中 12 筆資料為例 ...32 表4.7 自組性演算法訓練結果...32 表4.8 三種類神經方法的較佳參數設定、RMSE和正確辨識率...33 表4.9 15 片晶圓缺陷點的特徵值...35 表4.10 晶圓辨識結果...35

(9)

第一章 緒論

1.1 研究動機

在歷經二十餘年的努力,台灣的積體電路產業已逐漸在世界上嶄露頭角,其 耀眼的產值與豐厚的獲利為國家經濟帶來非常大的貢獻。在這樣的背景下,台灣 的積體電路業者面臨著相當激烈的競爭,各家業者無不致力於提昇自己的競爭 力。而晶圓的良率(yield)則是衡量積體電路廠商競爭力的一個重要指標。 積體電路的良率和晶圓上的缺陷(defects)息息相關,缺陷的發生往往會使良 率降低,甚至會使整批晶圓報廢,因此良率的控管相當重要。此處所謂缺陷指的 是可能會造成半導體缺點(faults)的因素,而缺點則是指可能造成晶圓故障 (failure)之缺陷。造成缺陷的原因有很多,舉凡製程參數設定不良、空氣中的微 粒(particle)、或製造環境不佳等問題皆會使晶圓產生缺陷。 Neyer和Hanfer[16]指出缺陷是造成晶圓低良率的主因,而缺陷的空間性圖案 (spatial pattern)大小及形狀可以反應出製程的問題所在。也就是說,晶圓上的缺 陷圖案提供了一個相當重要的線索來找出製程異常的原因。因此當晶圓良率太低 時,分析晶圓之圖缺陷是最直接有效的方法。實務上,工程師往往是藉著檢閱一 張張的晶圓圖,分析晶圓圖上的缺陷圖案來找出製程異常之原因。但這些圖案不 易明確的定義出來,往往相似的圖案(如常見的環狀和半環狀圖案)會使工程師判 斷錯誤。再加上由於是仰賴工程師檢閱一張張的晶圓圖,因此工程師本身的經驗 與能力就成了判斷缺陷圖案正確與否的關鍵,這種情況會造成以下兩項缺失: 1. 知識傳承的不易-技術主要掌握在資深工程師手上,形成所謂的口袋技 術(pock technique)。 2. 誤判率的增高-工程師往往需要花費許多的時間去辨識晶圓圖之圖案, 當需辨識之晶圓數量大時,會因疲勞等不可避免之生理因素使誤判率增 高。

(10)

因此若能建立一個系統化且及時化的晶圓缺缺陷圖案辨識系統,可藉由系統 的高準確性及操作簡單的特性,幫助工程師在進行晶圓圖的判斷時,縮短辨識的 時間及降低誤判率。 一直以來,有許多學者利用統計的手法來建立良率模型,而隨著晶圓面積越 來越大,傳統卜瓦松(Poisson)良率模型會出現低估良率的現象。Stapper[17]提出 負二項良率模型,其預估良率準確度較傳統卜瓦松良率模型為佳,因此業界普遍 採用負二項良率模型。負二項良率模型中包含衡量群聚程度的指標α,可判斷群 聚的嚴重程度。但α指標有分佈範圍廣且可能出現負值等缺點,會造成分析的不 便。Jun et al[14]、陳大倫[2]、蔡文傑[5]等陸續發展一些晶圓群聚指標,對於群 聚現象嚴重程度的預測有很好的效果。好的群聚指標能幫助工程師判斷出晶圓上 群聚現象的嚴重程度,可幫助提升預測良率的準確度,但卻無法提供進一步的資 訊讓工程師知道可能是哪一段製程出了問題。 吳璟旻[1]利用類神經網路,針對四種常見的晶圓缺陷點圖案,進行辨識。 四種圖案分別是辨識環狀(ring type)、半環狀(half-ring type)、刮傷(scratch type)、以及邊環狀(edge-ring type)。他雖然得到不錯的辨識效果,但一開始 的缺陷資料轉換成圖檔非常耗時,且在轉成圖檔後,必須先將晶圓缺陷點中隨機 性的缺陷點排除,只保留系統性的缺陷點。為了能夠準確的排除隨機性的缺陷 點,論文中設定了兩個參數,遮罩(mask)大小以及門檻值(threshold)。此兩項參 數設定的好壞決定了之後圖形辨識的效果,因此相當重要。但吳璟旻卻沒有提出 一個系統化的方法來決定此兩參數,只能靠經驗法則,因此大大影響了辨識的效 果。 綜合以上可知,若能有一套系統化的工具,幫助工程師能夠快速準確的判斷 出晶圓圖缺陷點圖案,將可大大節省時間成本,幫助提升積體電路業者改善良率 的效率。

(11)

1.2 研究目的

本論文應用類神經網路,結合群聚指標,建構出一個系統化的晶圓缺陷圖案 辨識系統,以達到以下兩個目標: 1. 縮短辨識晶圓上缺陷點圖案的時間。 2. 準確辨識出晶圓缺陷點的可能圖案,使幫助工程師能迅速找到問題所在。 本論文將會利用新竹科學園區某積體電路公司的實際晶圓資料來驗證此辨 識系統的可行性及有效性。

1.3 研究假設

本論文有一點前提假設:晶圓上的缺陷點不論大小皆視為一點,本論文只 針對缺陷點出現的位置,而不討論缺陷點的大小。

1.4 研究架構

本論文分為五個部分,第一章為緒論,說明本研究之動機、目的、假設與架 構;第二章為文獻探討,探討積體電路良率之控制、晶圓常見之缺陷點圖案和成 因、群聚指標、介紹類神經網路,以及以類神經網路方法辨識晶圓缺陷圖案之相 關文獻;第三章介紹本論文如何應用類神經網路方法建構晶圓群聚圖案辨識系 統;第四章為系統實作與驗證分析,以模擬資料來建構本研究之晶圓圖案辨識系 統並以業界實際之晶圓資料來證實此系統之有效性;第五章為結論,說明本研究 之貢獻及未來研究方向建議。本論文之研究架構流程如圖1.1所示。

(12)

緒論 圖1.1 本論文架構與流程圖 文獻探討 研究方法與步驟 系統驗證與研究結果 積體電路良率探討 晶圓常見缺陷圖案 和成因 群聚指標 類神經網路介紹 以類神經網路方法 辨識晶圓缺陷圖案 之相關文獻 結論

(13)

第二章 文獻探討

本章介紹中外文獻中有關積體電路良率控制之探討、晶圓常見缺陷圖案和成 因、群聚指標、類神經網路,以及利用類神經網路方法辨識晶圓缺陷圖案之文獻。

2.1 積體電路良率控制之探討

一般而言,積體電路製造由上游至下游分為三種工業,一是與積體電路的 製造有直接關係的工業、包括晶圓製造業、積體電路製造業、機體封裝業;二是 輔助機體製造的工業,包括積體電路設計、光罩製造、積體電路測試、化學品、 導線架工業;三是提供積體電路製造支援的產業,如設備、儀器、電腦輔助設計 工具工業等等。而本論文所探討的良率主要是指在積體電路製造階段,由原物料 投入(input)到產品產出(output)之間的比例。 積體電路的製程大致而言是將晶圓廠所做好的晶圓,以光罩印上電路的基本 圖樣,再以氧化、擴散、CVD、蝕刻、離子植入等方法,將電路及電路上的元件 在晶圓上做出,由於IC的電路設計是層狀結構,因此還要經過多次的光罩投入、 圖形製作、形成線路與元件等重複程序,才能做出一個完整的積體電路。積體電 路製造流程如圖2.1所示[6]。 根據積體電路的製程,一般會將良率的計算分成三部分,分別是製程良率 (processs yield)、晶方良率(die yield)以及封裝良率(package yield)[7]。因此積體 電路最終良率(Y)為

Y=Yprocess yield × Ydie yield × Ypackage yield

製程良率和晶方良率對於半導體製造業而言,是很重要的良率指標。而封裝 良率主要供封裝測試廠在使用。

(14)

圖2.1 積體電路製程圖[5] (1) 微粒(particle)所造成的缺陷:積體電路的製造皆是在無塵室中進行,但事 實上並無法做到徹底的無塵,機台和現場環境中漂浮的微粒皆有可能掉落在 晶圓上形成缺陷而使良率降低。 (2) 製程上的控管不良所造成的缺陷:製造過程中機器的操作不良造成晶方刮傷 或是搬運過程意外造成的晶圓磨損皆會造成電路故障而使良率降低。 (3) 各道製程間整合不良所造成的問題:積體電路是由數百道製程所連接而成, 各製程間若整合不良,會造成良率的降低。 (4) 電路設計不良:若電路的設計與實際的製程技術無法配合,亦會提高晶圓之 不良率。 另外,製程參數控制不良、微影製程(photo-lithography)以及製程不當控 制皆會對會對良率造成巨大的影響[18]。

(15)

2.2 晶圓常見缺陷點圖案和成因

一般而言,晶圓上的缺陷可分為兩類,分別是系統性缺陷(systematic defect) 和隨機性缺陷(random defect)。 EI-Kareh[10]整理出系統性缺陷和隨機性缺陷的成因。系統性缺陷的發生主 要是由於製程發生問題時所產生,如製程參數(process parameter)的設定不 良、光罩(mask)出現故障、電路(circuit)設計不良,或是雷射修復時造成之缺 陷。而隨機性缺陷的發生主要是晶圓製造過程中,難以避免的微粒所造成之短路。

對一良好的製程而言,缺陷之成因主要是屬於隨機性且其發生的比例能降低 至一個常數,而系統性缺陷的比例亦能降至最低[13][15]。因此研究系統性缺陷 出現的原因即可降低低良率晶圓的產生[20]。 當晶圓發生隨機性缺陷時,缺陷點的分佈會呈現隨機散佈。而當晶圓發生系 統性缺陷時,不同於隨機性缺陷的發生,其缺陷點會因為製程異常原因而出現不 同的圖案(pattern)。常見的缺點群聚圖案主要有四種[13],分別是:

(1) 牛眼圖案(bull’s eye pattern):缺陷點集中在晶圓中心附近,成一牛眼圖形。 (2) 底部圖案(bottom pattern):缺陷點集中在晶圓的底部。

(3) 弦月圖案(crescent moon pattern):缺陷點集中在晶圓的某一側有如弦月的圖 形。

(4) 環狀圖案(edge pattern):缺陷點散佈在晶圓邊緣,成一環狀圖形。 四種圖案如圖2.2所示。

(16)

牛眼圖案 底部圖案 弦月圖案 環狀圖案 圖2.2 常見的四種群聚圖案 牛眼群聚圖案的成因通常發生在電漿(plasma)區。半導體製程可概略區分為 四大步驟,分別是蝕刻(etching)、擴散(diffusion)、薄膜(thin film)、微影(photo)。 所謂蝕刻就是將沒有被光阻覆蓋及保護的薄膜,以化學反應或是物理作用的方式 加以去除,以完成整面材質均勻的移除或轉移光罩圖案 (pattern transfer) 到薄膜 上面。就圖案轉移而言,一般與微影技術相配合。蝕刻大致上可分為濕式蝕刻和 乾式蝕刻,分別說明如下: 1. 濕式蝕刻:將要蝕刻的部份利用化學溶液與之反應之後帶走表面產物的方法 來進行蝕刻,通常是將晶圓置入裝有化學溶液的蝕刻槽中進行。 2.乾式蝕刻 :乾式蝕刻是指在氣相中進行的蝕刻過程,一般在半導體製程中,

(17)

多使用活性電漿源(reactive plasma source)來完成。 因此若發現晶圓有牛眼的群聚圖案時,有很大的可能是在乾式蝕刻或是其他 需使用到電漿的步驟出了問題。 底部圖案的發生是由於在擴散階段時需對晶圓進行加熱,但在加熱過程中因 不均勻而導致底部圖案,因此若出現底部圖案很有可能是在擴散過程中出了問 題。 弦月圖案的發生則是由於在薄膜過程中,需經過一個快速退火的步驟,其目 的是為了可有效降低接面深度(junction depth)及有效通道長度(effective channel length),而若在此步驟出現問題則晶圓上容易會產生弦月圖案。 環狀圖案的發生通常不限定於發生在某段製程,但其發生的原因往往跟線上 作業員的操作失當、製程設計、參數控制不當,或是晶圓本身不平坦有關。 表2.1彙整常發生的四種群聚圖案原因。 表2.1 常見的四種群聚圖案及成因 群聚圖案 發生原因 牛眼圖案 蝕刻階段的電漿區出現問題。 底部圖案 擴散階段加熱過程不均勻。 弦月圖案 薄膜階段的快速退火過程出現異常。 環狀圖案 人為疏失和晶圓本身不平坦佔主要因素。

(18)

2.3 群聚指標

晶圓上群聚現象是積體電路廠商非常關注的問題。針對晶圓上群聚現象,

陸續有學者發展出各種不同的群聚指標來判斷群聚的嚴重程度。

Jun et al[14]提出一群聚指標CI(Cluster Index),其計算原理是先將晶圓上的 缺陷點分別投影到X和Y軸上,如圖2.3所示,接著分別計算X軸和Y軸上,投影 點間距之變異係數平方值,其中較小的值即為CI值。若缺陷點為隨機分佈時,如 圖2.3(a)所示,投影到軸上的缺陷點其點與點的間距會比較一致,即變異程度會 較小,CI值接近1;若缺陷點有群聚現象,如圖2.3(d)所示,投影到軸上的缺陷點 間距分佈較不平均,有些點間距很近,有些點間距卻很遠,CI值遠離1,CI值越 大代表群聚現象越嚴重。此指標無須任何統計假設且計算簡單,但當針對某些型 態的群聚現象,在經過對X軸和Y軸的投影後會產生相同CI值的不合理現象,而誤 判群聚現象的嚴重程度。 圖2.3 缺陷分佈圖與兩軸的投影 陳大倫[2]針對CI指標的缺失,利用一維轉軸的觀念,提出了CIR(一維轉軸缺 陷點群聚指標),此指標彌補了CI值的缺失,但當晶圓上的缺陷點呈現環狀分佈 時,則CIR無法察覺出其有群聚現象的產生。 許志瑋[3]針對CIR的缺失,提出環狀缺陷點群聚指標,補足了CIR的不足。

(19)

此指標只能偵測出環狀的缺陷點群聚現象,因此必須與CIR一起使用,若只單看

環狀群聚指標無法看出群聚現象的嚴重程度。

蔡文傑[5]針對以往文獻所提缺陷群聚指標的缺失,提出了一個新的群聚指

標,CIT( Tasi’s Cluster Index )。其原理是利用各個缺陷點與X軸第一象限夾角之

間距的變異以及各個缺陷點距原點座標距離之間距的變異所發展而得。其優點為 能辨認出任何圖案的群聚嚴重程度,且計算簡單無須任何統計假設。

CIT計算步驟如下: 1. 計算晶圓表面各缺陷點與第一象限座標X軸所成之夾角的變異程度。 假設晶圓上有n個缺陷點,計算每一個缺陷點與第一象限的的正值夾角θi, θi= ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − i i X Y 1

tan ,Xi為第i個缺陷點的X軸座標,Yi為第i個缺陷點的Y軸座標。

θi按照遞增順序排列,得到數列θ(i),θ(1)<θ(2)<<θ(n) 。令Ai=θ(i)-θ(i-1) ,

i=1,2,…,n,代表夾角θ的間距,其中θ(0)=0。其夾角示意圖如圖2.4。

圖2.4 夾角示意圖

2. 計算晶圓表面各缺陷點與原點距離的變異程度。

承步驟1,計算晶圓上各缺陷點與原點的距離Li= Xi2 +Yi2,i=1,2,…,n,Xi

i個缺陷點的X軸座標,Yi為第i個缺陷點的Y軸座標。將Li按照遞增順序排

列,得到數列L(i),L(1)<L(2)<<L(n)。令Bi=L(i)-L(i-1), i=1,2,…,n,代表距離

(20)

3. 建構群聚指標CIT ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ =max 22, 22 D S A S CI A D T ,其中A=

Ai/nSA2 =

(AiA)2/(n−1); D =

Di/nS2 =

(DD)2/(n−1) i D CIT可以反應出群聚現象的嚴重程度,此指標值越接近1代表群聚現象越不 嚴重,缺陷點的分佈狀況越隨機,反之,若CIT越大,代表群聚現象越嚴重。下 表整理出,不同的CIT數值所代表的群聚現象嚴重程度,如表2.2所示。 表2.2 群聚指標CIT指數與群聚嚴重程度對照表 群聚現象 群聚指標CIT 無 1-3 輕微 3-10 中等 10-20 嚴重 20以上

2.4 類神經網路介紹

類神經網路(artificial neural network)為模仿人類神經網路的資訊處理系統。

人類的頭腦約由1011個神經元(neuron)所組成,所有的訊息在神經元和神經元 間,藉著軸突(axon)發送和樹突(dendrite)接收,來完成傳遞的動作。在這樣的動 作中,人類將接收進來的訊息進行整合、分類,進一步形成人類的知識。類神經 網路便是藉著各種數學模型與計算式來模仿人類神經元的運作,進一步模擬訊息 的傳送,以達到分類或辨識。在1958年,Rosenblatt[12]提出了第一個類神經網路 的模型---知感器(perceptron),為最簡單的類神經網路系統。接著在1986年,

(21)

Rumelhart et al [9]推導出了多層的知感器(multilayered perceptron),成為類神經網 路中應用最廣泛的模型。至此之後,類神經網路的研究開始蓬勃的發展,不同的 模型紛紛被提出。直到現在,普遍被應用於各領域包含資訊系統、工業工程、商 業與金融、科學資訊等方面。 依照學習方式的不同,類神經網路分成監督式學習(supervised)及非監督式學 習(unsupervised)兩種。監督式學習的訓練方式在於其訓練樣本(training sample) 提供了每個樣本的類別標籤,即樣本要分成幾類且每個樣本是屬於哪一類是事先 已知的,而相反的,非監督式學習其系統對於所要分類的樣本有幾類以及每一個 樣本屬於哪一類皆是未知的,所以需在訓練前任意的將樣本分成幾個種類,但哪 一種分類比較好則要進一步計算所謂的分類資訊(separation information)才能判 斷出。 不同的問題性質適用的類神經網路模型也不同,目前常見的網路有倒傳遞網 路(Back-propagation Network)、半徑式函數網路(Radial Basis Function Network)、 自組性演算法(Group Method of Data Handling)。

2.4.1 倒傳遞類神經網路

倒傳遞類神經網路(以下簡稱為倒傳遞網路)模式是目前類神經網路學習模式中 最具代表性者,應用最為廣泛。倒傳遞網路之基本原理是利用最陡坡降法(the gradient steepest descent method)的觀念,將誤差函數予以最小化。倒傳遞網路屬

於監督式學習網路,因而適合於診斷、預測等應用。其架構如圖2.5所示。

(22)

一個倒傳遞網路包含三個部分,分別是輸入層、隱藏層以及輸出層。每一層 皆有數個神經元,不同層間的神經元與神經元間皆有連結相連,此連結代表權 重,亦即當資料進入輸入層後會經過加權平均,會在每一層進行加權平均的動 作,出來的結果為下一層的輸入。倒傳遞網路的訓練方式包含兩個階段,分別是 前饋階段以及倒傳遞階段: (1) 前饋階段:輸入向量由輸入層引入,以前饋方式經由隱藏層傳導至輸出 層,並計算出網路輸出值,此時,網路的鍵結值都是固定的。 (2) 倒傳遞階段:網路的鍵結值則根據錯誤更正法則來進行修正,藉由鍵結值 的修正,以使網路的輸出值趨向於期望輸出值。更明確地說,我們以期望 輸出值減去網路輸出值以得到誤差信號,然後將此誤差信號倒傳遞回網路 中。 簡單的說,倒傳遞網路的目的是藉著調整層與層間的權重來達到總誤差平方 和最小化,而如何調整權重則有賴於誤差信號的回饋。經由這樣反覆的訓練,直 到權重值收斂為止。 建構一個完整的倒傳遞網路需經過以下五個步驟: 1. 決定網路架構 :在這階段需決定出網路的層數,每一層的神經元個數等。 2. 初始化:設定各項學習參數,如學習速率等。 3. 前饋階段:資料進入輸入層後,經過層層的加權平均,得到期望輸出值。 4. 倒傳遞階段:計算總誤差平方和,將資訊回饋至上一層。經由修正該層之權 重值。重複這樣的動作直至輸入層。 5. 收斂條件測試:重複前餽階段和倒傳遞階段直到權重值收斂為止。 倒傳遞網路的優點是其可以建構非線性的模型,且網路的架構彈性相當 大,可接受不同種類的變數作為輸入變數,且應用領域相當廣泛。但由於網路架 構彈性大,所以網路的解有無限多個,無法得知哪一組解為最佳解。另一方面,

(23)

在訓練過程中,無法得知需要多少神經元個數,太多或太少的神經元均會影響系 統的準確性,因此往往需以試誤的方式得到適當的神經元個數及各項參數的最佳 設定值,因此常會造成訓練過程的耗時。

2.4.2 半徑式函數網路

半徑式函數網路的基本原理是結合自我組織特徵圖(self-organizing feature maps)的非監督式學習以及倒傳遞網路的監督式學習,其網路架構包含一輸入 層、一隱藏層與一輸出層。輸入層與隱藏層間使用無監督式學習,隱藏層與輸出 層間使用監督式學習。此網路之學習過程分為以下兩個階段: 1. 非監督式學習階段:輸入層先將訓練樣本用非監督式法分成K群,並將結果 輸入隱藏層。 2. 監督式學習階段:以監督式學習法調整輸入層與隱藏層間的權重值,達到學 習訓練樣本輸入向量對應輸出向量內在規則目的。 通常隱藏層的數目只要一層即會有很好的效果,過多的隱藏層往往會造成網 路過度複雜,而導致學習的誤差函數不易收斂。而隱藏層中的神經元部分,一般 而言,神經元越多,學習效果越佳,但往往會產生過度學習以及訓練時間較長的 缺點。 半徑式函數網路相較於倒傳遞網路,其優點為: 1. 其訓練速度較快。 2. 當處理分類問題時,其產生出的分類界限較佳。 缺點為: 1. 在第一階段的分類,由於是非監督式學習,重要的分類資訊可能在這一階段 失去。 2. 無法提供較完整的分類資訊。

(24)

2.4.3 自組性演算法

自組性演算法[4]是俄國學者Ivakhnenko於1970所提出,屬於類神經網路的 一種,主要用於包含不確定性因素的系統中,如圖像辨識、氣象預測等。自組性 演算法其理論架構是從既有的資料中找出輸入變數間彼此的關係並建構出最接 近真實值的數學方程式。建構過程中,輸入變數會彼此自行組合、競爭,淘汰掉 表現不佳的神經元,保留通過檢測的神經元,反覆進行此流程直到模型不再改 進,即可得到最佳的數學方程式。 一般而言,自組性演算法可用 Kolmogorov-Gabor 多項式來描述,如下所示:

∑∑∑

∑∑

= = = = = = + + + + = M i M j M k k j i k ij M i M i M j j i ij i ix a x x a x x x ... a a y 1 1 1 1 1 1 0 其中 為輸出變數,y X =

(

x1,x2,L

)

為輸入變數之向量,A=

(

a1,a2,L

)

為方程式 之係數。GMDH演算法為一種自我衍生之多層結構,且每一層所構建之輸出變數 都會透過優選條件篩選出較佳者作為下層之輸入。簡單來說,若在上一層中存在 n 個神經元,則下一層將產生m 個神經元,其中m = n(n-1)/2 ,每一個神經元只 有兩個輸入變數,以第j 層之第k 個神經元為例,它們的多項關係式如下式所示: 其中d和c為輸入的自變數且c≠d。 其學習規則如下: Step1:載入資料數據。 Step2:資料前處理。將資料數據(樣本向量) T 分成三個集合,分別是具N 個樣 本的學習資料集合(training data set)、具nc個樣本的門檻資料集合

(threshold data set)與具nt個樣本的測試資料集合(testing data set),

T = N + nc + nt,其中之門檻資料集合,目的是為了降低在學習資料集合

中之極端值或雜訊的影響,增加學習的效果。

Step3:產生初始的網路架構。產生第一層 (j = 1) 的m 個神經元,建構成初始的 網路。

(25)

Step4:計算與檢查r2jk。 1. 計算:計算如下式[11]。 其中 Y = 應變數的實際輸出值。 P = N + nc。 2. 門檻:可分為兩個檢查步驟 (1) 當計算所得的r2jk < Rj ,則保留此神經元,續到步驟(2);反之,到Step5。 (2) 找出第j 層所保留重要神經元中之最小的r2jk,並與第j-1 層最小的r2j-1,k比較, 若r2jk<r2j-1,k,到Step6;反之,到Step7。 Step5:剔除不佳的神經元。根據Step4 檢查的結果,剔除不重要的神經元。 Step6:產生下一層的神經元,即 j = j + 1 。採用Step4 保留下來的重要神經元, 產生下一層的神經元,並回到Step4。 Step7:完成學習。當第j 層最小的r2jk 大於第j - 1 層最小的r2j-1,k時,則視為第j - 1 層第 k 個神經元找到最佳的參數,完成第j 層的學習。 上述各步驟流程圖如圖2.6所示。 相較於倒傳遞網路,自組性演算法有以下之優點: 1. 較節省時間,因為其不需要透過試誤法來調整網路參數。 2. 使用者不須受過相關之類神經網路知識的教育。

(26)

(1) 載入數據資料 (2) 資料前處理 z 學習資料 z 查核資料 z 測試資料 (3) 產生初始的網路架 圖2.6 自組性演算法學習流程圖

2.5 以類神經網路方法辨識晶圓缺陷圖案之相關文獻

針對晶圓缺陷點圖案,吳璟旻使用類神經網路的方法來辨識缺陷點的圖案。 此研究使用了類神經網路方法中的倒傳遞網路(back propagation network)、 半徑式函數網路(radial basic function)以及學習向量量化網路(Learning Vector Quantization)來辨識常見的四種晶圓缺陷點圖案,分別是環狀(ring type)、半環狀 (half-ring type)、刮傷(scratch type)、以及邊環狀(edge-ring type)。辨識的

(4) 計算與檢查 r2jk (5) 剔除貢獻度低 的神經元 (6) 產生下一層的神經元 (7) 否 是 完成學習

(27)

過程分成四步驟: 1. 缺陷圖資料轉換-將以座標型態呈現的缺陷資料轉換成 300x300 pixel 的影 像圖檔,並將轉檔後的資料,依據經驗法則以 3 比 1 或 4 比 1 的比例分為訓 練資料與測試資料。 2. 確認系統性缺陷-利用遮罩(mask)的方式來切割影像圖檔,並利用門檻值的 設定來衡量遮罩內的缺陷點數量,小於門檻值則判定為隨機性缺陷予以剔 除,反之則判定為系統性缺陷並以黑色表示。此步驟最主要目的是希望可以 讓影像圖檔上只留下系統性的缺陷圖案。遮罩的大小設定以實驗的方式選出 較佳的遮罩大小。 3. 特徵值擷取-吳璟旻根據所要判別的四種不同的晶圓缺陷點圖案設定了四種 特徵值作為類神經網路方法的輸入變數,分別是掃瞄區域的缺陷百分比、環 狀區域的半徑、系統性缺陷區域面積以及偏心率掃瞄區域缺陷百分比和找出 環狀區域的半徑是為了將環狀和半環狀的圖案與其他圖案區分開來,掃瞄區 域缺陷百分比可以將環狀以及半環狀圖案區分開來,而偏心率則是可以區分 出刮傷和其他所要辨識的圖案。 4. 建構類神經網路-建構倒傳遞網路、半徑式函數網路和學習向量量化網路, 以四項特徵值作為輸入變數,針對其訓練和測試結果進行比較。 此三項方法皆得到了相當不錯的辨識效果,且利用擷取的特徵值作為類神經 網路的輸入變數可以減少以往利用類神經網路進行分類時網路的複雜度,並提高 判斷準確度。但若門檻值以及遮罩的大小若設定不佳,會降低整個辨識率的表 現,但吳璟旻並未提出一個系統化的方法來設定這兩項參數。

(28)

第三章 研究方法與步驟

本論文之主要目的為利用類神經網路方法及群聚指標CIT,建構出一個能夠

快速且準確辨識出四種常見的晶圓缺陷點群聚圖案(牛眼、底部、弦月、環狀) 的系統。本論文在建構的過程中,使用模擬之晶圓資料比較倒傳遞類神經、半徑 式函數網路類神經及自組性演算法等三種常見的類神經網路方法,分別找出這三 種方法的最佳參數設定以及比較三種方法的最小誤差平方值(Mean Square Error) 和辨識率。本論文最後以新竹科學園區某積體電路製造公司所提供之實際資料來 驗證本論文所提辨識系統的有效性及可行性。 本章共分兩小節。第3.1節為缺陷點圖案辨識系統建構流程,說明如何以類 神經網路方法建構晶圓缺陷點群聚圖案系統;第3.2節說明晶圓缺陷點群聚圖案 辨識流程,說明以本論文所提出之辨識系統來辨認晶圓缺陷點圖案的流程。

3.1 缺陷點圖案辨識系統建構流程

本小節主要目的是要分別找出三種類神經方法的最佳參數設定以及其最小 誤差平方值和最佳辨識率,其研究步驟如下: 步驟一:設定類神經系統的輸入變數 根據不同的群聚圖案,訂定出可決定是否為該群聚圖案之特徵值。一般而言, 牛眼圖案的缺陷點大部分落在晶圓中心附近,角度分佈範圍大,距離小;底部圖 案的缺陷點大部分落在晶圓的某一側,角度分佈範圍小,距離中到大;弦月圖案 的缺陷點大部分落在晶圓某一側,角度分佈範圍中到大,距離大;環狀圖案的缺 陷點大部分落在晶圓邊緣,角度分佈範圍大,距離大。本論文依各群聚圖案之特 色整理如表3.1。由此得知,晶圓上缺陷點間之距離以及缺陷點角度之分佈範圍 是決定此四種群聚圖案的重要因素,因此採取每片晶圓缺陷點的平均距離、平均 角度,距離變異數、角度變異數作為特徵值,即為類神經網路系統的輸入變數。 另外採用蔡文傑[5]的群聚指標CIT作為類神經的第五個輸入變數。CIT可判斷出

(29)

缺陷點群聚現象的嚴重程度,且根據蔡文傑的研究,不同的群聚圖案其CIT值會 落入的區間亦會不同,因此加入群聚指標CIT作為輸入變數以提升類神經網路系 統的辨識率。 表3.1 四種群聚圖案的特性 主要分佈範圍 距離 角度分佈範圍 牛眼圖案 晶圓中心附近 小 大 底部圖案 晶圓某一側 小 中-大 弦月圖案 晶圓某一側 中-大 大 環狀圖案 晶圓邊緣 大 大 步驟二:建立模擬資料,作為類神經方法的訓練(Training)以及測試(Testing)資 料。 利用Excel VBA 模擬八吋晶圓上四種不同的缺陷點群聚圖案。在模擬時,採 用十種不同的百分比因子水準(50%、55%、60%...95%)[3]共產生十種的缺陷點 群聚圖案。所謂百分比因子定義為:若缺陷點群聚圖案為環狀圖案,以百分比因 子50%為例,表示晶圓上50%的缺陷點的位置會被指定到晶圓邊緣,其餘50%的 缺陷點則隨機散布於整片晶圓上。每種因子水準均模擬50片,所以每一種群聚圖 案共模擬500片。而每一片晶圓上會產生200個缺陷點。擷取每一片晶圓上五項特 徵值作為類神經網路的輸入變數,隨機取每種群聚圖案的450片為訓練資料,剩 餘的50片作為測試資料。 步驟三:根據三種不同的類神經方法進行訓練 利用步驟二所得到的資料,進行類神經方法的訓練。根據最小誤差平方值以

(30)

及判別測試資料的準確率來找出三種方法中,個別效果最佳的參數組合,作為本 論文進行實例驗證時所需設定的參數值。

3.2 晶圓缺陷點群聚圖案辨識流程

本論文針對晶圓缺陷點群聚圖案辨識過程提出一標準化的流程,以達到快速 準確辨識晶圓上缺陷點群聚圖案的目標。 本流程首先引用蔡文傑[5]的群聚指標CIT,其目的主要是為了提升辨識準確 度,原因如下:在進行類神經網路的訓練時,若將無明顯缺陷點群聚現象的晶圓 特徵值代入辨識系統,容易造成辨識率過低,這是因為隨機分佈的缺陷點特徵值 無顯著特色,容易造成系統的誤判,這也是當初在進行類神經的訓練時,不採取 隨機散佈的缺陷點圖案作為訓練資料的原因。因此若能先經由群聚指標CIT的幫 助,只需針對有群聚現象的晶圓作判別,即可以大大提升辨識率及節省辨識時間 與成本。而根據蔡文傑[5]的研究,在缺陷點為200的情況下,CIT值在3以下的屬 於無嚴重程度群聚現象,因此本論文以CIT=3為基準值,大於3則進行缺陷點群 聚圖案辨識,小於3則不需要進行圖案之辨識。 本論文提出之晶元缺陷點群聚圖案辨識流程如圖3.1所示。

(31)

計算晶圓上缺陷點新群 聚指標CIT 圖3.1 本研究之晶圓缺陷點圖案辨識流程 無明顯群聚現,不需進 行缺陷點群聚圖案辨識 計算晶圓上缺陷點的五 項特徵值 進行群聚圖案辨識,判別 出最有可能圖案 依據圖形,檢查可能造成 的原因,進行改善。 CIT>3 否 是

(32)

第四章 系統實作與驗證分析

根據本研究在第三章所提出的系統架構,本章說明如何以 Excel VBA 所產 生的模擬資料來進行三種類神經方法的訓練。本章另以實際的半導體晶圓缺陷點 資料來驗證本論文所提方法的有效性及可行性。 本章共分四小節,第 4.1 節介紹如何產生模擬資料和擷取五項特徵值,第 4.2 節進行三種類神經方法的結果分析與比較,第4.3 節進行實際晶圓資料的驗證分 析,第4.4 節則針對本章的實驗結果作總結。

4.1 電腦模擬資料與特徵值擷取

根據四種群聚圖案的特色、10 種百分比因子水準(50%、55%、…、95%) 以及每種因子模擬50 片的情況,共產生 2000 片的模擬晶圓缺陷點分佈資料。其 中1800 片作為訓練資料,200 片作為測試資料。不同的群聚圖案和因子水準所 產生的缺陷點群聚圖案如圖4.1 所示。 擷取每一片晶圓上的缺陷點距離圓心之距離平均數、距離變異數、與圓心之 夾角平均數、夾角變異數及群聚指標CIT 作為類神經的輸入變數。輸出值的設定 則依類神經方法的不同而有不同,倒傳遞網路和半徑式函數網路的輸出值設定為 類別變數,即有四個輸出神經元,分別是:牛眼圖案=(1,0,0,0)、底部圖案 =(0,1,0,0)、弦月圖案=(0,0,1,0)、環狀圖案=(0,0,0,1)。而由於自組性演算法的輸出 層只有單一神經元,所以輸出值的設定為牛眼圖案=1、底部圖案=2、弦月圖案 =3、環狀圖案=4。表 4.1 列出其中 20 筆資料所擷取出的特徵值以及相對應的輸 出值之對應關係,其中在第一欄中,依序代表的是[群聚圖案_百分比因子水準_ 晶圓編號]。

(33)

牛眼,50%因子水準 牛眼,75%因子水準 牛眼,95%因子水準 底部,50%因子水準 底部,75%因子水準 底部,95%因子水準 弦月,50%因子水準 弦月,75%因子水準 弦月,95%因子水準 環狀,50%因子水準 環狀,75%因子水準 環狀,95%因子水準 圖4.1 不同群聚圖案在不同百分比因子水準下之散佈圖

(34)

表4.1 缺陷圖案特徵值擷取範例 距離平均數 距離變異數 夾角平均數 夾角變異數 CIT值 輸出值 (BP、RBF) 輸出值 (GMDH) 牛眼_0.5_01 46.3744 1014.935 181.5887 10628.42 3.9105 1 0 0 0 1 牛眼_0.55_01 45.16267 1017.835 177.1718 10459.91 3.7024 1 0 0 0 1 牛眼_0.75_01 30.57309 624.2607 175.7806 12583.99 4.5532 1 0 0 0 1 牛眼_0.85_01 25.39889 409.5256 185.5681 11399.63 8.8859 1 0 0 0 1 牛眼_0.95_01 21.05445 242.8252 179.4568 10771.86 37.287 1 0 0 0 1 底部_0.5_01 76.14882 441.5473 217.6362 9302.674 3.0311 0 1 0 0 2 底部_0.55_01 77.48196 413.8725 214.4968 9903.343 4.4225 0 1 0 0 2 底部_0.75_01 78.08366 336.2519 238.6146 6678.865 8.1484 0 1 0 0 2 底部_0.85_01 82.87887 216.0744 254.4236 4073.161 10.055 0 1 0 0 2 底部_0.95_01 81.17598 331.9725 256.5283 4095.405 12.366 0 1 0 0 2 弦月_0.5_01 80.03363 419.5329 219.0106 9072.784 4.6420 0 0 1 0 3 弦月_0.55_01 79.53974 435.0365 222.5347 8131.289 6.2060 0 0 1 0 3 弦月_0.75_01 85.60097 218.4284 242.2982 6247.166 8.7531 0 0 1 0 3 弦月_0.85_01 86.24 209.43 258.4276 4543.577 10.175 0 0 1 0 3 弦月_0.95_01 89.44788 87.90228 266.0972 2928.482 37.355 0 0 1 0 3 環狀_0.5_01 73.9486 477.4405 171.9833 11897.54 3.1769 0 0 0 1 4 環狀_0.55_01 74.91535 426.1858 171.1372 10695.81 3.5242 0 0 0 1 4 環狀_0.75_01 81.48467 325.544 187.5102 10371.87 7.5726 0 0 0 1 4 環狀_0.85_01 86.38609 142.9073 183.0538 9925.626 11.923 0 0 0 1 4 環狀_0.95_01 88.04051 129.228 185.4311 10963.6 25.198 0 0 0 1 4

(35)

4.2 三種類神經方法的最佳參數設定與驗證

4.2.1 倒傳遞網路的訓練及結果

在建構倒傳遞網路時,要設定的參數分別有學習循環次數(iteration)、學習

率(learning rate)、動量係數、以及隱藏層的節點數目(hidden node),而隱藏層的 數目通常會設定為一層,因為過多的隱藏層往往會造成過度訓練以及訓練時間過 長,除非訓練結果不如預期,才會增加隱藏層的數目。 在決定學習循環次數時,常見的方法有兩種。第一種方法為在固定學習率以 及動量係數的情況下,進行網路訓練,直到獲得可以接受的RMSE(root mean square error)。一般而言,隨著學習循環次數的增加,RMSE 會跟著減少且趨於 穩定,因此學習循環的次數會選在趨於平穩後(假設為 m 次)的 n 次,n 的多寡則 由訓練者自行主觀決定,學習循環次數為m + n 次,此方法所決定的學習循環次 數具有較省時的優點,但缺點為有時會無法找出更佳的RMSE;第二種方法所產 生的學習循環次數並不固定,在每一次不同參數組合的網路訓練中,設定當出現 一最少的RMSE 時,若再經過 n 次循環皆沒有更小的 RMSE 值,則停止訓練,n 值的決定亦是由訓練者主觀決定,此方法可以確保得到較佳的RMSE 值,但學 習循環次數較不固定,可能會造成訓練時間過長。由於本研究希望可以確保找出 較佳的RMSE,因此採取第二種方法。 而有關學習率、動量係數以及隱藏層節點數的設定,則需經過學習訓練才可 以得知怎樣的參數組合才會得到較佳的RMSE。在本研究中,學習率設定為 0.1、 0.15、0.2 及 0.25,動量係數設定為 0.85、0.9 及 0.95,隱藏層節點數則是設定 為[1-8],總共需實驗 4 × 3 × 4 = 96 次。表 4.2 列出不同的參數組合所得到 的 RMSE 及錯誤辨識率,經過實驗發現,動量係數的設定對於 RMSE 的結果影響很 小,且動量係數=0.85 的表現較佳,因此只列出動量係數=0.85 的結果。

(36)

表4.2 倒傳遞網路訓練結果(動量係數=0.85) 學習率 隱藏層 節點數 RMSE (TRAINING) RMSE (TESTING) 錯誤率 學習率 隱藏層 節點數 RMSE (TRAINING) RMSE (TESTING) 錯誤率 0.1 1 0.2791 0.2604 0.5 0.2 1 0.3039 0.2859 0.315 0.1 2 0.0164 0.0143 0.25 0.2 2 0.1588 0.1466 0.25 0.1 3 0.0160 0.0241 0.0115 0.2 3 0.0095 0.0368 0.012 0.1 4 0.0122 0.0245 0.0085 0.2 4 0.0094 0.0290 0.0075 0.1 5 0.0097 0.0195 0.008 0.2 5 0.0083 0.0249 0.008 0.1 6 0.0108 0.0218 0.0075 0.2 6 0.0114 0.0176 0.007 0.1 7 0.0059 0.0194 0.007 0.2 7 0.0107 0.0178 0.007 0.1 8 0.0086 0.0146 0.005 0.2 8 0.0102 0.0194 0.005 0.15 1 0.2993 0.2702 0.2625 0.25 1 0.3077 0.2818 0.3235 0.15 2 0.1682 0.1423 0.2505 0.25 2 0.1588 0.1466 0.25 0.15 3 0.0129 0.0247 0.0105 0.25 3 0.0096 0.0384 0.012 0.15 4 0.0072 0.0204 0.0075 0.25 4 0.0096 0.0294 0.0075 0.15 5 0.0063 0.0047 0.008 0.25 5 0.0082 0.0259 0.008 0.15 6 0.0086 0.0177 0.007 0.25 6 0.0078 0.0251 0.0065 0.15 7 0.0046 0.0162 0.006 0.25 7 0.0109 0.0189 0.007 0.15 8 0.0059 0.0207 0.0055 0.25 8 0.0102 0.0187 0.0055 由表4.2 可知,當固定隱藏層節點數時,學習率在 RMSE(Training)的表現相 對而言以 0.15 最佳;而在學習率等於 0.15 的情況下,以隱藏層節點數=7 時, RMSE(Training)表現最佳,但在 RMSE(Testing)表現卻很明顯不佳,這代表在隱 藏層節點數=7 時產生過度學習的現象,所以較佳的參數設定值為學習率= 0.15,隱藏層節點數=5,動量係數=0.85,此時的錯誤辨識率為 0.8%,即正 確率達(Training)=99.2%且正確率達(Testing)=99.5%,代表倒傳遞網路在晶圓

(37)

缺陷點群聚圖案的辨識上有很好的效果。

4.2.2 半徑式函數網路的訓練及結果

在建構半徑式函數網路時,要考慮的參數分為兩類,分別是非監督式階段的 參數和監督式階段的參數。非監督式階段要設定的參數主要為分類數(cluster numbers)和學習循環次數;而在監督式階段主要分為學習循環次數、隱藏層數、 隱藏層節點數、學習率、動量係數。 分類數的設定一般都是依據分類數目來做決定,因此在本研究中設定分類數 目為4,若將分類數設定超過 4,根據實驗,RMSE 反而會隨著而分類數增加, 如表4.3 所示。在非監督階段學習循環次數較不影響之後的 RMSE 值,只要能夠 達到收斂即可,根據實驗,將學習循環數目定為500 即可得到穩定的收斂值。 在設定監督式階段的參數方面,學習循環數目定為 3000;隱藏層數一般設 定為零層或一層即可得到很好的效果,若效果不如預期,則再增加隱藏層數。在 本研究中,學習率設定為0.1、0.15、2,動量係數設定為 0.85、0.9 及 0.95,隱 藏層節點數為 1-10、15、20、25、35、40。 經過實驗可知,在有一層隱藏層的情況下,動量係數和學習率的不同對於 RMSE 影響較不大,而是隱藏層節點數對於 RMSE 的影響較顯著。相對而言,在動 量係數=0.9、學習率=0.15 時,訓練效果較佳。表 4.4 和表 4.5 列出半徑式函 數網路的訓練結果。表 4.4 是在無隱藏層情況下的訓練結果,表 4.5 是在有一層 隱藏層下的訓練結果。 由表4.4 和表 4.5 可以發現,當在隱藏層數=0 時,訓練效果非常不理想。 而在隱藏層數=1 時,RMSE(Training)會在一開始隨著隱藏層節點數的增加而減 少,而當隱藏層節點數超過5 以後,RMSE(Training)的數值皆介在 0.075~0.090 間,代表在隱藏層節點數超過5 以後,不會因為節點數的增加而使訓練效果更 佳,而又節點數越小訓練時間越短,因此隱藏層節點數設定為6。

(38)

表4.3 半徑式函數網路在不同分類數下的RMSE值 隱藏層數 學習率 分類數 隱藏層節點數 RMSE 1 0.1 4 15 0.1 1 0.1 5 15 0.11 1 0.1 6 15 0.15 1 0.1 7 15 0.17 1 0.1 8 15 0.179 1 0.1 9 15 0.189 1 0.1 10 15 0.19 表4.4 半徑式函數網路訓練結果(隱藏層數=0,動量係數=0.9) 學習率 RMSE(TRAINING) RMSE(TESTING) 正確率 0.1 0.212 0.2171 0.855 0.15 0.211 0.21704 0.8561 0.2 0.2126 0.2183 0.854975 0.25 0.2108 0.21686 0.8555 表4.5 半徑式函數網路訓練結果(隱藏層數=1,動量係數=0.9,學習率=0.15) 隱藏 層節 點數 RMSE (TRAINING) RMSE (TESTING) 正確率 隱藏 層節 點數 RMSE (TRAINING) RMSE (TESTING) 正確率 1 0.3346 0.3372 0.7455 11 0.07966 0.0695 0.936625 2 0.1339 0.1549 0.90385 12 0.085906 0.0726 0.93495 3 0.13431 0.1553 0.89665 13 0.07298 0.0704 0.93975 4 0.11226 0.1199 0.9105 14 0.08743 0.07794 0.929975 5 0.091815 0.0832 0.928275 15 0.08105 0.07516 0.937175 6 0.0782 0.073 0.934975 20 0.080921 0.07476 0.936625 7 0.082 0.07014 0.9322 25 0.086902 0.07142 0.9294 8 0.077938 0.07479 0.935525 30 0.079629 0.08074 0.9383 9 0.081136 0.0835 0.936075 35 0.07763 0.06969 0.9394 10 0.08104 0.07037 0.9344 40 0.07504 0.07156 0.93495

(39)

因此,較佳的半徑式函數網路的參數設定為:分類數=4、學習循環次數(非 監督式階段)=500、學習循環次數(監督式階段)=3000、隱藏層數=1、隱藏層 節點數=6、學習率=0.15、動量係數=0.9,在此情況下,辨識正確率(Training) =93.4975%且辨識正確率(Testing)=94%,代表半徑式函數網路在晶圓缺陷點 群聚圖案的辨識上,有很好的效果。

4.2.3 自組性演算法的訓練及結果

在進行自組性演算法的訓練時,所需設定的參數主要是多項式的最高乘冪, 包括每個變數個別項的乘冪(如 、 、 、…)、兩兩交互作用項的設定(如 是否有X 1 X 2 1 X 3 1 X 1X2 、X2X3、…)以及最高交互作用項為幾項(若3 項則是X1X2X3 、 X2X3X4、…)。在本研究中,輸入變數有五項,分別是X1:距離平均數、X2:距離 變異數、X3:夾角平均數、X4:夾角變異數、X5:CIT群聚指標。根據楊博欽[4] 的建議,多項式的最高乘冪設定為:個別項乘冪為 3,交互作用項全選,最高交 互作用項為 5,即X1X2X3X4X5。至於其他參數的設定如Selection Criterion或Schedule Type等,在一般的類神經軟體中,都會有建議的設定,除非有特殊狀況(如訓練 結果不佳或RMSE太高),否則不改變這些參數設定。 在此參數設定下,進行訓練的結果,得到如下的數學多項式: Y=-0.0083*X2-0.0067*X5-24+0.34*X3+0.00056*X4-0.16*X1+0.0013*X1^2-0.00000 23*X2^2-0.0017*X3^2+0.0000026*X3^3+0.00024*X1*X2+0.00031*X1*X3+0.00005 6*X2*X3-0.0000011*X1*X2*X3+0.00000069*X4*X5-0.000000011*X4^2-0.0000016* X3*X4 由於將輸入變數代入此多項式後,所得到的 Y 為一連續變數,所以在做分 類時,以最靠近的分類值(1、2、3、4)作為分類的結果。舉例來說,若輸入某一 組輸入變數得到的 Y 為1.12,則將此組資料判定為第 1 類,即牛眼圖案。

(40)

表 4.6 列出 1800 筆資料中的 12 筆資料作為如何判斷分類結果的範例。而表 4.7 則列出自組性演算法的訓練結果。 表4.6 自組性演算法分類結果-以其中12筆資料為例 X1 X2 X3 X4 X5 輸出變數 (實際值) 輸出變數 (計算值) 分類是 否正確 44.0467 914.5045 185.4649 12379.88 1.796327 1 1.101382 Y 45.83051 1011.137 166.4346 10366.08 2.027246 1 1.201424 Y 46.85725 1084.422 175.7717 12672.28 2.52388 1 1.169475 Y 77.36798 465.5773 234.1151 8405.098 4.851248 2 2.181471 Y 77.57294 417.8484 218.5468 8324.593 3.536955 2 2.606308 N 79.32839 337.1428 228.3883 7779.9 4.751358 2 2.360574 Y 82.41424 343.0652 233.2244 9205.352 3.449371 3 2.723854 Y 80.07208 362.2863 221.8576 9068.983 4.020375 3 2.739541 Y 81.06624 346.1201 224.4333 8924.351 5.843649 3 2.770722 Y 81.15166 390.6349 179.875 10364.92 4.09724 4 4.310472 Y 82.56437 309.8086 180.6909 9867.309 5.420941 4 4.093597 Y 81.48467 325.544 187.5102 10371.87 7.572677 4 3.881505 Y 表4.7 自組性演算法訓練結果 RMSE (TRAINING) RMSE (TESTING) 辨識正確率 (TRAINING) 辨識正確率 (TRAINING) 0.0228251 0.0214522 0.9389 0.940

(41)

由辨識正確率(Training)=93.89%且辨識正確率(Testing)=94%,可以發現 自組性演算法在晶圓缺陷點群聚圖案辨識上,有很好的效果。

4.2.4 三項類神經方法的最佳參數設定及結果比較

表4.8 統整了三種類神經方法中,所需要設定的參數及較佳的參數設定值、 RMSE 和正確辨識率。下一節的實例驗證,是以此參數設定值所訓練出的類神經 模型進行缺陷點群聚圖案的辨識。 表4.8 三種類神經方法的較佳參數設定、RMSE和正確辨識率 方法 參數設定 RMSE (TRAINING) RMSE (TESTING) 辨識率 隱藏層數:1 隱藏層節點數:5 學習率:0.15 倒傳遞網路 動量係數:0.85 0.063 0.047 99.2% 分類數:4 學習循環次數(非監督式階段):500 學習循環次數(監督式階段):3000 隱藏層數:1 隱藏層節點數:6 學習率:0.15 半徑式函數 網路 動量係數:0.9 0.0782 0.073 93.5% 變數單獨項最高乘冪:3 交互作用項:全選 自組性 演算法 最高交互作用項:X1X2X3X4X5 0.027268 0.021452 93.9%

(42)

4.3 實例驗證

本研究從實際的半導體廠蒐集到了 15 筆晶圓缺陷資料,這 15 筆資料的分 類圖案皆事先經由人工辨識判斷出其所屬的缺陷圖案,包含5 筆牛眼圖案、2 筆 底部圖案、4 筆弦月圖案及 4 筆環狀圖案。擷取每一片的特徵值,結果如表 4.9 所示。 接著以前面的三種類神經方法判別每一片晶圓的缺陷點群聚圖形,判別步驟 為: 1. 依據表 4.8,設定三種類神經方法的參數。 2. 依據模擬資料進行訓練,分別得到三種類神經方法的模型。 3. 將待判別的晶圓特徵值,代入三種類神經的方法的模型中,得到判別結果及 辨識正確率。 表4.10 列出利用三種類神經方法辨識 15 片晶圓的缺陷點群聚圖案。三種方 法的辨識率分別為100%、93.3%、100%(其中的半徑式函數網路的正確率 93.3 %是誤判了底部圖案的第一片為弦月圖案),代表應用此三種類神經方法於實際 晶圓的缺陷點群聚圖案的辨識時,皆有著良好的辨識能力。

(43)

表4.9 15片晶圓缺陷點的特徵值 晶圓圖案 距離平均數 距離變異數 夾角平均數 夾角變異數 CIT 牛眼_01 31.4483 697.796 175.1043 11800.46 6.889969 牛眼_02 29.32172 647.9786 184.4101 9475.134 7.973202 牛眼_03 37.70355 878.3066 180.5146 12060.69 3.653049 牛眼_04 39.25817 891.3636 179.2636 10818.92 3.081131 牛眼_05 23.47625 404.694 167.49 10608.86 10.46233 底部_01 77.35239 406.1009 232.0492 7355.321 4.31625 底部_02 81.23686 316.708 236.0918 8243.946 7.927341 弦月_01 85.4287 262.4348 246.3482 6331.929 9.966801 弦月_02 85.43215 249.5478 249.5637 5603.559 9.354173 弦月_03 87.39021 187.4759 255.188 3741.232 8.844999 弦月_04 87.84048 223.5965 255.4504 4553.091 12.28191 環狀_01 86.38609 142.9073 183.0538 9925.626 11.92343 環狀_02 87.34784 195.3927 183.089 10710.71 6.892104 環狀_03 87.41108 179.1733 178.9414 10210.41 14.40245 環狀_04 86.86479 198.0654 184.2642 10222.6 13.99947 表4.10 晶圓辨識結果 類神經方法 RMSE 正確率 倒傳遞網路 0.0295 100% 半徑式函數網路 0.0839 93.3%(14/15) 自組性演算法 0.0276 100%

(44)

4.4 實驗結果總結

本章針對三種類神經方法應用於晶圓缺陷點群聚圖案的辨識上,找出了較佳 的參數組合,且根據實驗結果顯示,在此參數組合下,不管是模擬資料或實際資 料,皆有良好的辨識效果。 本章進一步探討三種類神經方法的表現,發現在 RMSE 和辨識正確率的比 較上,倒傳遞網路的表現優於自組性演算法,而自組性演算法優於半徑式函數網 路。在訓練時間上,則是自組性演算法快於倒傳遞網路,倒傳遞網路快於半徑式 函數網路。 綜上所述,藉由本論文第三章所提出的晶圓缺陷點群聚圖案辨識流程,確實 可以輔助工程師進行晶圓缺陷點群聚圖案的辨識,縮短辨識的時間,並快速找出 造成製成異常的原因,可有效減少低良率對企業造成的損失。

(45)

第五章 結論

本研究利用常見的三種類神經方法:倒傳遞網路、半徑式函數網路、自組性 演算法,來進行晶圓缺陷點群聚圖案的分析,分析圖案為牛眼圖案、底部圖案、 弦月圖案、環狀圖案等。在網路訓練過程中,本研究先以模擬資料尋找出較佳的 參數設定值,並以此參數設定值建構出類神經網路模型。接著以實際晶圓缺陷點 資料驗證了此類神經網路模型的有效性。得到的結果為三種類神經方法皆有良好 的RMSE 及正確辨識率。 本研究進一步針對三種類神經方法的表現進行比較。在RMSE 及正確辨識 率的表現上,倒傳遞的表現優於自組性演算法,而自組性演算法的表現優於半徑 式函數。在模型建構的速率上,以自組性演算法最快,倒傳遞網路次之,最慢的 則是半徑式函數網路。本章第5.1 節提出本研究的貢獻,第 5.2 節說明本研究未 來可發展之方向。

5.1 貢獻

本研究之貢獻可彙整成以下兩點: 1. 本研究方法可有效縮短晶圓缺陷點群聚圖案辨識時間,提升辨識準確率,能 輔助工程師迅速找出降低製程良率的原因。本研究結果對積體電路業界實有 相當之貢獻。 2. 改進了之前文獻中,當使用類神經方法進行晶圓缺陷點群聚分析的判別時, 特徵值擷取過於耗時的缺點,且提供出較佳的參數值設定。

5.2 未來研究方向

本研究後續可能之就如下: 1. 由於本研究只針對四種常見群聚圖案作辨識,而目前發現的群聚圖案達 20

(46)

種以上,因此可再針對其他較常見的群聚圖案進行辨識。

2. 在研究晶圓良率時,群聚現象已被證實是影響良率好壞的關鍵之一,但目前 加入的考量因素主要是群聚嚴重程度,而沒有區分在不同的群聚圖案下,對 於良率是否有不同程度的影響,因此未來研究可設計一包含不同群聚圖案之 因子的良率模型。

(47)

參考文獻

[1] 吳璟旻,「應用類神經網路於晶圓缺陷分類」,國立清華大學工業工程研究所 碩士論文,2005。 [2] 陳大倫,「晶圓缺陷點群聚指標之建立」,國立交通大學工業工程研究所碩士 論文,2002。 [3] 許志偉,「整合缺陷點數與群聚指標之積體電路良率模式」,國立交通大學工 業工程研究所碩士論文,2003。 [4] 楊博欽,「應用自組性演算法建構積體電路之良率模式」,國立交通大學工業 工程研究所碩士論文,2005。 [5] 蔡文傑,「利用新晶圓缺陷點群聚指標建構積體電路良率模式」,國立交通大 學工業工程研究所碩士論文,2004。 [6] http://www.spring.org.tw/plan/a86/case/%E6%97%BA%E5%AE%8F%E9%9B%BB%E5%AD %90.htm

[7] Cunningham, S. P. and Mackinnon, S., “Statistical methods for visual defect metrology”, IEEE Transactions on Semiconductor Manufacturing, Vol. 11, No. 1, pp 48-53,1998.

[8] C.Y. Chang, J.W. Chang, M. Jeng, ”Using a Self-Organizing Neural-Network for Wafer Defect Inspection”, IEEE lntemational Conference on Systems, Man and Cybemetics, p.p. 216-221, 2004

[9] D. E. Rumelhart, G. E. Hinton, and P. J. Williams, “Learning Internal

Representation by Error Propagation”, Parallel Distributed Processing, D. E. Rumelhart and .J. L. McClelland, Eds. Cambridge, MA: MIT Press.

[10] EI-Kareh, B., Process Integration and Device Characterization in Microelectronic Manufacturing Course, SEMICON Taiwan,1997.

(48)

[11] Farlow. J. S, “Self-Organizing Methods in Modeling Marcel: GMDH Type Algorithms”, New York, 1984.

[12] F. Rosenblatt, “The Perceptron: A Probabilistic Modelfor Information Storage and Organization in the Brain”, Psychological Review 65, pp. 386-408, 1958. [13] Friedman, D. J., Hansen, M. H., Nair, V. N. and James, D. A., “Model-Free

Estimation of Defect Clustering in Integrated Circuit Fabrication.” IEEE Trans.

on Semiconductor Manufacturing, Vol. 10, No. 3, pp. 344-359, 1997.

[14] Jun, C.-H., Hong, Y., Kim, S.Y., Park, K.-S. and Park, H., “A Simulation-Based Semiconductor Chip Yield Model incorporating a new defect cluster index.”

Microelectronics Reliability, Vol. 39, pp. 451-456, 1999.

[15] Kaempf, U., “The Binomial Test: A Simple Tool to Identify Process

Problem ”IEEE Transactions on Semiconductor Manufacturing, Vol. 8, No. 2, pp 160-165.1995.

[16] Neyer, T. and Hafner, M., “Yield learning using the defect reticle method, ” Advanced Semiconductor Manufacturing Conference, pp 110-114 .2004. [17] Stapper, C. H., “Defect Density Distribution for LSI Yield Calculations,” IEEE

Transactions on Electron Devices (Correspondence), Vol. ED-20, pp. 655-657,

1973.

[18] Stapper, C.H. and Ronser, R. J., “Integrated Circuit Yield Management and Yield Analysis: Development and Implementation,” IEEE Transactions on

Semiconductor Manufacturing, Vol. 8, No. 2, pp 95-102,1995.

[19] Wang, P., Chan, M., Goodner, R., Lee, F. and Ceton, Ron, “Development of The Yield Enhancement System of A High-volume 8-inch Wafer Fab,” International Symposium on Semiconductor Manufacturing, pp 51-52,1995.

(49)

[20] Wong, A. Y., “A Statistical Parametric and Probe Yield Analysis Methodology”, Proceedings of the IEEE International Symposium on Defect and Fault Tolerance in VLSI Systems, pp 131-139,1996.

數據

表 4.6 列出 1800 筆資料中的 12 筆資料作為如何判斷分類結果的範例。而表 4.7 則列出自組性演算法的訓練結果。  表4.6  自組性演算法分類結果-以其中12筆資料為例  X 1 X 2 X 3 X 4 X 5 輸出變數 (實際值)  輸出變數 (計算值)  分類是 否正確  44.0467  914.5045  185.4649 12379.88 1.796327 1  1.101382  Y  45.83051  1011.137  166.4346 10366.08 2.027246 1

參考文獻

相關文件

2-1 註冊為會員後您便有了個別的”my iF”帳戶。完成註冊後請點選左方 Register entry (直接登入 my iF 則直接進入下方畫面),即可選擇目前開放可供參賽的獎項,找到iF STUDENT

Basing on the observation and assessment results, this study analyzes and discusses the effects and problems of learning the polynomial derivatives on different level students

For problems 1 to 9 find the general solution and/or the particular solution that satisfy the given initial conditions:. For problems 11 to 14 find the order of the ODE and

The continuity of learning that is produced by the second type of transfer, transfer of principles, is dependent upon mastery of the structure of the subject matter …in order for a

* All rights reserved, Tei-Wei Kuo, National Taiwan University, 2005..

The Prajñāpāramitā-hṛdaya-sūtra (般若波羅蜜多心經) is not one of the Vijñānavāda's texts, but Kuei-chi (窺基) in his PPHV (般若波羅蜜多心經 幽賛) explains its

Biases in Pricing Continuously Monitored Options with Monte Carlo (continued).. • If all of the sampled prices are below the barrier, this sample path pays max(S(t n ) −

The presentation or rebranding by a company of an established product in a new form, a new package or under a new label into a market not previously explored by that company..