• 沒有找到結果。

在這一個世界中,無論是什麼,一定存在著它的規律。只要藉由觀察、

紀錄和統計實驗,就一定有跡可循。藉由這樣的動作,可以發掘一些存在 於世界中規律,任何事情都能盡可能的去解釋它。在電腦世界也是一樣的,

面對日漸俱增的資料,如果能將這些資料善加利用,透過一些經驗法則,

而後學習起來,學習隱含在這資料中的特性,進一步寫成一個演算法。那 麼則可利用這些有用的資訊,作一個預測行為,能在面對任何問題,找出 一個有效率的方式,來去作出準確預測。

1-1 研究背景與動機

支撐向量機(Support Vector Machine, SVM)是由 Vapnik[1]等人基於統 計學習理論(Statistical Learning Theory)所提出,它是一種監督式學習法,故 訓 練 與 預 測 時 , 必 須 事 先 知 道 輸 入 和 輸 出 數 值 。 也 是 一 種 用 來 分 類

(Classification)的演算法。最初是用來解決簡單的二元分類問題,最後延伸

為現在的超平面分類器(Hyperplane Classifiers)。

近年來支撐向量機,在分類的研究領域上被受重視,支撐向量機運用 在 各 式 各 樣 的 領 域 之 中[2-5,56-62], 例 如 手 寫 字 元 辨 識(Hand-written Characters Recognition)[2-3] 、人臉辨識(Face Recognition)[4-5,58-59]、文字 分類(Text Categorization)[57]…等等。在這些實驗數據中,都有不錯的成果

的特徵規律,並將這些資料加以訓練。那麼可以值得去肯定它的分類能力 結果。

1-2 研究目的

支撐向量機在一些領域上的應用,根據一些研究顯示是受到肯定。隱 含在 SVM當中所運用到的數學,如需解一個最佳化的問題,其中這是一個 非 線 性 規 劃 (Nonlinear Programming) 二 次 規 劃 問 題 又 稱 (Quadratic Programming ,QP),又需要用到拉格蘭吉法(Lagrange Method)和卡羅需-庫恩 -塔克(Karush-Kuhn-Tucker ,KKT)[7]限制條件,最後利用 QP 來解出這一個 最佳化的問題,求出 SVM的最佳超平面(Optimal Hyper-plane),表面看似簡 單,其實所用的數學理念是非常深入且複雜的,故真正了解 SVM不是只是 單方面使用現成的 Package,雖然現成的 Package能帶來不少的方便性,用 在教學上或許會有相當的幫助。並非只是在 Package 鍵入簡單的指令,run 一些數據和結果就下定論,至少能了解 SVM是如何以數學的角度去看待,

解決這一個最佳化的問題,那才是這份研究最重要的。

本文將會探討到支撐向量機中,所使用到的一些數學理念與範例,並 將範例求解過程詳細列出說明。除此之外,也提出一個有效的二值化方法,

這篇論文將會提出以支撐向量機為基礎,應用支撐向量機的分類能力,將 灰階影像作二值化,並與其他二值化的方法去作比較與討論。並且以這個 二值化方法為基礎,延伸至影像多階層化。除此之外,也利用 SVM來辨識

中文字形。

1-3 論文架構

本論文總共分為七章:第一章闡述研究動機與背景;第二章詳述一些基 本的基礎理論,說明要解SVM中的最佳化問題,必須使用非線性規劃來解;

除此之外也介紹支撐向量機SVM的理念與種類,其中包含如何轉換成一個 最佳化問題,並藉由SVM所創造出的最佳超平面將資料做分類;第三章詳 述如何基於SVM的二值化方法,將灰階影像轉成二值化影像,並以實驗結 果列出個種參數因素與訓練特徵的結果,最後並且比較其他現有存在的二 值化方法來比較優劣,證明所提出基於SVM二值化方法是有效率的;第四 章 詳 述 如 何 基 於SVM的 二 值 化 方 法 延 伸 至 多 階 層 門 檻(Multilevel

Thresholding);第五章詳述如何使用SVM改善手寫中文相似字辨識,並且改

善辨識率;第六章為第三~五章的實驗結果。最後第七章為本論文的結論。

相關文件