圖形識別(pattern recognition)是一門綜合性的學門,圖形識別的應用包括:語音識別 (speech recognition)、資料挖掘(data mining)、字體識別(character recognition)等。圖形識 別的應用廣泛而且不同,但圖形識別的基本問題:測量(measurement)、特徵抽取(feature extraction)、一般化(generalization)以及辨識度的訓練(training for discrimination)卻是這些 應用所共有的[5]。圖 2-1 便是一般圖形識別的辨識模型。
圖2-1 中,原始資料(Raw data)是一群未經處理的資料。特徵萃取的步驟則是將原始 資料轉換為特徵向量,如語音辨識裡將聲波資料先轉成頻率資料,時間序列的資料在標 準化時也需要做標準化(Normalization)。當把特徵向量萃取出後,將特徵向量當作輸入,
經由圖形識別系統去找尋該輸入的特徵向量是否符合一些預先定義圖形的特徵向量。當 該特徵向量符合辨識系統中的某個類別,該特徵向量便被系統歸類而擁有該類擁有的特 性。
特徵萃取
(Feature Extraction)
原始資料 (Original data)
特徵向量 (Feature Vectors)
圖形識別系統
(Pattern recognition system)
分類1 分類2 … 分類X
圖2-1. 對於一般圖形識別的辨識模型
圖形辨識系統需要先經過訓練(training)才能用來辨識圖形,就像人類需要經驗學習 才能知道哪些東西可以吃,哪些東西不能吃。訓練分為兩種,監督式學習(Supervised Learning)與非監督式學習(Unsupervised Learning)。監督式學習與非監督式學習的差異點 在於對於原始資料的類別種類、類別個數的已知與未知。監督是學習的圖形辨識系統可 以藉由每一次圖形的識別,修正系統內的參數;而非監督式學習則是由特徵向量間的相 似度特性作為分群的依據,不能修正系統的架構與參數。
人類本身就是一個精密複雜的圖形識別系統。在人類每日的生活中,圖形識別的行 為就會不斷的發生,舉凡人類眼睛所看到的物件,耳朵所聽到的聲音,在頭腦裡所做的 推理與思考等。這些物件、聲音、推理就是所謂的圖形(patterns),而這些圖形隨著型態 的 不 同 可 以 分 成 兩 類— 具 體 的 圖 形 (concrete patterns) 與 抽 象 的 圖 形 (abstract
patterns)[5]。具體的圖形泛指人類可以看見的圖形,如影像,可以聽的到的圖形,如聲 音;抽象的圖形指人類心理所想的、推理的,如問題的解法、思想的辨證、理論的思考。
根據圖形識別的問題,圖形識別的定義在於使用方法學去辨識圖形,並且將辨識的 圖形分成多種類別(Classes)[5]。這些被標記類別的圖形,可以被使用在決策的輔助上。
舉例來說:若人類對於圖形(patterns)將其分為可以吃的東西一類,不能吃的東西一類,則 人類先做辨識,再做分類。往後人類接觸到新的圖形(pattern),會利用眼睛識別,在利 用頭腦中的知識庫做圖形的分類,當圖形分類完了,最後做出決策—這個東西到底能不 能吃的決策。
當然,圖形識別被應用在各種研究領域(Research domain)。各領域的知識(domain knowledge)是不相同的,如語音辨識[7]的輸入是聲音的頻率,而影像辨識中的指紋辨識 [8]則是抓取指紋圖像中的特徵點,時間序列則是序列圖形(sequential pattern)的辨識。本 研究之中,被使用的圖形識別方法學是屬於時間序列問題方面的方法學。