何謂形態辨識?形態辨識(pattern recognition)是指對外界的事物、圖形、文字的辨識 (鄭昭明,1994:140)。我們每天幾乎都在使用這個能力,例如:看到老朋友的臉,聽到 一首樂曲感到熟悉,都依賴這個能力。然而,我們是如何進行形態辨識的?有何歷程?
1. 形態辨識的歷程
形態辨識主要有兩種歷程:一是由下而上的處理(bottom-up processing),另一是由 上而下的處理(top-down processing)。
由下而上的處理是指感官器官接到外來圖形刺激後,會分析其圖形的屬性與結構,
並將這些訊息沿著傳遞管道傳至大腦,進行更進一步的分析,整個訊息處理過程是由下 層傳到上層,所以也可稱為「上行」運作(鄭昭明,1994:14)。此外,由下而上的處理 又稱為「資料導向」(data-driven)的處理,是指由低層次訊息(如:刺激特徵)開始處理,
逐步向上,最後辨認出該刺激(鄭麗玉,2002:38)。我們也可以說「上」所指的是我們 的知識經驗,「下」是指外在環境,「由下而上」即是對外界刺激的認知,受到刺激之物 理性質的客觀因素影響(陳烜之,2007:74)。
然而大腦並非被動的詮釋訊息,它會站在一個主動詮釋的立場,隨時隨地準備去詮 釋外來的刺激為何物。故訊息的分析,也是「由上往下」的方式在運作,可簡稱為「下 行」運作(鄭昭明:1994:14)。由上而下是由下而上的相對歷程,指的是我們會依據本 身的期望或教育等,來詮釋外界刺激,所以又稱為「概念導向」(conceptually driven)的處 理(鄭麗玉,2002:39)。此外,「由上而下」這歷程會受到過去經驗、文化等影響(陳烜之,
2007:74)。
複述 感官儲存 形態辨識
提取
短期記憶 長期記憶
輸入
反應
整體,然而這樣是不夠的,還必須藉由整體的知覺來分析刺激物的內容,這時就會受到 個體知識、期望、動機…等因素影響(錢玉芬,2007:169-170)。由上述歸納可知,學 者們對由下而上的處理與由上而下的處理的想法基本一致。當感官接收器接受刺激開始 後,就循序往大腦一步步進行處理程序,例如分析輪廓、色彩等,即稱為「由下而上」
的處理;相反地,大腦也開始主動地組織外在環境中的所有訊息,藉由與此訊息相關的 記憶、經驗與期望等賦予訊息意義。尤其,當外在刺激品質不佳時,就特別仰賴「由上 而下」的處理,意指大腦會自動添加資料來幫助辨識。然而,在實際生活中,不論是「由 下而上」或是「由上而下」的處理,兩者是同時且交替進行的,透過這兩個歷程,人們 才可以很快速且正確地感知外界的刺激。
2. 完形心理學
透過上述可知形態辨識是由「由上而下」與「由下而上」兩種歷程交互作用的,透 過這兩種歷程,我們可以對圖形進行感知。然而,圖形又是如何被組織起來的?這就與 完形心理學有關了。
完形心理學也稱為格式塔心理學(Gestalt psychology),格式塔是一個德語詞,是「形 狀」或者「形式」的意思。完形心理學的代表人物有惠特海默(Wertheimer)、卡夫卡 (Koffka)、柯勒(Kohler)。
完形心理學的基本理論為:部份之總和不等於整體,整體是由各部份所決定。反之,
部份也由整體決定,例如,當我們在觀看一個圖像符號時,圖像符號中的每個部份形成 了獨立之視覺元素,人們要產生認知就必須將各自獨立之視覺元素加以整合。
在《知覺─理論、發展與組織》一書中指出:完形心理學家曾提出「圖形優化趨勢 規則」,人們透過相近律、相似律、良好的連續性、完形、共同命運的規則將圖形組織 起來(鄭日昌、周軍譯,2003:57)。相近律意指相近的成分傾向被歸為一個整體,如圖(7) 相近律中的 1、2 為一組,3、4 為一組;相似律則意指相似的成分容易被歸為一組;良 好的連續性則是指排列成直線或光滑曲線者易被歸為一個整體;完形意指一個圖形若有 缺口,我們傾向將它感知成一個完整的、封閉的圖形;共同命運是指在同一個方向上運 動的元素容易被視為一個整體。人們可以透過這些法則對圖像符號進行組織。
圖 7 完形法則
資料來源:本研究整理
模印比對理論是指我們所接觸過的事物,都會在大腦中形成一種模印(templates),
當一個外界刺激進入後,我們就會將外界刺激與腦中的模印進行比對,若兩相吻合,我 們即可辨識出這個刺激是什麼。在《認知心理學》一書中指出,模印比對理論的假設是:
我們所接觸的每個外界事物,在腦中必留下一個模印(鄭昭明,1994:144)。若這個假設 成立,那意味著我們腦中儲存著數以萬計的模印,那大腦肯定要花很多時間進行比對,
且當我們接觸到一個全新的刺激時,我們將無法辨識它,這似乎較不合理,因此模印比 對理論較難解釋人們是如何辨識生活中複雜的場景。
(2) 原型論(prototype theory)
原型論就是人們依據腦中的所儲存的典型去辨識事物。原型中通常包含事物最多的 特徵,而一個形態是否被辨認出來,就視它和原型的相似程度而定,越相似就越能被辨 認為該類事物(鄭麗玉,2002)。原型論比起模印比對理論較具有彈性,原型論只需相似,
不需一模一樣。例如,說到「腳踏車」,我們腦中就會出現腳踏車的典型圖像,腦中所 出現的典型圖像即為「原型」。
(3) 特徵分析論(feature-analysis theory)
特徵分析主張每個事物都有其特徵,經由各種特徵而組合成一個形體,故人們要辨 識一個物體時,必須先分析物體的屬性與特徵,透過分析出的屬性與特徵去辨識物體。
例如:字母「T」可分析為一條垂直線,交會在一條水平線的中點,凡符合這些特徵的 都被認為是「T」。
此外,Neisser(1963)實驗發現人類的視皮質是依據特徵(feature)來分析刺激的,即所 謂的特徵偵查理論(feature detection theory),例如:第一組是將 Z 字母放在 T, L, K, M, V 中,另一組是將 Z 字母放在 O, Q, P, B, D 中,Neisser 發現測試者可以較快速地於第二組 中選出字母 Z,主要是因為在第二組中 Z 和其他字母有較顯著的特徵差異。
(4) 成分識別理論(recognition-by-component theory)
人們若只依據「特徵」進行形態辨識,這樣足夠嗎?我們發現字母 Z 並不是只有 三條線和角度這樣的而已,字母 Z 必須依據「規則」去建構字母(Kellogg,2003:72)。
又如,當我們要辨識一個人的臉時,並不是僅僅注意眼睛在這,鼻子在那,嘴巴又在那 這樣而已,我們必須去注意它們間的結構關係。辨識物體不僅僅是依靠特徵,特徵間的 關係也是同樣重要的,甚至需要一些規則去組合這些特徵。因此,出現了成分識別理論。
成分識別理論是由畢德曼(Biederman)所提出。Biederman(1985)曾以圖 8 來解說物體 結構的重要,圖中的(a)和(b)都擁有相同的特徵,但是之間的結構關係卻是不同的,(a) 是皮箱,(b)是抽屜;相同地,(c)和(d)擁有相同的特徵,但因結構不同,代表著不同的東 西。
圖 8 物體結構關係
資料來源:Biederman(1985:29-73)
Biederman(1987)也指出,圖 9 左邊為幾何的特徵,右邊為藉由左邊特徵組合成的物 體,例如:右邊的杯子就是由左邊的 3 號和 5 號特徵所構成的。
Biederman(1985)主張比起物體特徵本 身,物體特徵的關係(即結構)是人們感知物 體的關鍵。舉例來說,圖 10 的中間那排是 較容易被人們感知的,因為當中維持了較多 的輪廓線,人們較能容易感知物體特徵之間 的關係。很多研究也顯示人們會透過物體特 徵間的關係(即結構),去加工辨識物體 (Hummel & Biederman,1992:480-517)。
由以上的敘述可知,人們進行形態分辨 時,除了依據物體的特徵外,特徵間所建構 出的關係(即結構)也是不容忽視的。
圖 9 特徵與結構
資料來源:Biederman(1987:115-147)
圖 10 廓線顯示物體結構關係 資料來源:Biederman(1985:29-73)
與形狀的物理變異極大,但我們仍能忍受高度的物理變異,而產生相當恆常的辨識效 果。例如:以狗來說,狗有很多不同的品種,如臘腸狗、黃金獵犬、馬爾濟斯等,即使 牠們擁有不同的外型,我們仍可以辨識出牠們是狗。同樣地,讓一百個人寫出同一個字,
儘管這一百個人所寫的字跡並不相同,但我們卻能辨識它們是同一個字;又如一首流行 歌即使加上電音編曲,我們也可以藉由主旋律來判定為哪首歌。故我們可以說,人類的 形狀辨識能力能夠忍受高度的物理變異(physical variation),即具有靈巧性。
此外,人類的形狀辨識能力也極俱恆常性。一個圖形都可以用不同的角度、觀點呈 現,雖然所呈現出來的視覺資訊有著明顯的不同,但我們卻可以很容易辨認這是同一個 物體(Kellogg,2003:63)。例如:一隻狗在不同觀看角度下所呈現的形態。因此即使同 一個物體,因觀看角度不同而呈現出不同的形態,我們仍然能認出它們是同一物體,這 就是所謂的恆常性。