(二) 形態辨識 - 漢文化圈非語文圖像符號系統化研究

何謂形態辨識？形態辨識(pattern recognition)是指對外界的事物、圖形、文字的辨識 (鄭昭明，1994：140)。我們每天幾乎都在使用這個能力，例如：看到老朋友的臉，聽到一首樂曲感到熟悉，都依賴這個能力。然而，我們是如何進行形態辨識的？有何歷程？

1. 形態辨識的歷程

形態辨識主要有兩種歷程：一是由下而上的處理(bottom-up processing)，另一是由上而下的處理(top-down processing)。

由下而上的處理是指感官器官接到外來圖形刺激後，會分析其圖形的屬性與結構，

並將這些訊息沿著傳遞管道傳至大腦，進行更進一步的分析，整個訊息處理過程是由下層傳到上層，所以也可稱為「上行」運作(鄭昭明，1994：14)。此外，由下而上的處理又稱為「資料導向」(data-driven)的處理，是指由低層次訊息(如：刺激特徵)開始處理，

逐步向上，最後辨認出該刺激(鄭麗玉，2002：38)。我們也可以說「上」所指的是我們的知識經驗，「下」是指外在環境，「由下而上」即是對外界刺激的認知，受到刺激之物理性質的客觀因素影響(陳烜之，2007：74)。

然而大腦並非被動的詮釋訊息，它會站在一個主動詮釋的立場，隨時隨地準備去詮釋外來的刺激為何物。故訊息的分析，也是「由上往下」的方式在運作，可簡稱為「下行」運作(鄭昭明：1994：14)。由上而下是由下而上的相對歷程，指的是我們會依據本身的期望或教育等，來詮釋外界刺激，所以又稱為「概念導向」(conceptually driven)的處理(鄭麗玉，2002：39)。此外，「由上而下」這歷程會受到過去經驗、文化等影響(陳烜之，

2007：74)。

複述感官儲存形態辨識

提取

短期記憶長期記憶

輸入

反應

整體，然而這樣是不夠的，還必須藉由整體的知覺來分析刺激物的內容，這時就會受到個體知識、期望、動機…等因素影響(錢玉芬，2007：169-170)。由上述歸納可知，學者們對由下而上的處理與由上而下的處理的想法基本一致。當感官接收器接受刺激開始後，就循序往大腦一步步進行處理程序，例如分析輪廓、色彩等，即稱為「由下而上」

的處理；相反地，大腦也開始主動地組織外在環境中的所有訊息，藉由與此訊息相關的記憶、經驗與期望等賦予訊息意義。尤其，當外在刺激品質不佳時，就特別仰賴「由上而下」的處理，意指大腦會自動添加資料來幫助辨識。然而，在實際生活中，不論是「由下而上」或是「由上而下」的處理，兩者是同時且交替進行的，透過這兩個歷程，人們才可以很快速且正確地感知外界的刺激。

2. 完形心理學

透過上述可知形態辨識是由「由上而下」與「由下而上」兩種歷程交互作用的，透過這兩種歷程，我們可以對圖形進行感知。然而，圖形又是如何被組織起來的？這就與完形心理學有關了。

完形心理學也稱為格式塔心理學（Gestalt psychology），格式塔是一個德語詞，是「形狀」或者「形式」的意思。完形心理學的代表人物有惠特海默(Wertheimer)、卡夫卡 (Koffka)、柯勒(Kohler)。

完形心理學的基本理論為：部份之總和不等於整體，整體是由各部份所決定。反之，

部份也由整體決定，例如，當我們在觀看一個圖像符號時，圖像符號中的每個部份形成 了獨立之視覺元素，人們要產生認知就必須將各自獨立之視覺元素加以整合。

在《知覺─理論、發展與組織》一書中指出：完形心理學家曾提出「圖形優化趨勢規則」，人們透過相近律、相似律、良好的連續性、完形、共同命運的規則將圖形組織起來(鄭日昌、周軍譯，2003：57)。相近律意指相近的成分傾向被歸為一個整體，如圖(7) 相近律中的 1、2 為一組，3、4 為一組；相似律則意指相似的成分容易被歸為一組；良好的連續性則是指排列成直線或光滑曲線者易被歸為一個整體；完形意指一個圖形若有缺口，我們傾向將它感知成一個完整的、封閉的圖形；共同命運是指在同一個方向上運動的元素容易被視為一個整體。人們可以透過這些法則對圖像符號進行組織。

圖 7 完形法則

資料來源：本研究整理

模印比對理論是指我們所接觸過的事物，都會在大腦中形成一種模印(templates)，

當一個外界刺激進入後，我們就會將外界刺激與腦中的模印進行比對，若兩相吻合，我們即可辨識出這個刺激是什麼。在《認知心理學》一書中指出，模印比對理論的假設是：

我們所接觸的每個外界事物，在腦中必留下一個模印(鄭昭明，1994：144)。若這個假設成立，那意味著我們腦中儲存著數以萬計的模印，那大腦肯定要花很多時間進行比對，

且當我們接觸到一個全新的刺激時，我們將無法辨識它，這似乎較不合理，因此模印比對理論較難解釋人們是如何辨識生活中複雜的場景。

(2) 原型論(prototype theory)

原型論就是人們依據腦中的所儲存的典型去辨識事物。原型中通常包含事物最多的特徵，而一個形態是否被辨認出來，就視它和原型的相似程度而定，越相似就越能被辨認為該類事物(鄭麗玉，2002)。原型論比起模印比對理論較具有彈性，原型論只需相似，

不需一模一樣。例如，說到「腳踏車」，我們腦中就會出現腳踏車的典型圖像，腦中所出現的典型圖像即為「原型」。

(3) 特徵分析論(feature-analysis theory)

特徵分析主張每個事物都有其特徵，經由各種特徵而組合成一個形體，故人們要辨識一個物體時，必須先分析物體的屬性與特徵，透過分析出的屬性與特徵去辨識物體。

例如：字母「T」可分析為一條垂直線，交會在一條水平線的中點，凡符合這些特徵的都被認為是「T」。

此外，Neisser(1963)實驗發現人類的視皮質是依據特徵(feature)來分析刺激的，即所謂的特徵偵查理論(feature detection theory)，例如：第一組是將 Z 字母放在 T, L, K, M, V 中，另一組是將 Z 字母放在 O, Q, P, B, D 中，Neisser 發現測試者可以較快速地於第二組中選出字母 Z，主要是因為在第二組中 Z 和其他字母有較顯著的特徵差異。

(4) 成分識別理論(recognition-by-component theory)

人們若只依據「特徵」進行形態辨識，這樣足夠嗎？我們發現字母 Z 並不是只有三條線和角度這樣的而已，字母 Z 必須依據「規則」去建構字母(Kellogg，2003：72)。

又如，當我們要辨識一個人的臉時，並不是僅僅注意眼睛在這，鼻子在那，嘴巴又在那這樣而已，我們必須去注意它們間的結構關係。辨識物體不僅僅是依靠特徵，特徵間的關係也是同樣重要的，甚至需要一些規則去組合這些特徵。因此，出現了成分識別理論。

成分識別理論是由畢德曼(Biederman)所提出。Biederman(1985)曾以圖 8 來解說物體結構的重要，圖中的(a)和(b)都擁有相同的特徵，但是之間的結構關係卻是不同的，(a) 是皮箱，(b)是抽屜；相同地，(c)和(d)擁有相同的特徵，但因結構不同，代表著不同的東西。

圖 8 物體結構關係

資料來源：Biederman(1985：29-73)

Biederman(1987)也指出，圖 9 左邊為幾何的特徵，右邊為藉由左邊特徵組合成的物體，例如：右邊的杯子就是由左邊的 3 號和 5 號特徵所構成的。

Biederman(1985)主張比起物體特徵本身，物體特徵的關係(即結構)是人們感知物體的關鍵。舉例來說，圖 10 的中間那排是較容易被人們感知的，因為當中維持了較多的輪廓線，人們較能容易感知物體特徵之間的關係。很多研究也顯示人們會透過物體特徵間的關係(即結構)，去加工辨識物體 (Hummel & Biederman，1992：480-517)。

由以上的敘述可知，人們進行形態分辨時，除了依據物體的特徵外，特徵間所建構出的關係(即結構)也是不容忽視的。

圖 9 特徵與結構

資料來源：Biederman(1987：115-147)

圖 10 廓線顯示物體結構關係資料來源：Biederman(1985：29-73)

與形狀的物理變異極大，但我們仍能忍受高度的物理變異，而產生相當恆常的辨識效果。例如：以狗來說，狗有很多不同的品種，如臘腸狗、黃金獵犬、馬爾濟斯等，即使牠們擁有不同的外型，我們仍可以辨識出牠們是狗。同樣地，讓一百個人寫出同一個字，

儘管這一百個人所寫的字跡並不相同，但我們卻能辨識它們是同一個字；又如一首流行歌即使加上電音編曲，我們也可以藉由主旋律來判定為哪首歌。故我們可以說，人類的形狀辨識能力能夠忍受高度的物理變異(physical variation)，即具有靈巧性。

此外，人類的形狀辨識能力也極俱恆常性。一個圖形都可以用不同的角度、觀點呈現，雖然所呈現出來的視覺資訊有著明顯的不同，但我們卻可以很容易辨認這是同一個物體(Kellogg，2003：63)。例如：一隻狗在不同觀看角度下所呈現的形態。因此即使同一個物體，因觀看角度不同而呈現出不同的形態，我們仍然能認出它們是同一物體，這就是所謂的恆常性。

在文檔中漢文化圈非語文圖像符號系統化研究 (頁 64-68)