第一章 研究背景與文獻回顧
第六節 統計學習機制和語言學習機制的關係
雖然統計學習機制的相關研究在近二十年來累積了相當數量,且已證 實該機制和語言的習得和發展有密切的相關性,統計學習機制能追蹤計算 語言各個層面的統計資訊。由此產生的自然聯想便是統計學習是否為等同 於語言學習機制?目前學界的看法傾向認為統計學習機制僅作為語言學習 機制的一環,並不能完全代表語言學習機制。
部分研究者提出,統計學習機制的主要作用在於將語言單位抽取出 來,但是對於完整習得一個語言來說,並不足夠。文法的規則並不等同於 統 計 分 佈 規 律 性 , 而 有 可 能 是 更 高 層 次 的 抽 象 代 數 規 則 。Marcus 、 Vijayan、Bandi Rao 及 Vishton (1999) 認為語言的習得機制可能至少由兩組 能明顯區分的機制共同負責:一個是統計學習機制,用來追蹤訊息中的統 計分佈資訊,並把語言單位自訊息中切分出來;另一個機制則負責學習訊 號中的「抽象代數規則」,也就是「文法規則」。
抽象的代數規則與文法規則一個重要的相通之處,就是可以將不同的 材料代入變項中。例如代數式y = x + 2當中,x 可以帶入任何數值,語言文 法亦同。例如英語中名詞和動詞間的數量一致性 (number agreement) ,任何 放在名詞與動詞位置的語言單位,都需要符合數量上的一致性,也就是單 數名詞搭配單數動詞,複數名詞搭配複數動詞的規律。
Marcus 等人 (1999)認為,習得文法的關鍵在於發掘語言單位間的抽象 關係,也就是找出語言中各「變項」(variables) 之間的關連性。舉例來說,
在以ABA 規則呈現的材料中,其變項間的關連性,就是第一個語言單位等 同於第三個單位,而第一個單位與第二個單位並不相同。而這些「變項間 關聯性」不但適用於經驗過的材料,亦可以套用於新材料中。
在他們的研究中 (Marcus et al., 1999),研究人員設計了一組人工語言,
以簡單的規則規範音節出現的順序。例如:各音節的出現順序是按照 A-B-B 規則(如音節串 gagigi)或 A-A-B-B-A 規則(如音節串 gagiga)。實驗中以七 個月大的嬰兒作為受試者,在給予他們習慣化 (habituation) 階段後,進行 一個測驗。測驗中的所有音節都是嬰兒在習慣化階段中沒有聽過的新材
料,屬於初次接觸。因此受試者無法利用習慣化經驗中所產生的統計規律 性,或音節間的銜接概率來判斷這個材料是否合於規則。測驗題包含兩個 選項,一個選項的音節順序符合習慣化階段中所使用的規則,另外一個選 項的音節順序則不合規則。結果發現,嬰兒花了更長的時間聆聽不合規則 的音節串,這種現象稱之為學習的轉移 (transfer of learning)。表示受試者 由習慣化階段的材料中學會了某些規律性,再把這些規律性用在完全沒有 接觸過的材料當中。研究者認為,單單倚靠統計學習機制無法說明受試者 何以將學習到的規律性應用於不同的材料中,因此語言學習機制中至少有 一種機制負責歸納「抽象代數規則」。
Peña、Bonatti、Nespor 及 Mehler (2002)亦抱持類似的主張,他們認為 雖然習得一種語言除了倚賴統計學習的運算機制以辨認出語言中的單詞 (word) 外,同時也需要一個能夠處理複雜結構的機制,以協助學習者發現 語言中更高層次的結構,如:句法。而句法往往作用在不相鄰的語言單位 間,例如英文中的數量一致性 (number agreement)。這與統計學習所探討的
「相鄰」語言單位間的關係不盡相同。他們的主張似乎暗示了文法的習得
26
Nespor、Peña 及 Mehler (2003)在後續的研究中 以「子音/母音假設」
(C/V Hypothesis) 深化他們的論述。Nespor 等人指出,透過對於非聲調語言 (non-tonal language) 的跨語言的觀察,在多數的語言當中,子音與母音的平 均數量比約在20:5,整體而言,子音的數量大於母音,因此他們認為子音 與母音極有可能在語言當中各自主管不同的功能,攜帶不同型態的訊息。
子音的組合型態多變,主要負責提供關於區別、辨識字詞的資訊 (word identification, distinguish lexical entries),母音則因其攜帶音高、音長、音強 等訊息,主要負責提供構詞句法結構的訊息 (morphosyntactic structures)。
Bonatti、Peña、Nespor 及 Mehler (2005) 發現,法語成人受試者在切分連續 音節串的作業中,主要依靠的訊息並不是各相鄰音節間的銜接概率,而是
使用相鄰子音間的銜接概率值 (TPs between consonants)。Mehler、Peña, Nespor 及 Bonatti (2006)主張,在子音和母音頻率相等的狀況下,學習者偏 好使用子音串來切割音節。
但是這類的看法仍然受到一些挑戰,最常遭受的質疑有二:其一是難 以定義「文法」與「統計規律」之間的界線。Seidenberg、MacDonald 及 Saffran (2002) 指出:任何型態的語言刺激中都包含了各種類型的線索以及 可能歸納出的規則。即便採用人工語言小心操弄材料特質,仍有可能因為 組成材料之單位成分中的某些特性而導致了受試者的反應偏向。根據他們 的看法,所謂的「規則」 (rules)、「文法」 (grammar) 在某種程度上都可以 被視為「統計值」的表現,因此很難判斷文法、規則和統計規律之間的分 野。其二是,嬰兒究竟是如何從有限的經驗當中找到「正確的規則」?正 確的規則是透過何種機制產生的?目前仍未得到較為一致的結論。
Marcus 與 Berent (2003)認為 Seidenberg 等人 (2002)的說法將「統計學 習機制在語言習得機制中所扮演的角色」,擴大為「統計學習機制即為語言 習得機制」之論述。他們認為「統計學習機制」在語言習得機制中確實扮 演了重要的角色,但不等同於「語言習得機制」。研究者不應忽略人類所具 有的「追蹤規則」能力,亦不應否定人類有「歸納/產出規則」的認知能 力。Gervain 與 Mehler (2010)指出,無論是先天內在的、專為語言設置的機 制,以及接收語言的管道,或是具有泛認知特性的統計學習機制,對於語 言習得來說,都是不可或缺的要素。因此,語言習得的研究應該從整合的 角度出發,探討這些要素如何運作,以及如何互動。Shukla、Gervain、
Mehler 及 Nespor (2012)在此基礎上提出了一個整合的主張,他們認為語言 習得機制可能由三個不同的機制構成,分別為先天的內建語言規律知識、
跨認知範疇的基本認知能力(如統計學習)與知覺的方面的先天偏好。這 三種主要機制在習得語言的過程中不斷互動,相互協助。而不同機制之間 的互動模式或許就是人類發展出複雜語言系統的背後認知基礎。
Thiessen、Kronstein 及 Hufnagle (2013)則是提出一個包含攫取訊息和整 合訊息的框架來詮釋統計學習的現象,試圖將統計學習所可能涉及的各種 資訊加以匯集。他們在論述中指出,過去關於統計學習的研究僅僅侷限在
28
對「銜接概率」的研究上,並無法解釋統計學習機制如何處理真實語言材 料中的多樣統計資訊。他們認為統計學習機制包括了兩個重要的處理歷 程,若缺少其中一個環節,將無法產生成功的統計學習。第一個重要步驟 是分析訊號,也就是從連續的環境訊號中抽取(extraction)出訊息所蘊含 的各種集群特徵,包括訊號的各種組合的集中趨勢、統計分佈,或者是單 位組合的條件機率值,或者是一些伴隨訊號出現的知覺特徵,如重音、停 頓 等 線 索 。 抽 取 出 這 些 訊 息 所 隱 含 的 集 群 特 徵 後 , 學 習 者 以 組 塊 (chunking)的形式形成記憶表徵。第二步則是比對已形成的既有表徵,找出 表徵間的相似之處,並架構出訊息的基本框架,產生對此段訊息的基本理 解,引導學習者將這些處理過的訊息應用於處理新的刺激輸入中。此一框 架的重要精神在於以記憶為基礎 (memory based),分析輸入訊號並形成訊 息組塊,所倚賴的是工作記憶的能力 (working memory)。而學習者在面對 新的輸入時,將目前的訊號特徵和過去所形成的記憶表徵比對,找出相似 點和共通性,所倚賴的則是長期記憶的能力 (long-term memory)。當新的輸 入訊號分佈顯現和過往經驗表徵有高度相似時,有助於掌握新的輸入,而 當新的輸入與過去所形成的表徵相似性低甚至不一致時,將不利於掌握新 的輸入。過去的記憶表徵扮演一個「定錨」 (anchor)角色,影響我們處理 新的刺激輸入時的策略和表現。
Erickson 與 Thiessen (2015)指出,雖然有相當多的統計學習研究成果指 出,學習者在條件機率方面的統計學習表現可以相當程度地解釋學習者在 學習真實語言材料的表現,但仍不能排除在學習現象的背後有其他基礎認 知機制的存在。統計學習機制或可被稱為驅動早期語言習得的一個重要關 鍵,但卻不適合將其擴大解釋為等同於語言習得機制。他們認為找出學習 者的統計學習表現和未來語言學習成效間的因果連結,將有助於釐清統計 學習和語言習得機制之間的關連。