探討華語為第二語的語詞統計學習

全文

(1)國立臺灣師範大學華語文教學系博士論文. 探討華語為第二語的語詞統計學習 An Investigation of Statistical Learning of Words in Chinese as a Second Language. 指導教授：陳振宇博士研究生：王贊育中華民國一零八年八月.

(2) 謝辭在書寫謝辭的同時，還有點不敢相信自己在緩慢的步調之中，終於一步步完成了博士班的修業挑戰。求學過程中得到了師長和朋友們的指導和關照，讓我始終不感覺孤單，並且能有持續向前的動力。回想起過去幾年的求學生活，心中充滿感動，也讓我特別珍惜這段美好的歷程。最要感謝指導教授陳振宇老師一直以來的耐心指導，循循善誘。在學習的路上鼓勵我接受不同的挑戰，並且嘗試由各種角度引領我理解研究的樣貌。從老師身上能看到一位學者嚴謹的治學態度以及身為教育者的熱忱。能在陳老師的門下學習，是十分幸運的一件事。這幾年最大的收穫除了知識上的提升，更重要的是真切地體會到學習的快樂和成就感，這都要感謝老師的教導。口試委員陳學志教授、許馨仁教授、劉惠美教授、曹峰銘教授、許淳潔教授的鼓勵和指導，使得研究能夠在更為穩固的基礎上開展。老師們從不同的視角出發，提出值得挑戰的觀點，引導我從不同的方向來思考問題，讓我獲益良多。更謝謝老師們在期末最忙碌的時候，排除時空上的各種限制前來擔任口試委員，學生銘感於心。謝謝雅琳學姊鼓勵我勇敢往前，並且不時給我加油打氣。同學、同事以及朋友們在這段歷程中給予了心理上的支持和行動上的協助。李承逸先生在研究前期協助建置實驗程式，黎孝達先生則對最後的實驗程式提供了技術上的支援和諮詢。實驗的參與者們貢獻了他們寶貴的時間。如果沒有這些緣分的匯集，這個研究無法完成。最後要謝謝我親愛的家人們，支持我進入師大華語文教學研究所繼續學習的決定，在我困惑遲疑或受到挫折時，以溫暖的愛陪伴著我前進。能夠擁有這份珍貴的愛，是我最大的幸福。. 本研究獲教育部高等教育深耕計畫之特色領域研究中心經費補助，由「國立臺灣師範大學華語文與科技研究中心」支應，謹此致謝。.

(3) 探討華語為第二語的語詞統計學習中文摘要「統計學習」(statistical learning)為人類尋覓、計算訊號單位間的統計資訊，歸納組合規律的能力。中文的文字排版雖有字間空格，但卻缺少明顯的詞邊界訊息，因此讀者在閱讀時會遭遇斷詞挑戰。過去中文斷詞的研究多探討讀者斷詞的結果，而未討論讀者是如何斷詞的。本研究假設以華語為第二語的學習者能透過統計學習機制計算相鄰語言單位間的銜接概率（Transitional Probability, TP），並以此形成斷詞依據。實驗一至實驗五採用修改自 Saffran (1997)之派典。實驗一以6個中文音節組成6個中文雙音節詞，形成一個包含3600個音節的連續音節串。音節詞內相鄰兩音節間的 TP = .46 - 1，詞間相鄰兩音節的 TP = 0 - .29。該銜接概率為斷詞的唯一線索。受試者聆聽材料後，由測驗中選出聽過的組合。實驗一受試者之平均答對率為 .57，顯示受試者能依據銜接概率，找出音節詞界線。實驗二至實驗四以視覺管道呈現相同統計分布的中文字串，三個實驗之統計學習表現雖僅在顯著邊緣（實驗二 .53，實驗三 .53，實驗四 .52)，但合併計算後之平均答對率跨越顯著門檻，顯示受試者能通過視覺統計學習來斷詞。實驗五探討中文母語者的先前經驗是否影響其統計學習表現？結果顯示當新材料與學習經驗之統計資訊不一致時，先前經驗無益於累積新的統計資訊。實驗六至實驗八採用修改自 Fiser 與 Aslin (2002)之派典。實驗六以12個抽象圖形，組成包含288個圖形的圖形串。圖形詞內相鄰兩圖間的 TP = 1，詞間相鄰兩圖的 TP = .33。實驗六顯示受試者能攫取抽象圖形串的組合規律 ( .77)。實驗七將材料置換為韓文字母，發現受試者能找出韓文字母詞的統計規律( .65)。實驗八的材料為具有較複雜統計資訊的中文字串，結果顯示在有充足處理時間的狀況下，受試者能掌握文字單位間的複雜統計資訊並以此斷詞( .67)。本研究的實驗結果指出，學習者能透過統計學習機制掌握連續中文字間的統計資訊，找到語詞界線，並據以斷詞。本研究亦討論了可能影響統計學習成效的因素，並提出由語詞統計學習觀點出發的華語教學方案。. 關鍵詞：統計學習、斷詞、華語、語詞學習、銜接概率. i.

(4) An Investigation of Statistical Learning of Words in Chinese as a Second Language Abstract Statistical learning is a pattern induction ability which can trace and compute statistical information from the inputs. Previous researches have demonstrated statistical learning with auditory linguistic inputs and visual nonlinguistic inputs, but none used real language visual symbols (letters or characters) as the material. In Chinese text, there is no physical clue between Chinese words indicating word boundaries. Thus, readers of Chinese text encounter word segmentation problems as in listening to a continuous language stream. In this study, we hypothesize that readers utilize statistical information of the adjacent Chinese characters identifying word boundaries. We employed 2 types of statistical learning paradigms to investigate the statistical learning of words of CLS learners. The paradigm of Exp. 1-5 was adopted from Saffran, Newport, Aslin, Tunick, and Barrueco (1997) study. The material was made up of a continuous Chinese syllable string or a non-spaced Chinese character string. The transitional probabilities among adjacent syllables/characters were the only clue for defining word boundaries. Results showed that CSL learners could segment a continuous natural language-like syllable/character string into small units by calculating the statistical information of it. Yet, participants’ well-established statistical knowledge of material units would dilute the learning outcomes of new material which is made up of learners’ acquainted language units. In Exp. 6-8, abstract symbols, Korean letters, Chinese characters were employed into Fiser and Aslin (2002) VSL paradigm. The results suggested that participants could segment units from continuous visual inputs under different paradigm settings, but the efficiency seems to depend on how the material was presented to participants. The results of these experiments demonstrated that readers could extract statistical information of adjacent characters from a non-spaced Chinese text by reading. The possible constraints of visual statistical learning of Chinese words, as well as some teaching insights based on the research results, were also discussed in the article. Keywords: statistical learning, Chinese, word segmentation, word learning, CSL. ii.

(5) 目錄第一章研究背景與文獻回顧 ......................................................................................... 1 第一節前言 ............................................................................................................ 1 第二節基於統計規律性所架構的語言習得理論 ................................................ 4 第三節 Saffran 等人以銜接概率作為統計規律的語言學習研究........................ 6 第四節統計學習機制之特性 .............................................................................. 10 第五節影響統計學習效果的可能因素 ............................................................... 21 第六節統計學習機制和語言學習機制的關係 ................................................... 24 第七節中文閱讀和統計學習 .............................................................................. 29 第二章研究問題 ........................................................................................................... 33 第三章實驗 ................................................................................................................... 36 第一節實驗一：外籍中文初學者的中文音節統計學習表現 ........................... 36 第二節實驗二：外籍中文初學者的視覺管道中文語詞統計學習表現 ........... 41 第三節實驗三：增加中文初學者接觸學習材料之時間 ................................... 47 第四節實驗四：以三筆畫中文字為材料以降低受試者的視覺負荷 ............... 50 第五節實驗一至實驗四小結 ............................................................................... 54 第六節實驗五：中文精熟者的中文語詞統計學習表現 ................................... 59 第七節實驗六：重製 Fiser 與 Aslin 的視覺管道統計學習實驗 ....................... 63 第八節實驗七：中文受試者的韓文字母統計學習表現 ................................... 69 第九節實驗八：外籍受試者閱讀中文字串時的語詞統計學習表現 ............... 74 第四章綜合討論 ........................................................................................................... 80 第一節實驗一至實驗八結果彙整 ....................................................................... 80 第二節主要發現與討論 ....................................................................................... 85 第五章結論與教學建議 ............................................................................................... 90 第一節以華語為第二語的語詞統計學習在教學上的啟發 ............................... 90 第二節以統計學習觀點所設計的華語語詞學習方案 ....................................... 97 參考文獻 ...................................................................................................................... 102 中文參考文獻 ...................................................................................................... 102 英文參考文獻 ...................................................................................................... 103 附錄一 .......................................................................................................................... 109 實驗六重製 Fiser 與 Aslin (2002)實驗程序所用之抽象圖形材料 ................... 109. iii.

(6) 表目錄表 1：實驗一之訊號反應列聯表 .................................................................................... 39 表 2：實驗二之訊號反應列聯表 .................................................................................... 45 表 3：實驗三之訊號反應列聯表 .................................................................................... 48 表 4：實驗四之訊號反應列聯表 .................................................................................... 53 表 5：實驗五之訊號反應列聯表 .................................................................................... 61 表 6：實驗六之訊號反應列聯表 .................................................................................... 67 表 7：實驗七之訊號反應列聯表 .................................................................................... 72 表 8：實驗八之訊號反應列聯表 .................................................................................... 78 表 9：實驗一至實驗八結果彙整 .................................................................................... 84. iv.

(7) 圖目錄圖 1：實驗二學習階段視覺材料呈現示意圖................................................................ 44 圖 2：實驗二測驗階段畫面示意圖 ................................................................................ 44 圖 3：實驗六學習階段主作業材料呈現示意圖 ........................................................... 65 圖 4：實驗七學習階段主作業材料呈現示意圖 ........................................................... 71 圖 5：實驗八學習階段主作業材料呈現示意圖 ........................................................... 76. v.

(8) 第一章研究背景與文獻回顧. 第一章研究背景與文獻回顧第一節前言嬰幼兒在發展的過程中，一開始所面對的是充滿各種未知訊息的環境。環境中的各種聲音、符號、動作等等對於他們來說，屬於一團未切割的混沌。從混沌當中分離出可識別的單位，從而架構起物理世界的框架，並進一步與意義連結，甚至產出更為多樣的組合單位來交換意義。這段從未知邁向已知的路程，正是學習或習得的發生。不論是第一語言的習得或者是第二語言的學習，大抵都會經歷這段由未知混沌邁向已知的歷程。一直以來，人類的語言溝通行為因具有豐富且獨特的樣式，迥異於其他物種的溝通模式，使得「語言」以及「語言學習/習得」成為眾多研究者關注的研究主體。然而，因研究者對語言的本質有不同的詮釋，而對語言習得或語言學習的路徑發展出不同的看法。 Chomsky (1965, 1972)由先天論的角度出發，認為人類的語言習得是透過一組特定的語言機制所獲得的。每個人天生即具備一套關於語言的基本知識或規則，這些規則是抽象的、具有代數的、算則的特性，這些規則本身不帶有意義。而在語言發展的過程當中，隨著嬰幼兒可能面對不同的語言環境，這套核心的規則會和環境中的詞彙、訊息接收、片語、特定的表達用法等等連結，隨之設定與調整，使得這些規則和外在的環境相符，漸趨一致。因此個體可以運用這些核心規則和對應的參數，產出、合成各式短語。語言的習得是個體透過不斷調整核心規則的參數，而使得核心規則逐漸長成符合現實語言環境的一個過程。 Chomsky 所提出的語言觀點，在語言習得領域主導了相當長的一段時間，並用以解釋語言中的「文法規則」從何而來。但同時也面臨一些概念上的挑戰，諸如：無法解釋人類如何將此一抽象的核心規則對應到不同的語言中的不同文法，即所謂的 linking problem。此外，若所有人都有一套內建的核心語法規則，且這一套規則是固定的，又該如何解釋兒童在語言發展的不同時期所展現出來的各種變化？Chomsky 對語言習得的觀點，是由「語言本體」出發的，主張所有人類語言有其共同性，且人類先天就配有. 1.

(9) 探討華語為第二語的語詞統計學習. 一組可以用來處理各種語言規則的核心法則，這組法則使得人們可以快速掌握環境中的語言。但隨著認知科學研究逐漸蓬勃，研究者們發現嬰幼兒具備有強大的學習機制，語言習得並非僅由單純的聯結語言單位和物品或經由歸納而產生。研究者認為「學習」是一種涉及多種認知機制的活動，學習本身是整合多種認知活動和社會文化互動的融合體，語言習得（或語言學習）也不例外。Tomasello (2000, 2005, 2009)提出了「學用合一理論」 (Usage-based Theory)，以一個相異於語言先天論的觀點來說明人們是如何學會語言的，亦有眾多研究者抱持類似的觀點 (Bybee, 2006; Barlow & Kemmer, 2000; Kemmer & Barlow, 2000)。他們的主張指出，人類在習得語言的過程中，會用到兩組我們先天具備的認知技能，一為「意圖判讀」 (intention reading)，負責語言的功能面向，協助人們解讀說話者的意向與或社會文化的指涉意涵。「意圖判讀」包括與他人共享注意之標的，跟隨、注意他人所指之物品或事件，以語言或非語言的模式主動導引其他人的注意力至特定的物件上，掌握意向動作背後的社會意涵等等。Tomasello 認為「意圖判讀」對於人類來說，不光只是讓我們學會語言上的溝通，更讓人們掌握社會文化面向上的互動模式。學用合一理論中另一重要的技能為「規則尋覓」 (pattern finding)，指的是人們從接觸環境中的語言材料的過程中，建構出更為抽象的結構規律性，或者是語言基模，並由這些經驗當中找出語言的文法規律性。簡單地說，就是將環境中的訊息「分類」，包括了在感知上和概念上找出具有相似點的物品或事件，從知覺和動作系統的運作中形成基模，掌握連續訊號中各單位的統計分佈關係等等。規則尋覓的能力並非專為語言習得而設置，而可以用於處理不同類型的訊息，是一種跨認知範疇的能力。不會在語言習得之後失去作用或消失，而是一直存在，以便因應環境中可能出現的各種刺激。「學用合一理論」有別於先天論的觀點，認為語言的知識並非內建，而是因應溝通需求，透過學習者重複經驗環境中的刺激而逐漸浮現、建構而成的。語言的習得（學習）亦是透過多種基本的認知機制交互合作而產. 2.

(10) 第一章研究背景與文獻回顧. 生的，而非由一組特定的語言機制所負責 (Behrens, 2009)。Chomsky 所主張的語言先天論暗示語言習得是一種「由上而下」的結構，內建的抽象語言規則鋪建了語言的發展藍圖。而學用合一論，則從相反的方向來剖析語言習得，反映的是一種「由下而上」的歷程，語言的習得是人類在社會文化互動下的自然結果，根據人們和環境的互動經驗架構而成。學用合一論在討論語言習得的發生時，從語言本體中所蘊含的分佈關係出發，更把人們所具有的處理訊號的認知機制納入考量。. 3.

(11) 探討華語為第二語的語詞統計學習. 第二節基於統計規律性所架構的語言習得理論我們所處的物理世界包含有豐富的各類型訊息，學習的第一步就是從這些訊息當中理出一些頭緒，也就是發揮「規則尋覓」的功能。而有一種規則尋覓的機制正是對環境中的訊號單位間的依存關係敏感，可以在重複接觸這些訊號單位後，掌握訊號中的統計資訊，稱之為「統計學習機制」 (statistical learning mechanism)。統計學習機制在過去的二十多年當中，累積了不少研究成果。統計學習機制所對應的語言觀及習得觀點，即是前面所提到的由下而上、以經驗為本的觀點。若將語言視為一種多層規律性的集合體，語言的各層級中包含了不同的組合規律訊息，攜帶著不同類型的組合分佈資訊（陳振宇，2013）。以這樣的觀點來解析語言中的「文法」或「規律性」，指稱的就是各語言單位間的搭配法則，小至子音或母音間的音韻組合規則、大至橫跨幾個語言單位的語法規則，都可以用統計規律性的觀點來描繪。從這樣的觀點出發，「語言習得」就可解釋為「發現訊息規律性」的過程。當我們學會一種語言，意味著我們發現並相當程度掌握了該語言的各層面規律性或統計分佈。這些規律性主要來自於學習者所參與的語言環境，是透過學習者重複接收環境中的刺激輸入後，由經驗當中自然浮現出來的，而非先天內建於學習者的大腦中。此處所指的「統計訊息」或「統計規律性」根據其計算方式與特徵，可分為三類：一類為「統計分佈」 (distributional statistics)，是用來描述環境中訊息的集中趨勢 (central tendency)以及變異程度 (variability)；第二類則是條件機率 (conditional statistics)，用來描述兩個單位的連結緊密度，或用某一個單位預測接下來將出現的單位的可能性；第三類則是「線索訊息」 (cue-based statistics)，指的是在時常伴隨著主訊號本身而出現的其他特徵或線索，例如自然語音訊息中的停頓、重音等等線索，這些線索有時會提示. 4.

(12) 第一章研究背景與文獻回顧. 某些訊息的出現，有助於學習者掌握主訊息中的統計資訊 (Erickson & Thiessen, 2015; Thiessen, 2009, 2013)。因此統計規律性並不限於單一種類，而有各種形式。一般人所熟悉的「詞頻」或「字頻」，是最簡單的統計分佈實例。詞頻／字頻值代表某個字詞在所有語言訊號中的出現次數，屬統計分佈的一種。而「條件機率值」 (conditional probability)相對而言就屬於較為複雜的統計值，研究中常以「銜接概率」 (Transitional Probability, TP) 稱之。銜接概率所代表的是在所有 A 單位出現的狀況下，A、B 兩個單位接連出現的可能性。換言之，學習者在接觸到相鄰單位組合的第一個單位時，便可以依照過往的經驗判斷下一個可能出現的語言單位。我們可將銜接概率的計算方式以式 (1) 表示： Transitional Probability (TP) = P(B|A) =. frequency(AB) 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓(𝐴𝐴). (1). 相鄰的兩個語言單位間的銜接概率值高低，代表兩個單位間的連接緊密度 (Lany & Saffran, 2013)，當相鄰的兩個語言單位間的銜接概率值越高，表示這兩單位間的緊密度越高，接續出現的可能性也就越高，也就越有可能被學習者視為一組時常伴隨出現的組合，並將其視為一個更大的語言集群。值得注意的是，銜接概率與頻率所代表的意義並不相同，一個組合的「出現頻率」，指的是該組合在所有可能的組合情況中的出現次數，屬於統計分佈的一種。而「銜接概率」指的是在組合中的某一個成分出現的狀況下，另外一個成分接連出現的可能性，是有「條件」限制的。因此，一個由兩單位伴隨出現的組合，其「出現頻率」可能很低，但這兩個單位間的「銜接概率」卻有可能很高。要達到高銜接概率的情況，只需要這個組合中的 A 成分出現時，B 成分也固定出現即可 (Hay & Lany, 2012)。. 5.

(13) 探討華語為第二語的語詞統計學習. 第三節 Saffran 等人以銜接概率作為統計規律的語言學習研究 Saffran、Aslin 及 Newport (1996)以八個月大的嬰兒進行了一項研究，主要的目的在探討嬰兒如何分析他們所接觸到的語音輸入，並習得語言。他們利用四個三音節詞，各隨機重複四十五次，排列組合成一段連續音節串，如：tupirogolabubidakupadoti…，並將此材料透過人工語音合成器製成一段長約兩分鐘的音節串。由於這段連續音節串當中並不包含任何停頓、重音差異、或其他語音線索提示，且音節串當中的音節詞，都是實驗由實驗者定義的，並不具有真實的意義 (tupiro, golabu, bidaku, padoti)。因此，音節和音節之間的統計組合規律性就成了受試者判斷的音節詞位置的唯一線索。如果受試者掌握了音節間的統計值訊息，就可以找出有較高機率被被視為同一個語言單位的音節組合。此處所提到的組合規律性就是語言中的「統計資訊」。研究者在設計材料時，操弄了各音節間的銜接概率值 (TP)，使得音節詞內相鄰兩音節間之銜接概率，皆高於音節詞間相鄰兩音節之銜接概率。以前述的音節串 tupirogolabubidakupadoti…為例，tupiro 一詞中，相鄰的兩音節如 tupi 或 piro，其銜接概率皆為1。也就是在所有 tu 出現的狀況下，其後必然出現 pi，pi 之後必然出現音節 ro。而音節詞 tupiro 的後面，可能出現音節詞 golabu, bidaku, padoti。因此，ro 可能與分屬不同音節詞的首音節 go, bi, pa 相鄰，其間的銜接概率值為 .33。音節詞中的相鄰音節間的銜接概率皆為1，此統計值比音節詞間相鄰兩音節的銜接概率 .33為高。換句話說，音節詞當中的各音節間之銜接比較緊密，而跨音節詞的兩個音節間的連結比較鬆散，銜接概率值較低。銜接概率相對較低處，正是兩個音節詞的分界處，也就是語詞的界線。實驗者讓八個月大的嬰兒聆聽上述之連續音節串，該階段在研究中稱之為熟悉化 (familiarization)，隨後進行一個測驗。測驗題是以材料當中出現過的「音節詞」，如：tupiro，和「非音節詞」，如：lakutu，共同組合而成。所謂「非音節詞」是從各音節詞中挑選一個出現在不同位置的音節，. 6.

(14) 第一章研究背景與文獻回顧. 並且不按照其原本在音節詞中的位置排列，形成一個新的音節詞選項。實驗者播放測驗題，並觀察嬰兒對兩種不同音節順序的聆聽反應。這個實驗的預測是：由於嬰兒在熟悉化階段中所接觸到的某些音節詞會成為測驗題中的正確答案，這些選項中的音節順序，對嬰兒來說是較為熟悉的，不具新鮮感，因此嬰兒較不會轉頭注意該刺激。而非音節詞由於其組合和順序有別於熟悉化階段中的經驗，對嬰兒來屬於嶄新的刺激，因此嬰兒會轉頭並花較長的時間注意該刺激。若實驗得到預期的結果，代表嬰兒可以區分這兩種類型的刺激，也就表示他們從熟悉化階段的聆聽經驗中，把實驗者所定義的語言單位切割出來。而切割單位的依據就是連續音節串中，各音節間的銜接概率值。實驗結果發現：相較於材料中曾經出現的音節詞，嬰兒花了更長的時間聆聽不符合「組合規律」的非音節詞，且達到統計上的顯著差異。表示嬰兒在僅有兩分多鐘的聆聽經驗中，「辨認出」曾經出現的音節順序，區分出測驗中哪些音節組合是符合經驗中的順序。前述的研究結果表示嬰兒能夠區分、辨認音節串中的音節順序是否與經驗相同。Saffran 等人 (1996)進一步將測驗題當中的「非音節詞」以較為困難的「部分詞」 (part-word) 替代，檢驗受試者判斷音節單位的標準是否為音節出現的順序？還是真的掌握了音節間的銜接概率？所謂的「部分詞」 (part-word) 是利用某音節詞的最後一個音節搭配另一詞的頭兩個音節所組成的。以音節串 tupirogolabu 為例，部分詞即取用 tupiro 的最後一音節 ro 與 golabu 的首二音節 gola 形成部分詞 rogola。因此在這個實驗中，不論是「音節詞」或「部分詞」，都曾經以相同的順序出現在受試者的聆聽經驗中，兩者之差異在於「音節詞」包含正確的詞界線（也就是詞內兩音節間的銜接概率高於詞間兩音節間的銜接概率），而「部分詞」橫跨了兩個定義的語言單位（詞內包含一個較低的銜接概率）。如果受試者是依靠音節的順序來斷詞的，那麼在測驗時，對此二種選項的聆聽時間應無差異。相反的，如果受試者判斷音節組合的根據是來自於相鄰音節間的「銜接概率」，那麼就會發現「部分詞」所包含的音節組合間的銜接概率值與經驗不符，而可區分「音節詞」與「部分詞」。研究的結果發現，. 7.

(15) 探討華語為第二語的語詞統計學習. 嬰兒顯著地花了較長的時間聆聽測驗中的「部分詞」，顯示嬰兒確實掌握了相鄰音節間的銜接概率值資訊，並用以判斷測驗的音節組合是否屬於實驗者所定義的音節組合。這個研究派典 (paradigm) 成了往後研究統計學習的重要方法，許多統計學習的研究皆以此為基礎，操弄材料單位之間的銜接概率值，並在最後設計測驗，紀錄受試者的反應。以受試者注意刺激的時間長短或其答對率作為判斷是否掌握材料中所隱含之統計規律性的依據。有了以嬰兒作為受試者的實驗結果，Saffran、Newport、Aslin、Tunick 及 Barrueco (1997)進一步以相似的實驗方法探查成人受試者的統計學習效果。他們以6組無意義的三音節詞各重複300次之後，隨機排列組合成一個包含1800個音節詞的連續音節串。實驗者操弄各音節間的銜接概率，使得音節詞內相鄰音節間的銜接概率介於 .31~ 1.0，而音節詞界線的相鄰音節間之銜接概率控制在 .1~ .2。此外，受試者在聆聽實驗材料的同時，需完成一個與聽覺訊息無關的繪圖作業，而將注意力導向該繪圖作業中，這是為了瞭解受試者是否需要在高度投入注意力的狀態下，才能偵測到並學習連續音節串的統計規律性。聽完這段連續音節串後，受試者參加測驗。測驗題的構成方法是由「音節詞」與「非音節詞」(nonword) 組合成二選一的選擇題，受試者的作業是判斷這兩種音節組合，何者對他們來說是比較熟悉的。這個實驗的預測是：如果受試者能夠偵測並學會音節組合的統計規律性，那麼測驗的平均答對率應該要高於隨機猜測值 (50%)。如果受試者在有附屬作業（繪圖）的狀態下，仍能掌握連續音節串中的統計分佈資訊，也就表示統計學習可以在低注意力涉入的程度下發生。實驗的結果顯示：成人受試者的平均答對率為58.6%，顯著高於隨機猜測值50% (p < .05)，表示即使受試者的注意力被導向無關的附屬作業中，統計學習機制仍能有效作用，處理連續音節串中各音節間的統計分佈資訊。以上這兩個研究推動了「統計學習」機制與語言習得的系列探討，其最大的貢獻在於證實了不論嬰兒或成人都能夠利用此機制捕捉語言輸入當. 8.

(16) 第一章研究背景與文獻回顧. 中所具有的統計規律性，並以此統計資訊作為切分語言單位的基準。這暗示了語言規則的習得與發展有可能是透過此認知機制，歸納經驗中所蘊含的規律性而產生的。這樣的機制似乎是自然啟動的，且能在注意力被導向其他作業的同時仍繼續作用。. 9.

(17) 探討華語為第二語的語詞統計學習. 第四節統計學習機制之特性統計學習機制和人類的其他認知能力一樣，並不會僅發生在嬰幼兒時期，而是一種固定的、常駐的能力，以協助我們處理環境中富含的統計資訊。整理過去的研究可以發現統計學習機制有一些特點，包括：和人類的語言發展與能力有密切的關連性，是一種跨認知的，不受年齡限制的認知機轉，同時，統計學習的效果有持續性，並對不同類型的統計資訊敏感等等。以下對統計學習機制的特點進行簡單的回顧介紹。. 一、統計學習和語言能力有密切的關連性研究者通過收集具有語言能力障礙的受試者在統計學習測試中的表現，對比語言能力正常之受試者之統計學習表現，以論證統計學習能力在學習者發展出語言能力的過程中，扮有重要的角色。 Evans、Saffran 及 Robe-Torres (2009)研究統計學習機制在特定型語言能力障礙者身上的運作效果，以找出統計學習機制和語言能力間的關連性。在他們的研究中，以語言發展正常的孩童以及有特定型語言能力障礙者 (SLI, Specific Language Impairment) 的孩童作為受試者，複製 Saffran 等人 1997年和1999年的實驗 (Saffran et al., 1997; Saffran et al., 1999)，觀察受試者分別在語言和非語言材料中的統計學習表現。結果發現，語言能力發展正常的受試者，不論在處理語言或非語言的刺激輸入上，都能表現出明顯的統計學習效果。但有特定型語言能力障礙者在處理語言材料與非語言材料中的統計資訊時，皆遭遇困難。雖然在增加受試者一倍學習時間之後，這些具有語言能力障礙的受試者，就能夠掌握實驗中語言材料的統計規律性，但是他們仍處理非語言材料的統計資訊，因此觀察不到顯著的統計學習效果。此研究結果顯示了語言障礙者的統計學習機制運作範疇並不如一般受試者全面或有效率。 Hsu 與 Bishop (2010) 的文章中指出：特定型語言障礙學習者傾向把訊息中的每個語言訊號當成一個例子來記憶，且常伴隨有抽取輸入訊號之統計分佈資訊的困難。Hsu、Tomblin 及 Christiansen (2014)的研究中發現，特. 10.

(18) 第一章研究背景與文獻回顧. 定型語言障礙的受試者若在學習不相鄰之單位間的依存關係上發生困難，也能在他們的身上觀察到處理跨語言單位的統計資訊的困難。 Gómez (2002)的研究中也探討學習學習者在處理不相臨語言單位的結構關係，該研究指出：成功處理跨語言單位的結構關係之關鍵，在於發現中間單位的變異性。中間單位的變異性較高時，指引學習者注意跨單位間的不變性。Grunow、Spaulding、Gómez 及 Plante (2006)的研究中，以人工語言材料，測試語言能力正常之成人受試者，以及有語言學習障礙歷史之受試者在不相鄰之語言單位間的組合關係的表現差異。研究者主要操弄中間單位的變異性。結果發現，有語言學習障礙之受試者，無論中間單位變異性高低，皆無法掌握不相鄰單位間的組合關係。顯示他們與正常學習者相比之下，對語言材料中的統計分佈資訊較不敏感。 Torkildsen、Dailey、Aguilar、Gómez 及 Plante (2013)的研究亦發現相似的結果，有語言學習障礙的受試者比一般受試者需要接觸更多種類的範例才能學會其中的語法結構，因此學習的效率較低。一些研究者嘗試以「個體差異」的角度切入，以受試者內設計探查統計學習和各種語言能力和認知能力間的關連性 (Misyak & Christiansen, 2012; Misyak, Christiansen, & Tomblin, 2010)。結果從跨受試者的比較中發現，統計學習的能力表現是區間分佈，而非定值。這個結果與先天論者所強調的母語學習者所具有的能力同質性有矛盾。此外，他們的研究也發現統計學習與語言理解力 (language comprehension)和語言工作記憶 (verbal working memory) 有高度相關。在控制其他變項之影響因素後發現，受試者對於材料規律性的預測能力（統計學習表現），是唯一可用來預測其語言理解能力的指標。即使研究無法確立統計學習能力和其他認知能力之間的因果關係，但是此一研究觀點確實提示了「統計學習能力」和「語言能力」之間的密切關連性。. 二、統計學習能力能在不同認知範疇內運作除了處理語言材料外，研究者們也好奇統計學習機制能不能處理、分析非語言的訊息呢？較為早期的證據來自於 Aslin、Saffran 及 Newport. 11.

(19) 探討華語為第二語的語詞統計學習. (1999)之研究，他們將 Saffran 等人 (1996)的實驗材料以音調 (tone) 替換，使「音調詞」內的相鄰音調間之銜接概率高於音調詞間相鄰兩音調的銜接概率。結果發現受試者在聆聽完21分鐘的連續音調輸入後，可以從「音調詞」與「非音調詞」中選出之前聽過的組合。Saffran、Johnson、Aslin 及 Newport (1999)以成人和八個月大的嬰兒聆聽以音調詞組合而成的連續音調串，發現不論成人或八個月大的嬰兒皆能掌握此種非語言訊息串中的統計資訊。此兩個研究的結果說明了統計學習機制不限於處理語言類的訊號，也同樣能處理非語言（音調）的訊息，且在成人或嬰兒的身上都能有效運作。但上述實驗中的音調組合畢竟和語言有較為類似的特性，且同屬於聽覺的範疇。之後的研究者借用了「由連續輸入中切割訊號」的精神，探討受試者是否能處理不具語言特質的訊號，如視覺管道中的連續圖形訊號，並檢測受試者在該認知範疇中的統計學習表現。 Kirkham、Slemmer 及 Johnson (2002)的研究分別以兩個月、五個月、八個月大的嬰兒作為受試者，並以六個簡單的幾何圖形組合成接續出現的連續圖形串，檢測嬰兒是否能夠同樣運用統計學習機制掌握圖形串中所隱含的銜接概率規律。研究結果發現，不同年齡層的嬰兒皆能順利學到視覺刺激中的銜接概率訊息，在測驗時能區分出測驗材料的組合是否符合熟悉化階段中的銜接概率規律。此一研究支持統計學習機制是一種跨認知範疇的普遍性認知機制，可作用於不同知覺管道，偵測環境訊息中所隱含的規律性訊息，並持續在認知發展的過程中發揮作用。. 12.

(20) 第一章研究背景與文獻回顧. Fiser 與 Aslin (2002)的研究中則是以成人作為受試者，實驗者設計出多個無意義的視覺幾何圖形，將三個一組定義為一個「圖形詞」，形成一個連續的、沒有停頓的圖形串，同時操弄圖形組合的各種統計資訊，如基本的聯合機率值或較為複雜的銜接概率。結果發現不論材料中的資訊是否屬於較高層次的複雜運算，受試者在短暫地經驗材料後，皆能掌握其中的統計資訊，並用以判斷、預測即將出現的圖形材料。此研究顯示統計學習機制除了能處理語言類型的材料外，也能處理其他類型材料中的各層級統計資訊。視覺管道的統計學習現象亦得到電生理研究的證實。Abla 與 Okanoya (2009)的研究中，要求受試者觀看連續圖形串，並紀錄受試者之事件誘發電位變化，隨後進行圖形串的選擇測驗。結果發現，當受試者接觸到每個圖形詞的起始圖形（第一個圖形）時，相較於接觸圖形詞中的第二、第三個圖形，起始圖形所引發的 N400震幅較大。顯示受試者已然瞭解連續圖形串的規律性，並利用這些規律性找到圖形詞的界線。除了靜態的視覺輸入外，研究者還檢測了統計學習機制是否能從動態的視覺訊息中攫取出統計資訊。Baldwin、Andersson、Saffran 及 Meyer (2008)以成人為受試者，並仿照前述實驗中的連續音節串組合，以12個動作組成4組「動作詞」（動作組合），並把這些「動作詞」串連成一個連續動作影片。動作與動作之間是連續的，沒有其他線索可供判斷哪幾個動作是一個組合，僅能依靠計算動作之間的銜接概率來判斷「動作詞」的銜接界線。令人驚訝的是，受試者如同處理靜態視覺輸入一般，能夠由連續的動作中，找出「動作詞」單位。統計學習機制可以由物理世界中所有具有連續性特質的訊號中，劃割出基本的組合單位，且不受限於這些訊號的類型差異。. 三、統計學習能力的效果穩定且持續一般測驗統計學習成效的方式是在學習者接受了刺激訊號後立即檢測。Kim、Seitz、Feenstra 及 Shams (2009) 好奇統計學習效果是否為短期的表現？他們以圖形串作為材料，檢測成人受試者觀看材料後的統計學習效果，以及二十四小時後的統計學習表現。結果發現受試者不論在立即測試. 13.

(21) 探討華語為第二語的語詞統計學習. 或延遲二十四小時測試的狀況下，都展現了顯著的統計學習效果，說明了統計學習效果並非短期的，而具有「持續性」。 Arciuli 與 Simpson 懷疑在 Kim 等人 (2009)的研究結果中，無法完全排除睡眠對於固化學習效果的因素。因此 Arciuli 與 Simpson 透過紀錄受試者在不同時間點的統計學習效果，來探討統計學習效果的持續性與時間的關係，更由此了解睡眠因素是否影響統計學習效果的持續性 (Arciuli & Simpson, 2012)。參與研究的受試者需要參加兩次實驗，第一次實驗的任務是觀看螢幕中呈現的視覺圖形串，而在不同的受試者分別在距離第一次實驗後的半小時、一小時、兩小時、四小時或二十四小時的時候參加第二次實驗，而在第二次實驗中的主要任務就是由可能的圖形詞組合和非圖形詞組合當中，挑選出看過的圖形詞。結果發現，雖然接受測驗的時間並不相同，但所有的受試者都表現出顯著的統計學習效果，平均答對率為57.6%。在不同時段中所得到的統計學習效果量十分穩定，不因為測驗距離第一次實驗長短而有所變動，也不受到睡眠因素的削弱或強化，是一種穩定且持續的學習效果。. 四、不同年齡的學習者皆能運作統計學習機制但對該機制的倚重程度不同相關的研究指出，統計學習能力運作得很早，大約在嬰兒七至八個月大時就能觀察到 (Saffran, Senghas, & Trueswell, 2001)。Saffran 等人 (1997)的研究中，以連續的人工音節串作為實驗材料，並操弄各音節間的銜接概率值，使其成為唯一的斷詞線索。觀察7-8歲兒童與成人在聆聽過此一材料後，能否從試題中挑選出聽過的音節組合，以此檢測統計學習在不同年齡層中的表現。實驗的結果指出，兒童與成人皆表現出顯著的統計學習效果（成人平均答對率為58.6%，兒童平均答對率為59.2%），但兩組受試者的. 14.

(22) 第一章研究背景與文獻回顧. 表現並無顯著差異，顯示此一分析計算銜接概率值能力的運作，不因為年齡而有所區別。 Campbell 、 Zimerman 、 Healey 、 Lee 及 Hasher (2012) 從抑制能力 (inhibition) 與注意力的角度切入，探討成人與孩童之對於統計資訊的掌握能力。實驗中所使用的連續圖片串經過設計，包含兩種規律性：一為「主要規律性」,實驗中的作業會引導受試者注意主規律，而「次要規律性」，穿插出現於主要規律性之間，不會直接被受試者注意到。實驗的結果發現：成人與孩童都能順利學會到材料中的「主要規律性」。而成人可同時掌握「主要規律性」與「次要規律性」，但孩童卻僅能掌握「主要規律性」。 Campbell 等人 (2012)認為因成人有更寬裕的注意力資源可供應用，能同時處理的規律性較為多樣。同時，成人懂得利用次要的邊緣訊息。這樣的結果也提示了統計學習機制能在不同年齡層的學習者身上觀察到，但是其效果似乎會受注意力資源多寡以及分配策略的影響。學習者對統計學習之倚賴策略的差異，不僅在孩童和成人兩大族群間可以觀察到。在七個月大和九個月大的嬰兒身上也能觀察到他們在分析材料時對統計學習機制的不同倚重程度。Thiessen 與 Saffran (2003)在以七個月大和九個月大的嬰兒作為對象的研究結果指出：當語言訊息中音節組合的統計分佈值與訊息中的重音資訊 (stress) 相衝突，意即兩種資訊會標記不一致的詞彙界線時，七個月大的嬰兒倚賴語音訊息中的統計分佈資訊來判斷語音詞彙界線，而九個月大的嬰兒則更依賴重音作為斷詞的線索。這表示嬰兒在在缺乏語言經驗的狀況下，主要以語音的統計分佈值當作語音單位的線索。而當累積了一定程度的語言規律後，會發現重音線索與詞彙界線的高度相關性，而改為使用相對明顯的重音線索來判斷詞彙界線。. 五、統計學習機制可以追蹤語言中不同方向的規律性 Pelucchi、Hay 及 Saffran (2009)發現，統計學習機制除了可追蹤連續語流中的順向銜接概率 (forward transitional probability)，亦同時計算了「反向」的銜接概率資訊 (backward transitional probability)。在學習者無法使用順向銜接概率值判斷出正確的組合時，反向的銜接概率就能協助學習者縮小可能的選擇範圍。以英文語詞組合「the dog」為例。英文中的定冠詞. 15.

(23) 探討華語為第二語的語詞統計學習. 「the」之後有許多不同名詞的搭配可能性，在此狀況下，順向的銜接概率就顯得較沒有預測力。但若我們使用反向的銜接概率來推算，「dog」前可能出現的詞語類別就只剩下冠詞或定冠詞等，因此 dog 一詞成為預測 the 出現的有效線索。在實驗中，八個月大的嬰兒聆聽了一段從未接觸過的陌生自然語言（義大利語），並在之後接受測驗，結果發現在目標詞之順向銜接概率值固定的狀況下，受試者能夠區分音節間反向銜接概率值之差異，此一結果顯示統計學習機制可以處理複雜語音訊息中的順向與逆向統計分佈值，並進一步推論出詞彙之界線與可能組合。. 六、統計學習可以追蹤語言中不同層次中的統計資訊將過去的統計學習研究標的進行分類，可觀察到統計學習的作用範圍相當廣，除了能夠處理不同範疇的訊號之外，統計學習也能處理語言訊號當中，各種不同階層單位間的統計資訊。. 1. 音節以下的細微音韻組合規律許多語言心理學的研究已經發現，嬰兒在說話前，語言發展之初，就已經對於語言當中的音韻組合規律相當敏感。嬰兒透過捕捉這些常見的組合規律，形成基本的語言知識，並進一步掌握語言。這些組合規律包括：哪些子音串的組合在母語中是合適的，子音可能出現的位置，子音與母音可能的搭配組合，重音出現的位置與型態等等。這些規律性主要是基於各種組合的出現頻率，亦歸屬於統計分佈資訊的一種。Kuhl (2000, 2004)指出，嬰兒對周邊的聲音訊息敏感，且能追蹤語音輸入中的音韻線索，其追蹤計算的主要依據即是音韻線索間的各種統計分佈值，嬰兒憑藉此類訊息進一步發現連續語音訊號中的音素和詞。嬰兒習得語言並非因於先天的語言規則設定，而是來自於對於周邊訊息的追蹤分析所累積出來的經驗。. 2. 音節層次的組合規律 Saffran 團隊早期的研究指出不論成人或嬰兒，都可以藉由追蹤語音訊息當中的統計組合規律性而把實驗者所定義的語言單位切分出來 (Saffran et. 16.

(24) 第一章研究背景與文獻回顧. al., 1996; Saffran et al., 1997)。而後續的研究結果指出，嬰兒在把語言單位切割出來以後，不僅僅將這些音節組合視為「相關連的音節組合」，而是將這些組合視為「似字」的 (word like)單位，且進一步利用這些組合資訊獲取更多的語言知識。Saffran 以八個月大的英語為母語嬰兒作為受試者 (Saffran, 2001)，在讓他們熟悉一段由人工語言組合而成的連續音節串後，把實驗者定義的音節詞鑲入不同的語言框架中測試：一種是英語，另一種是合於文法規則，但無意義的人工語言。結果發現當「音節詞」鑲嵌在英語語句中時，嬰兒受試者對「詞」或「部分詞」的區辨成效，比起在無意義人工語言框架中的表現更好。顯示嬰兒在捕捉到銜接概率資訊後，不但依此找到各音節詞間的界線，也將切分出來的語言單位視為母語環境中的「可能候選詞」 (candidate words)。. 3. 建立語言單位與物品對應關係有的語言學習都始於辨識出語言輸入中的語言單位，然而語言要發生作用，就必須要進一步建立語言單位與現實世界的各種對應關係。 Mirman、Magnuson、Graf Estes 及 Dixon (2008) 探討經由統計學習機制而完成的斷詞作業與詞彙學習間的關係。研究人員先給成人受試者聆聽一段由眾多音節所構成的語音材料，音節間的銜接概率是受試者判斷音節詞界線的唯一線索。聽完以後，受試者參與一個訓練作業，作業的內容是學習「音節組合」與「幾何圖形」的配對。配對的音節分為三種，一種是實驗者定義的「音節詞」，也就是各音節間銜接概率為1的組合，另一種是「部分詞」 (part word)，該音節組合跨越兩個詞，音節間的銜接概率為 .33。學習完畢後，受試者接受測驗，判斷聽到的音節組合應與電腦螢幕上的哪個圖形對應。結果發現：當受試者所接受的配對訓練的音節組合是高銜接概率的「音節詞」時，其學習的速度比低銜接概率的「部分詞」快，在測驗中的表現也較「部分詞」好。這個結果表示，不論音節組合中所包含的銜接概率值高低，受試者皆能學到音節組合與幾何圖形間的配對關係，但是其學習效果會因為銜接概率之差異而有所不同。相似的學習效果亦可以在七個月大的嬰兒身上觀察到。Graf Estes、 Evans、Alibali 及 Saffran (2007)發現，嬰兒在將語言單位由連續輸入中切出. 17.

(25) 探討華語為第二語的語詞統計學習. 後，便可將這些語言單位與物品配對標記 (labeling)。但是若在配對標記作業中所使用的語言單位是未曾學過的語音順序串，如「非音節詞」 (nonword)，或是橫跨兩個語言單位而構成的「部分詞」 (part-word)，七個月大的嬰兒就無法成功將該語言單位與物品配對標記。此結果顯示「語言單位物品」配對標記的學習效果，受到先前經驗的影響。而先前經驗中所分析出的各音節間銜接概率資訊，是嬰兒用以產生「適合標記的候選詞」 (candidate words) 的主要依據。「候選詞」（音節詞）比起「未經驗過的詞」（非音節詞）或「部分詞」更能有效地與現實世界中的物品產生連結關係。Graf Estes、Edwards 及 Saffran (2011)的研究以十八個月大的嬰兒為研究對象，發現該年齡段的嬰兒在聆聽了符合母語語音組合規律的語音刺激後，能望向正確的對應物品，而在聆聽到不合母語語音順序的刺激後則不會注視對應的物品。此結果表示十八個月大的嬰兒利用母語經驗的語音組合規律作為標記物品的依據，該研究同時發現嬰兒的語彙量(vocabulary size)和其學習表現有所關連，語彙量較大的嬰兒，在「聆聽-注視」作業的學習表現上，展現出相對於語彙量較小的嬰兒更明顯的學習差異。該研究除了說明了學習者可以利用統計資訊來建立語言對漢語品的對應關係外，也提示了學習者的母語語音規則經驗會影響他們之後的語詞學習表現。. 4. 習得詞彙所屬之語意類別所謂的語意類別指的是詞語的上層語意範疇，如：狗、貓、牛、雞同屬於「動物」，汽車、機車、卡車、公車同屬於「車輛」。Lany 與 Saffran (2010) 發現22個月大的嬰兒有能力將統計學習機制所分析出來的結果，用於語意類別的習得當中。在實驗時，受試者聆聽一段包含兩種類別字串的人工語言，此語音材料經過主試者的安排，只有實驗組的材料的統計分佈規律性提示了關於材料之語意類別的訊息，另一組則無。在受試者聽完材料後，實驗者訓練受試者將聽過的語音詞分別對應到不同類別的圖片中，並測驗受試者是否能判別正確的語音詞和圖片的配對組合。結果發現，若先前聽到的語音材料包含語意類別的統計線索，受試者可較快學會語音所代表的語意類別，甚至可以類化至新的同語意類別圖片中；反之，若聽過. 18.

(26) 第一章研究背景與文獻回顧. 的語音材料不包含關於語意類別的統計分佈資訊，受試者便較難判斷圖片所屬之語意類別。過往的研究雖然已經證實統計分佈線索有助於學習、形成語意類別 (Lany & Gómez, 2008)，但這個研究展現了統計分佈資訊在詞彙習得歷程中，不但有助於習得個別詞彙的語意類別特徵，更可以協助學習者將規則類化至新的材料中。. 5. 句法層級的規律性 Saffran 與 Wilson (2003) 指出，語言中不同層級規律性，如語音、辭彙、句法等，並非以由低至高的順序逐一呈現的，所有的規律性都是伴隨著語言訊號同時、同步出現的。因此學習者要有能力在掌握較低層次的規律性之後，以低層次的規律性為基礎，協助架構、分析更高層次的規律性。該研究以五組無意義的雙音節詞為材料，採用 finite-state grammar 設計了兩組人工語言，各十六句。兩組句子的組成單位完全相同，差異僅在其中某兩單位的順序對調，如 A 語言各詞彙的出現順序為 a-b-c-d-e，B 語言成分出現順序為 a-d-c-b-e。因此合於 A 語言語法規則的句子將成為 B 語言中的不合法句，反之亦然。實驗者同時也操控了兩組語言中，各音節詞的詞間與詞內銜接概率，使所有音節詞的詞內相鄰兩音節銜接概率皆為1.0，音節詞間的相鄰兩音節銜接概率為 .25，因此當受試者需要判斷語句是否符合文法時，銜接概率將無法成為有效的判斷線索。結果發現，十一至十二個月大的嬰兒能夠在熟悉材料後的測驗中，判別語句的合法與否。這代表十二個月大的嬰兒至少能夠依序進行兩種統計分佈資訊的處理：第一是追蹤並計算相鄰音節間的銜接概率，找出實驗者所定義的語言單位；第二則是歸納出這些音節詞之間的排列規則。此結果顯示，嬰兒有能力由語言輸入中，獲取多重層級 (multi-level) 的表徵，而某些規律性必須得在其他規律性已掌握的狀況下才會浮現。在自然語言中的句法規則，有一些是發生於非相鄰的單位間的，例如 A-X-C 規律：當單位 A 出現時，單位 C 必定出現，X 代表該位置有幾種不同的可能。Gómez (2002) 的研究中指出，語言單位 X 的變異性大小，會決. 19.

(27) 探討華語為第二語的語詞統計學習. 定此種不相鄰單位的規律性是否容易被發現。如果 X 的變異較大，會凸顯 A 和 C 的穩定和不變，因此可以預測 A 和 C 伴隨出現的關係。由於非相鄰單位間伴隨出現的關係在語言中相對較少，比較不直接，因此通常不容易發現與學習。Newport 與 Aslin (2004)的研究指出，學習者追蹤「非相鄰單位」的統計資訊的效果，沒有追蹤「相鄰單位」間的統計規律性容易。不過，在追蹤不相鄰單位間的規律性時，受試者的表現會因為該規律性所在的語言層級的位置而有所不同。. 20.

(28) 第一章研究背景與文獻回顧. 第五節影響統計學習效果的可能因素一、訊息成分間的依存性早期研究統計學習的學者，曾針對統計學習的條件限制進行探討。包括研究訊息本身所隱含的統計分佈結構以及訊息呈現的方式。 Saffran (2002) 以人工語言結構探討何種統計分佈是較容易被學習者所發現的，以及當這些統計分佈資訊經由不同知覺管道 (perceptual modality) 輸入時，學習者是否皆能夠順利掌握。實驗中以兩種不同的人工語言結構來測試。其中一種人工語言的成分與成分間，互有「依存性」 (dependency)，或稱為「可預測性」，亦即訊息中的某成分與另一成分有相依關係，可用已出現的成分預測即將出現的成分，而另外一種人工語言結構則無此依存性。實驗的結果發現，當此兩種人工語言透過聽覺管道輸入時，「具依存性」的人工語言之統計學習表現相對較好。. 二、知覺管道對訊息型態的偏好 Saffran (2002) 所做的研究中發現，聽覺管道偏好「依序呈現」 (sequential) 的資訊陳列型態，而視覺管道偏好「同時呈現」 (simultaneous) 的資訊輸入型態，這可能是因為各知覺管道能處理的訊息型態不同，因此各有其偏好的訊息型態。Conway 與 Christiansen (2005)探討受試者在觸覺、聽覺、視覺管道中，對於依序呈現的訊息的統計學習表現。結果發現統計學習成效在不同知覺管道中皆有「質」與「量」的差異。在量的方面，聽覺管道的統計學習表現比視覺管道和觸覺管道的效果好。而在質的方面，受試者在事後的回憶測驗中，表現出對於觸覺訊息的前段、聽覺訊息的後段較為敏感的特質。暗示每種接收管道在處理序列式的訊息時，因為各管道所偏好的訊息模式不同，統計學習機制會採取不同的運算策略來應對。早期的研究多將統計學習機制視為一個單一整體，而近幾年的研究傾向從統計學習機制是多個子系統的概念出發來解釋在不同管道中所發現的框限性。Frost、Armstrong、Siegelman 及 Christiansen (2015)的研究中指出，統計學習機制應是「一組」跨認知範疇的神經生理機制的集合，這些主管學習的神經機制分布在大腦不同的皮質區，並非單一的神經機制。訊. 21.

(29) 探討華語為第二語的語詞統計學習. 號透過不同知覺管道輸入，形成對應該管道的內在心理表徵，而統計學習在計算處理這些訊號間的關係後，便能歸納出訊號單位間的規律性。但也因為統計學習機制是一組神經生理機制的集合，因此統計學習機制的表現會受到不同輸入管道原本對於訊號的偏好和限制。換句話說，影響某一管道處理訊號的特質因素，對於另一管道的訊號而言可能就不具有同樣的影響力。Frost 等人以此論述來解釋過去研究中已經證實的統計學習「跨認知範疇」特質，並說明為何不同訊號型態和輸入管道的統計學習表現似乎各具有其特殊性 (modality specificity )。. 三、統計學習效果會受到注意力配置的影響統計學習機制在早期被視為一種「內隱學習」機制 (implicit learning)，也就是當統計學習運作時，大多是「自動化」(automatic) 的，且涉及較少的意識層面，因此學習常常是在「不知不覺」之間發生的。Saffran 等人 (1997) 的研究指出統計學習是一種「偶發式的學習」 (incidental learning)，意即統計學習發生在不經意之間。在他們的研究中將主要的語音材料以「背景音」的方式呈現，與此同時，要求受試者完成繪圖作為附屬作業 (secondary task)。結果發現：受試者雖然需要將注意力配置在繪圖作業上，但是仍可以發現背景聲音中的規律性，並判斷測驗詞彙是否為實驗所定義的詞。但部分研究者質疑 Saffran 所採用的附屬作業並未有效控制受試者的注意力配置，受試者是否真的將主要注意力放在繪圖作業中，仍有探討的空間。 Toro、Sinnett 及 Soto-Faraco (2005) 以斷詞作業 (word segmentation) 檢測當人們追蹤刺激中的統計規律時，投入「注意力」的多寡與統計學習表現的關連性。實驗中，操弄受試者的注意力投入程度：一組受試者只需要被動聆聽語音刺激，不需處理其他附屬作業，屬於投入全部注意力的祖。而其他兩組受試者需要在聆聽材料時，需要同時處理發生於相同或不同知覺管道中（視覺、聽覺）的附屬作業任務。結果發現，當受試者的注意力資源被其他附屬作業佔據時，其統計學習表現（詞彙答對率）顯著地受到影響而降低。而且即使附屬作業與主作業訊號來自於相同知覺管道，受試. 22.

(30) 第一章研究背景與文獻回顧. 者的表現亦下降至隨機猜測水平。該結果顯示：雖然人們有不需要透過「說明」、「提示」就能掌握訊息的組合規律的統計資訊追蹤能力，但是成功的統計學習仍需要適當的注意力之投入。 Turk-Browne、Jungé 及 Scholl (2005)的研究中同時採用內隱的和外顯的測量方式觀察視覺管道的統計學習和注意力的關係。他們的研究中發現，視覺管道的統計學習確實需要選擇式注意力 (selective attention)的涉入，在排除材料本身以及測驗方式所可能造成的影響之後，受試者依然僅在有注意力涉入的目標材料序列中，展現出統計學習的效果。他們認為視覺管道的統計學習具有隱性學習的特徵，因為受試者是在有主作業的狀況下學到視覺訊號間的統計規律性，且參與該實驗的受試者並未回報發現任何隱含在材料串中的規律。 Pacton 與 Perruchet (2008)發現：不論受試者要學會相鄰或不相鄰成分間的銜接關係，聯合式注意力 (joint attention) 的涉入扮演習得此一關係的充分條件 (sufficient condition)，該研究結果與「學習需要注意力涉入」的看法一致。然而 Musz、Weber 及 Thompson-Schill (2015)以圖形符號為材料的研究中發現，受試者在接觸材料的過程中，不但能學習到被注意到的材料串中的規律性，也展現了在未投入注意力的刺激材料中的統計學習效果，這是與過去研究較為不一致的發現。整理以上關於注意力和統計學習的關聯性可以發現，研究者在注意力涉入和如何參與統計學習的研究方面，似乎尚未有一致且明確的結論。早期的研究似乎傾向認為統計學習是一種不需要注意力涉入的自動化歷程，但後續的研究結果較為支持統計學習的發生需要注意力的涉入，但亦有部分研究發現統計學習的效果不論在注意到或未注意到的材料中都能觀察到。. 23.

(31) 探討華語為第二語的語詞統計學習. 第六節統計學習機制和語言學習機制的關係雖然統計學習機制的相關研究在近二十年來累積了相當數量，且已證實該機制和語言的習得和發展有密切的相關性，統計學習機制能追蹤計算語言各個層面的統計資訊。由此產生的自然聯想便是統計學習是否為等同於語言學習機制？目前學界的看法傾向認為統計學習機制僅作為語言學習機制的一環，並不能完全代表語言學習機制。部分研究者提出，統計學習機制的主要作用在於將語言單位抽取出來，但是對於完整習得一個語言來說，並不足夠。文法的規則並不等同於統計分佈規律性，而有可能是更高層次的抽象代數規則。 Marcus 、 Vijayan、Bandi Rao 及 Vishton (1999) 認為語言的習得機制可能至少由兩組能明顯區分的機制共同負責：一個是統計學習機制，用來追蹤訊息中的統計分佈資訊，並把語言單位自訊息中切分出來；另一個機制則負責學習訊號中的「抽象代數規則」，也就是「文法規則」。抽象的代數規則與文法規則一個重要的相通之處，就是可以將不同的材料代入變項中。例如代數式 y = x + 2當中，x 可以帶入任何數值，語言文法亦同。例如英語中名詞和動詞間的數量一致性 (number agreement) ，任何放在名詞與動詞位置的語言單位，都需要符合數量上的一致性，也就是單數名詞搭配單數動詞，複數名詞搭配複數動詞的規律。 Marcus 等人 (1999)認為，習得文法的關鍵在於發掘語言單位間的抽象關係，也就是找出語言中各「變項」(variables) 之間的關連性。舉例來說，在以 ABA 規則呈現的材料中，其變項間的關連性，就是第一個語言單位等同於第三個單位，而第一個單位與第二個單位並不相同。而這些「變項間關聯性」不但適用於經驗過的材料，亦可以套用於新材料中。在他們的研究中 (Marcus et al., 1999)，研究人員設計了一組人工語言，以簡單的規則規範音節出現的順序。例如：各音節的出現順序是按照 A-BB 規則（如音節串 gagigi）或 A-B-A 規則（如音節串 gagiga）。實驗中以七個月大的嬰兒作為受試者，在給予他們習慣化 (habituation) 階段後，進行一個測驗。測驗中的所有音節都是嬰兒在習慣化階段中沒有聽過的新材. 24.

(32) 第一章研究背景與文獻回顧. 料，屬於初次接觸。因此受試者無法利用習慣化經驗中所產生的統計規律性，或音節間的銜接概率來判斷這個材料是否合於規則。測驗題包含兩個選項，一個選項的音節順序符合習慣化階段中所使用的規則，另外一個選項的音節順序則不合規則。結果發現，嬰兒花了更長的時間聆聽不合規則的音節串，這種現象稱之為學習的轉移 (transfer of learning)。表示受試者由習慣化階段的材料中學會了某些規律性，再把這些規律性用在完全沒有接觸過的材料當中。研究者認為，單單倚靠統計學習機制無法說明受試者何以將學習到的規律性應用於不同的材料中，因此語言學習機制中至少有一種機制負責歸納「抽象代數規則」。 Peña、Bonatti、Nespor 及 Mehler (2002)亦抱持類似的主張，他們認為雖然習得一種語言除了倚賴統計學習的運算機制以辨認出語言中的單詞 (word) 外，同時也需要一個能夠處理複雜結構的機制，以協助學習者發現語言中更高層次的結構，如：句法。而句法往往作用在不相鄰的語言單位間，例如英文中的數量一致性 (number agreement)。這與統計學習所探討的「相鄰」語言單位間的關係不盡相同。他們的主張似乎暗示了文法的習得開始於統計學習能力的極限點。 Peña 等人 (2002)以法語成人作為受試者，採用類似 Newport 與 Aslin (2000) 的實驗方法，但將原本的人工語言以 “AXC” 語言替代，以測試受試者是否能夠習得非相鄰單位間（跨語言單位間）的銜接概率。該人工語言的結構特色是：在定義詞中，A 成分能夠準確預測 C 成分的出現，X 成分有三種可能，因此形成不同樣貌的實驗定義詞，如[puliki]、[puraki]、 [pufoki]等詞，有相同 AC 成分的詞可以算是同一個「詞彙家族」。材料中一共包括了三個「詞彙家族」，共九組不同的實驗定義詞，將每個實驗定義詞重複數次後，隨機排列形成一段連續的音節串。在這段人工語言材料中，定義詞內 A 成分與 C 成分之間的銜接概率為1.0，AX 與 XC 之間的銜接概率為 . 33，而每個定義詞的 C 成分與另外一個定義詞的 A 成分間的銜接概率為 .5。在他們的實驗中，發現受試者在經驗過這段音節串後（熟悉化），能夠利用統計學習機制掌握非相鄰成分間的統計銜接關係，並將定義詞從連續的材料串當中切出。因此受試者可以區辨定義詞 (word)與部分詞 (part word) 之間的差異（答對率為73.3%）。其後他們想瞭解受試者是否在切分. 25.

(33) 探討華語為第二語的語詞統計學習. 語言單位的同時，亦學會了該人工語言的組詞規律性（AXC 規則）？因此將測驗題當中的定義詞 (word) 置換成「規則詞」(rule word)，也就是使用曾經出現在習慣化階段中的材料，依照 AXC 的組詞規律性形成一個新的詞，並要求受試者判斷規則詞和部分詞何者屬於比較像經驗的音節串中出現的材料。結果發現受試者偏向選擇「部分詞」而非「規則詞」（答對率為 49.8%）。他們認為此結果代表統計學習機制僅提供學習者追蹤語言單位的切分界線之訊息，而不足以使其瞭解材料背後的文法規則。實驗的結果相當穩定，即使在大幅延長3倍的熟悉化時間後，仍無法讓受試者掌握橫跨語言單位間的規律性。他們在接下來的兩個實驗中，於每個定義詞之間加入了一個不會被受試者察覺到的25毫秒停頓間格，使受試者不需啟動統計學習機制即可將連續音節串中的定義詞切割出來，並可以更專注於歸納音節串所隱含的「句法規則」。結果發現受試者在區分部分詞和規則詞的測驗作業中，答對率為69.6%，表示受試者此時掌握了組詞的文法規則，而且即使將熟悉化時間減為原來的五分之一，其文法學習的效果仍在。因此 Peña 等人 (2002)主張，雖然人類具有強大的統計學習運算機制，可以分析追蹤材料當中的頻率和統計分佈值，但是學習者並無法單單由這些訊息當中歸納出更高層次的文法規律性，「文法規律性」的習得並不是由統計學習機制負責，而應該是由另外的機制所掌控，而自然語言中的停頓 (pause) 極有可能扮演著觸發 (trigger) 不同語言習得機制的角色。 Nespor、Peña 及 Mehler (2003)在後續的研究中以「子音／母音假設」 (C/V Hypothesis) 深化他們的論述。Nespor 等人指出，透過對於非聲調語言 (non-tonal language) 的跨語言的觀察，在多數的語言當中，子音與母音的平均數量比約在20：5，整體而言，子音的數量大於母音，因此他們認為子音與母音極有可能在語言當中各自主管不同的功能，攜帶不同型態的訊息。子音的組合型態多變，主要負責提供關於區別、辨識字詞的資訊 (word identification, distinguish lexical entries)，母音則因其攜帶音高、音長、音強等訊息，主要負責提供構詞句法結構的訊息 (morphosyntactic structures)。 Bonatti、Peña、Nespor 及 Mehler (2005) 發現，法語成人受試者在切分連續音節串的作業中，主要依靠的訊息並不是各相鄰音節間的銜接概率，而是. 26.

(34) 第一章研究背景與文獻回顧. 使用相鄰子音間的銜接概率值 (TPs between consonants)。Mehler、Peña, Nespor 及 Bonatti (2006)主張，在子音和母音頻率相等的狀況下，學習者偏好使用子音串來切割音節。但是這類的看法仍然受到一些挑戰，最常遭受的質疑有二：其一是難以定義「文法」與「統計規律」之間的界線。Seidenberg、MacDonald 及 Saffran (2002) 指出：任何型態的語言刺激中都包含了各種類型的線索以及可能歸納出的規則。即便採用人工語言小心操弄材料特質，仍有可能因為組成材料之單位成分中的某些特性而導致了受試者的反應偏向。根據他們的看法，所謂的「規則」 (rules)、「文法」 (grammar) 在某種程度上都可以被視為「統計值」的表現，因此很難判斷文法、規則和統計規律之間的分野。其二是，嬰兒究竟是如何從有限的經驗當中找到「正確的規則」？正確的規則是透過何種機制產生的？目前仍未得到較為一致的結論。 Marcus 與 Berent (2003)認為 Seidenberg 等人 (2002)的說法將「統計學習機制在語言習得機制中所扮演的角色」，擴大為「統計學習機制即為語言習得機制」之論述。他們認為「統計學習機制」在語言習得機制中確實扮演了重要的角色，但不等同於「語言習得機制」。研究者不應忽略人類所具有的「追蹤規則」能力，亦不應否定人類有「歸納／產出規則」的認知能力。Gervain 與 Mehler (2010)指出，無論是先天內在的、專為語言設置的機制，以及接收語言的管道，或是具有泛認知特性的統計學習機制，對於語言習得來說，都是不可或缺的要素。因此，語言習得的研究應該從整合的角度出發，探討這些要素如何運作，以及如何互動。Shukla、Gervain、 Mehler 及 Nespor (2012)在此基礎上提出了一個整合的主張，他們認為語言習得機制可能由三個不同的機制構成，分別為先天的內建語言規律知識、跨認知範疇的基本認知能力（如統計學習）與知覺的方面的先天偏好。這三種主要機制在習得語言的過程中不斷互動，相互協助。而不同機制之間的互動模式或許就是人類發展出複雜語言系統的背後認知基礎。 Thiessen、Kronstein 及 Hufnagle (2013)則是提出一個包含攫取訊息和整合訊息的框架來詮釋統計學習的現象，試圖將統計學習所可能涉及的各種資訊加以匯集。他們在論述中指出，過去關於統計學習的研究僅僅侷限在. 27.

(35) 探討華語為第二語的語詞統計學習. 對「銜接概率」的研究上，並無法解釋統計學習機制如何處理真實語言材料中的多樣統計資訊。他們認為統計學習機制包括了兩個重要的處理歷程，若缺少其中一個環節，將無法產生成功的統計學習。第一個重要步驟是分析訊號，也就是從連續的環境訊號中抽取（extraction）出訊息所蘊含的各種集群特徵，包括訊號的各種組合的集中趨勢、統計分佈，或者是單位組合的條件機率值，或者是一些伴隨訊號出現的知覺特徵，如重音、停頓等線索。抽取出這些訊息所隱含的集群特徵後，學習者以組塊 (chunking)的形式形成記憶表徵。第二步則是比對已形成的既有表徵，找出表徵間的相似之處，並架構出訊息的基本框架，產生對此段訊息的基本理解，引導學習者將這些處理過的訊息應用於處理新的刺激輸入中。此一框架的重要精神在於以記憶為基礎 (memory based)，分析輸入訊號並形成訊息組塊，所倚賴的是工作記憶的能力 (working memory)。而學習者在面對新的輸入時，將目前的訊號特徵和過去所形成的記憶表徵比對，找出相似點和共通性，所倚賴的則是長期記憶的能力 (long-term memory)。當新的輸入訊號分佈顯現和過往經驗表徵有高度相似時，有助於掌握新的輸入，而當新的輸入與過去所形成的表徵相似性低甚至不一致時，將不利於掌握新的輸入。過去的記憶表徵扮演一個「定錨」 (anchor)角色，影響我們處理新的刺激輸入時的策略和表現。 Erickson 與 Thiessen (2015)指出，雖然有相當多的統計學習研究成果指出，學習者在條件機率方面的統計學習表現可以相當程度地解釋學習者在學習真實語言材料的表現，但仍不能排除在學習現象的背後有其他基礎認知機制的存在。統計學習機制或可被稱為驅動早期語言習得的一個重要關鍵，但卻不適合將其擴大解釋為等同於語言習得機制。他們認為找出學習者的統計學習表現和未來語言學習成效間的因果連結，將有助於釐清統計學習和語言習得機制之間的關連。. 28.