中文聲調相關研究

第二章文獻回顧

2.2 中文聲調相關研究

針對中文聲調所進行的口語感知研究可分為兩類：其一為聲調訊息 (tonal information)及音段訊息(segmental information)是否有交互作用(Ye & Connie, 1999)，其二為不同聲調訊息需要何種聲學線索(acoustic cues)來界定彼此(Shen & Lin, 1991; Lee, 2008)。前者研究著重於聲調與音段訊息在口語聽感上時間的快慢，聲調和元音在口語感知時到底是同時出現，還是有感知時間上的差異；後者藉實驗檢視不同聲調之間需藉由哪些聲學線索方能區隔彼此。本小節將先介紹中文聲調的特性，而後回顧 Ye 與 Connie (1999)和 Lee (2008)的兩篇論文。

2.2.1 中文聲調概述

中文就音素上(phonemically)根據 Chao(1948)的五度標調法⁴，可分為四個基本聲調 (輕聲不在討論範圍內)⁵，這些聲調主要差異來自於基頻(fundamental frequency or F0)域值 (register)起伏(contour)的不同，詳見表二。另外，由圖二可看出四個聲調具體的基頻起伏：一聲基頻無明顯起伏，二聲基頻逐漸升高，三聲基頻會有一段極低的值，而四聲基頻由高調域明顯下降。另外，可以藉由基頻起點(beginning of F0)的高度將四個聲調分成兩組：一組為一聲和四聲，是為高調域(high register)，另一組為二聲和三聲，是為低調域(low register)。

聲調描述調值

一聲高平 (high-level tone) 55 二聲低升 (low-rising) 35 三聲降升 (low-dipping) 214 四聲高降 (high-falling) 51

表二北京中文聲調簡表(根據 Chao, 1948)

4 畫一條豎線，平分為四格五度，把人們的相對音高分成五層，5 最高，1 最低。五度標調法記錄了發音的起點和終點的音高。

5 輕聲並無固定調值，由其出現位置的前一個音決定其調值，並且不可獨立存在，因此本論文不將其列入討論。

果顯示替換元音的刺激項比替換聲調的刺激項反應時間快 93 毫秒，即獨立語境下元音訊息的感知較聲調訊息快。

包含元音/a/和二聲的刺激項 60 個 不包含元音/a/和二聲的刺激項 60 個

存在音節 30個 不存在音節 30 個 替換元音的詞 30個 替換聲調的詞 30 個

i.e. /ba/ with Tone 2 i.e. /ra/ with Tone 2 i.e. /bi/ with Tone 2 i.e. /ba/ with Tone 4

表三 Ye 與 Connie(1999)實驗一刺激項

實驗二探討聲調訊息聽感上的弱勢若在有語境(in context)的情況下，是否仍存在。

受試者為 10 個在美國大學召募而來且母語為中文的學生，本實驗有元音和聲調監測 (vowel and tone monitoring)兩種任務，將受試者要說的字放入高度約束(highly constraint) 的語境，即成語(idioms)當中，實驗材料包含 30 個成語和 30 個中立片語(neutral phrases)，

以及 30 個元音替換(vowel mismatch)及 30 個聲調替換(tone mismatch)的混淆刺激項 (fillers)，如表四。受試者需判斷刺激項的第四個字是否包含目標(包含元音/a/和二聲)。

結果顯示，整體看來，成語語境比中立語境快 132 毫秒(ms)，在中立語境中，元音監測 (vowel monitoring)的時間比聲調監測(tone monitoring)快，與實驗一相同。但在成語語境下，聲調監測反而比元音監測快 65 毫秒，此結果說明在高度侷限(highly constrained)的語境之下會讓元音訊息對聲調訊息的聽感優勢中止。

元音監測任務 聲調監測任務

目標刺激項 混淆刺激項 目標刺激項 混淆刺激項

lai2 ri4 fang1

(來日方___)

shan1 si1 er2

(三思而___)

lai2 ri4 fang1

(來日方___)

da4 shi1 shuo3

(大失所___)

chang2 長 xing2 行 chang2 長 wang4 望

表四 Ye 與 Connie(1999)實驗二刺激項

實驗三的受試者同實驗二，材料如表五。有 30 個中文四音節成語，以及兩組替換第三個音節的刺激項，一組為近替換(close mismatch)，即二聲變三聲，一組為遠替換(far mismatch)，即二聲變四聲，本實驗探討近替換和遠替換是否對判斷目標刺激項造成影響。

實驗三的反應時間結果也證明在有語境的情況下聲調訊息比音段訊息的感知快。

元音監測任務 聲調監測任務

成語 近替換 遠替換 成語 近替換 遠替換

jin1 yu4 金玉 jin1 yu4 金玉 jin1 yu4 金玉 jin1 yu4 金玉 jin1 yu4 金玉 jin1 yu4 金玉

liang2 良 liang3 liang4 liang2 良 liang3 liang4

yuan2 緣 yuan2 緣 yuan2 緣 yuan2 緣 yuan2 緣 yuan2 緣

表五 Ye 與 Connie(1999)實驗三刺激項

實驗一結果顯示無語境情形下的感知速度是音段訊息比聲調訊息快，在實驗二得到

有語境的情形下可依照語境類型分為兩種狀況：中立語境之下音段訊息還是比聲調訊息快，但高度侷限的成語語境之下，反而是聲調訊息比音段訊息快。實驗三也證明高度侷限語境下聲調訊息比音段訊息快。

Ye 與 Connie(1999)的研究結果顯示語境對聲調和元音訊息的聽感有顯著影響，本實驗採納此論點，為了避免語境的影響，刺激項皆設定為無語境。

2.2.3 以北京中文為材料之聲調感知

Lee(2009) 調查多個發音人 (multiple speakers) 所發出的聲調在不熟悉 (lack of familiarity)、基頻訊息長度縮到最短、以及語境(external context)無法利用時，是否仍可被辨識。

本實驗受試者為 40 位俄亥俄大學招募來的北京中文使用者(27 女 13 男)。實驗材料是由 32 個北京中文使用者(男女各半)所錄製的中文 sa 音節的四個聲調，共 128 個刺激

項； 32 個發音人所發出的 128 個刺激項被分成四組，每組有 32 個刺激項，所有的刺激項皆由不同人說出，每個人聲調的基頻高度都不同，且聲音特性(voice quality)也有所不同，因為女性的低聲調幾乎等同男性的高聲調。每組男女聲音之比例固定、聲調固定，

每個受試者所聽到的順序都不同，受試者只會聽到刺激項的前面極短部分，刺激項之間間隔為五秒。他們的任務是使用電腦鍵盤上的 1、2、3、4 按鍵辨別每個刺激項的聲調，

受試者有五秒可以回應，回答時間會被計時。

結果顯示就聲調而言，一聲最容易和四聲混淆，二聲最容易和三聲混淆，三聲準確率最高；男性發音人發出的二聲準確率為最低。Lee (2009)認為中文聽者能很快辨識低調域的音，且都將其認做三聲。

Lee(2009)的研究除了控制語境對於聲調辨識的影響，也提到聲音特性對於辨別聲調的作用，只有基頻高度並不夠用來當作聲調聽辨的依據，因為女性的低聲調幾乎等同男性的高聲調，利用聲音特性的差異，聽者可以先辨別說話者為男或女，再根據性別資訊評估基頻的高度。

由 Lee(2009)的實驗可看出中文聽者有能力辨識出由多個發音人，且時間極短的孤立聲調刺激項，且因實驗中並無給予語境，可判斷刺激項本身具有聲學線索，可幫助聲調的辨識。柵欄理論的前幾個柵欄時長皆極短，由 Lee(2009)的實驗可得知中文聽者有能力辨別極短刺激項之能力，進而確認柵欄理論在中文口語感知應用上的可行性。

在文檔中音韻組成與中文口語感知 (頁 16-21)

第二章 文獻回顧

2.2 中文聲調相關研究

2.2.1 中文聲調概述

2.2.3 以北京中文為材料之聲調感知

第二章文獻回顧