第三章 研究架構與方法
第二節 研究工具
本文採實證研究(empirical research)46為研究方法,即根據第一章提出 的研究問題與第二章文獻研究為基礎與方向,以問卷和語料為研究工具做進 一步驗證與分析。問卷施測的主要目的在於觀察漢語學習者對「好」語義掌 握度,語料蒐集為本文主要研究方法,分別蒐集書面語料和口語語料,其中 口語語料將用於「好」會話分析的實證研究。
一、 問卷施測對象與目的
本研究問卷施測的主要目的為初步了解華語學習者對「好」語義的掌握 情況,以下分別介紹施測目的、對象與題目設計與安排:
(一) 目的
此份問卷施測的目的在於觀察漢語學習者對「好」語義掌握度47。因此,
筆者設計了20 題選擇題,囊括詞典上所列「好」的用法,讓華語學習者判 斷各「好」的用法或語義,此問卷施測數量為40 人,中級學習者 20 位,中 高級學習者 20 位48。此問卷統計結果則成為本文研究方向以及本文教學應 用啟示之參考與依據,以學習者為中心,將學習者認為的學習困難處納入教 學應用的考量。如此,透過問卷受測所呈現出的學習難點,將研究結果與教 學應用相輔相成(問卷統計結果之教學應用詳見本文第五章)。
(二) 研究對象
本研究問卷的受測對象為華語為第二語言的學習者49,共分兩組。中級 學習者學習華語的時間為一至兩年,一共20 位。中高級學習者學習華語的 時間皆為3 年以上,一共 20 位,其中 15 位為台灣師大和高雄師大華語文教 學研所的外籍研究生,其餘5 位為師大國語中心的學生。
46 周文欽(2002:16)說明實證性研究指採用科學方法蒐集實際、客觀的資料,並經由資料分析 以解答問題或驗證假設。
47 本研究問卷亦讓 20 位母語者受測,20 位母語者皆具大學以上學歷。20 位母語者對「好」的語 義掌握度高達95%,其中 5%答錯率是因筆者問卷試題情境不明而誤導或因粗心大意而看錯。
48 中級學習者學習漢語時間為一至兩年。中高級學習者,學習漢語時間皆為 3 年以上。此外,中 高級程度判定按師大國語中心課程規劃,http://mtc.ntnu.edu.tw/acadintroc_all.html,受測者皆學習 過《今日台灣》之程度。
49 包括日籍、美籍、泰籍、韓籍、西班牙籍、越南籍和馬來西亞籍等學習者。
(三) 題目設計
問卷皆為選擇題,題目內容皆來自本文所蒐集的語料或詞典上所列的例 句,選取情境清楚的語句,作為試題的題幹,而選項部分則參酌詞典上所羅 列的語義義項。作答方式採勾選方式,受測者閱讀題幹句子後,判斷句中「好」
的語義為何,並勾選所給予的選項中最符合情境語義的選項,若選項中無受 測者認為最符合的選項,可自行補充填寫。
此問卷主要是測試華語學習者對「好」語義的認識,探查華語學習者能 否理解句中「好」的語義為何,有無混淆無法辨認之處。問卷試題一共 20 題,請受測者選擇最適切的答案,若受測者認為無適切答案,可自行填寫其 他答案,試題如下:
1. 小狗死了,有什麼好哭的﹖
□ 方便 □ 值得 □ 容易 □ 其他:
2. 請把他的地址告訴我,我好找他。
□ 方便 □ 值得 □ 容易 □ 其他:
3. A:上次的事情,真對不起。
B:事情都過了那麼久,沒什麼好對不起的。
□ 方便 □ 值得 □ 容易 □ 其他:
4. 老闆說:這些小說一本只要 50 元,一定好賣。
□ 方便 □ 值得 □ 容易 □ 其他:
5. 這件事交給你,我好出國去玩。
□ 方便 □ 值得 □ 容易 □ 其他:
6. A:我們去夜市吃飯,好不好?
B:夜市的東西,有什麼好吃的。
□ 方便 □ 值得 □ 容易 □ 其他:
7. 他身體一向很好。
□ 友愛 □ 健康 □ 完成 □ 其他:
8. 王小明好管閒事。
□ 喜歡 □ 可以 □ 容易 □ 其他:
9. 媽媽說:等一下可能會下雨,記得帶傘,好下雨用。
□ 方便 □ 值得 □ 容易 □ 其他:
10. 請給我電話號碼,我好打電話給你。
□ 方便 □ 值得 □ 容易 □ 其他:
11. A:大家來討論這個問題,好不好?。
B:這個問題那麼簡單,有什麼好討論的。
□ 方便 □ 值得 □ 容易 □ 其他:
12. 醫生說:要定期做身體健康檢查,早點發現問題,好做進一步治療。
□ 方便 □ 值得 □ 容易 □ 其他:
13. 他們從小感情就好。
□ 健康 □ 完成 □ 友愛 □ 其他:
14. 畢業後,把中文學好,將來好做翻譯工作。
□ 方便 □ 值得 □ 容易 □ 其他:
15. 結婚後有人照顧,日子可能比較好過。
□ 方便 □ 值得 □ 容易 □ 其他:
16. 新年要到了,把家裡打掃乾淨好過年。
□ 方便 □ 值得 □ 容易 □ 其他:
17. 老師說:請說清楚,好讓我了解你的意思。
□ 方便 □ 值得 □ 容易 □ 其他:
18. 爸爸說:這是你應該做的,沒什麼好抱怨(to complain)的。
□ 可以 □ 值得 □ 容易 □ 其他:
19. 媽媽說:飯煮好了。
□ 友愛 □ 健康 □ 完成 □ 其他:
20. 有人說要做一個好學生,就要認真。
□ 美味的 □ 令人滿意的的 □ 容易 □ 其他:
本文於問卷結束處下方留下一些空白處,受測者若有任何建議或意見,皆可 寫在空白處。
二、 語料蒐集
本研究另一分析工具為語料庫,以下介紹蒐集語料的目的和語料來源,
茲分述如下。
(一)目的
本文採實證研究方式,即利用真實語料,對於所提出的現象、結果加以 統計、分析與歸納。因此,為了驗證本文之研究,筆者以語料庫為主要研究 工具,除了使用語料來印證本文描述,並進行歸納統計,希望能理論與實證 相互配合,得出具驗證性的研究結果。
(二)語料來源
本文所蒐集的語料包括兩類,一為書面語料,一為口語語料,書面語料 的主要來源是各大語料庫,包括中文詞彙特性速描系統(Chinese Word Sketch Engine)(其囊括現代漢語平衡語料庫語料)、北京大學語料庫和聯合 知識庫。口語語料主要的蒐集來源包括現代漢語平衡語料庫的口語語料、
Youtube 網站上的影音素材、平日口語語料和網路小說中的對話50等。
首先,本文先介紹書面與部分口語語料來源的語料庫,包括中文詞彙特 性速描系統(囊括現代漢語平衡語料庫)、北京大學語料庫和聯合知識庫等,
分述如下:
1.中文詞彙特性速描系統
根 據 中 文 詞 彙 特 性 速 描 系 統 (Chinese Word Sketch Engine)網站
(http://140.109.150.73/)上的介紹,中文詞彙特性速描系統是一個結合了鉅 量語料庫的語法知識產生系統,其與十四億字的LDC Chinese Gigaword 語 料庫結合後,提供了絕大部分中文詞彙實際使用的規則性描述,可應用於辭 典編撰、華語文教學、語言學研究與自然語言處理。
此系統中亦囊括中研院現代漢語平衡語料庫中的語料,二者不同的是,
中文詞彙特性速描系統的語料可擴展上下文的查詢,即可方便擷取該段語料 之上文或下文,此上下文擴展的功能,對本文篇章研究有非常大的助益。
50筆者蒐集口語性強的網路小說中的語料,包括席娟、亦舒、巴金和錢鍾書等作家之作品。
本文取此系統中的「中央研究院平衡語料庫」簡稱「中研院平衡語料庫」
(Sinica Corpus)之語料,此語料庫是世界上第一個有完整詞類標記的漢語 平衡語料庫。其語料的分類與選取,包括哲學、科學、社會、藝術、生活和 文學,本文從中搜索到5000 筆「好」語料,擷取其中前 400 筆的語料,其 中391 筆為有效語料,以此 391 筆來進行統計、分析與佐證。
2.北京大學現代漢語語料庫
「北京大學現代漢語語料庫」採人民日報作為語料,包括新聞及其他各 式各樣的文章,語料類別包羅萬象,本文採用的北京大學語料庫線上版,其 語料尚未做分詞處理,檢索系統以漢字為基本單位,本文從其中搜索得到 506089 筆語料,選取前 400 筆「好」語料進行分析,刪除問句或對話中無 附帶語義的「好」,其中313 筆為有效語料。
3.聯合知識庫
除了現代漢語平衡語料庫和北京大學現代漢語語料庫之外,本文選擇聯 合知識庫作第三個語料來源,原因在於其提供篇章段落形式的上下文,此特 點有益於本文篇章部分的研究。
「聯合知識庫」蒐羅的語料來自聯合報、經濟日報、民生報(民生報資 料至2006/11/30 止)、聯合晚報及星報(星報資料至 2006/10/31 止)等五大 報在過去五十年來共發行了一百卅萬個報紙版面、一千多萬則新聞、七十餘 億個字。筆者為非會員,故僅可搜索過去七天的新聞內容,蒐集時間從2007 年11 月初至 2008 年 1 月底,一共 400 筆包含「好」的語料,刪除「好不好」、
「好嗎」、名稱抬頭包含「好」等語料,一共357 有效語料。
以上三語料庫為本文書面語料的來源,下文將接續介紹本文主要口語語 料的來源:網路小說(包括現代小說及早期名家小說)和 YouTube 網站上 的訪談節目,包括「2100 全民開講」、「沈春華 LifeShow」等,透過記錄節 目中主持人與來賓互動所產生的即興語言,擷取本文所需之相關口語語料。
4.網路小說
本文發現部分網路小說口語性相當強,幾乎由對話所構成。因此,本文 挑選幾部對話性較強的作品,包括席娟、亦舒、巴金與錢鍾書的作品,從中
蒐集「好不好」、「好嗎」與在對話中的「好」之語料,以利第四章語料分析、
統計與驗證。
5.YouTube 網站
YouTube 是美國知名影片分享網站,其網站標語為「傳播自己(Broadcast Yourself)」,此網站主要的功用是讓部落格的使用者透過引用的方式,來引 用其他人在YouTube 所分享的影音素材。因此,在 YouTube 上,我們可搜 尋到很多口語語料,且方便研究者將相關語料轉寫記錄下來。