本稿における 2003 学年度のデータの電子化に当たっては「台湾人 日本語学習者作文データベースの作成と分析」(住友財団)の助成を 受けた。また、2003 学年度のデータのタグ処理および 2006、2007 学年度のデータは「台灣學生日文作文錯誤分布傾向與誤用分析:以語 料庫與認知語言學為本」(行政院国家科学委員会 95 年度專題研究 計画番号:NSC 95-2411-H-006-015-MY2)の研究成果の一部である。
そして、2008 学年度に収集されたデータは「日語語詞搭配研究—以 學習者語料庫、自然語料庫、平行語料庫為本」(行政院国家科学委員 会 97 年度專題研究 計画番号:NSC 97-2410-H-006 -058)の、中間 段階における成果の一部である。なお、「台湾人日本語学習者コーパス」
(CTLJ)1のトップページおよびシステムの一部は「多國語言語料庫之 建構與研究」(国立成功大学「發展國際一流大學及頂尖研究中心計畫」
人文社会科学領域整合型ランドマーク計畫 計画番号:R021)の助 成を受けている。
「台湾人日本語学習者コーパス」は学習者の誤用についての研究お よび日中対照研究を目的として、台湾で日本語を学ぶ学生の作文を収 集し、それをタグ付きで電子化し、コーパスにしたものである。こ の研究で対象とした日本語学習者は、JFL(Japanese as a Foreign Lan-guage)環境、つまり日本以外の場所で日本語を外国語として学習して いる学習者であり、台湾各地の大学に亘っている。具体的なデータ収 集の概要については第 2 章を参照されたい。本稿を執筆している時点 において、コーパス内検索が可能なタグ付き修正文は 2003 年 9 月か ら 2004 年 6 月までに集めたものと 2006 学年度前期分データに限ら
1 CTLJ はthe Corpus of Taiwanese Learner of Japaneseの略称である。
れる2。その後に集めた台湾大学、東呉大学、淡江大学、東海大学、高 雄第一科技大学、文藻学院、義守大学、静宜大学、中国文化大学、屏 東商業技術学院、銘傳大学、成功大学などの学習者の作文に関しては、
一定量の収集は終了しているものの、現在まだ添削と電子化作業の段 階にある。
一連のプロジェクトを始めるに至った理由は、国立国語研究所によ る「作文対訳データベース」や、大曾らを中心とする「日本語学習者 の作文コーパス:電子化による共有資源化」などの学習者コーパスに は台湾人学習者のデータが少なく、前者の「日本語学習者による日本 語作文と、その母語訳との対訳データベースver.2 正式公開版」は 10 種の言語資料を収集し、そのうち中国語資料は 89 篇あるが、台湾人 学習者の作文は 3 篇のみで、全体の僅か 3 パーセントを占めるにと どまり、後者の研究は全て英語圏の学生による作文であるためであっ た。現場において日本語教育に携わる者としてその不備を痛感し、もっ ぱら台湾人学習者による作文を集め、その本格的なコーパスを構築し、
台湾人学習者のみを対象とした誤用研究を行うことにしたのである。
本稿は、この「台湾人日本語学習者コーパス」の構築にかかわる具体 的な諸問題の考察だけでなく、そこに収録された長期的なデータをも とに量的分析および認知的な観点による質的分析を行うことを目的と している。この基礎作業が台湾における日本語教育に些かなりとも貢 献できれば幸いである。
本稿の構成は、Ⅲ部 9 章からなっている。まず第Ⅰ部第 1 章では、
本稿の方法論に関する中間言語研究、認知言語学と外国語習得、およ びコーパス言語学の分野における先行研究を概観する。第Ⅱ部では「台 湾人日本語学習者コーパス」の構築と量的分析を行う。第 2 章は本コー
2 2006年度前期までに収集された計677篇の作文はタグ付き作業が終了し、その 試行版はインターネット上で利用可能である<http://corpora.flld.ncku.edu.tw/>。
パスの構築に関する報告である。 本稿の現在までのデータがどのよ うに収集され、そのデータにどのような電子化処理を行ったかについ て説明し、また本稿におけるコーパスの作成技術についても報告する。
第 3 章と第 4 章は、SPSS による本コーパスの量的分析および形態素 の語類に関する報告である。
第Ⅲ部は本コーパスに関する質的分析である。台湾における日本語 学習者の誤用例を取り上げ、誤用の傾向および発生要因についての分 析を試みる。受身、動詞の自他、可能表現およびテ形に接続する補助 動詞に関する先行研究は、それぞれを取り扱う章、すなわち第 5 章 から第 8 章で言及する。まず第 5 章では、本コーパスに見られる受身、
動詞の自他、可能表現に関する誤用分析を行う。第 6 章では、授受 表現を表す補助動詞と「てしまう」「てみる」「ておく」に関する誤用 の傾向および発生要因について分析を行う。第 7 章では、「ている」、
「てある」に関する誤用分析を試みる。第 8 章では、黄(2006)にお ける文法化(grammaticalization)の研究を踏まえて、「てくる」「ていく」
に関する誤用を検討する。第 6 章〜第 8 章で検討するテ形に接続す る補助動詞については、文法化の各段階をパラメータとした誤用の位 置づけについてもそれぞれ考察し、最後に上述の 8 章のまとめとして、
結論を述べる。
なお、第 2 章の内容は『2007 年日語教學國際會議論文集』に掲載 した論文、2008 年に『東呉大学LARP at SCU 研究工作坊(二)』で 発表した内容、および『台灣日本語文學報』第 25 号に掲載した論文 に新たなデータを加え、大幅に修正・加筆したものである。第 5 章は『台 灣日本語文學報』第 20 号に掲載した論文、第 6 章は 2007 年に元智 大学で発表したもの、第 8 章は『台灣日本語文學報』第 22 号に掲載 した論文に大幅に加筆したものである。なお、本稿は国立成功大学人 文学および社会科学領域における専門書の出版補助を受け、『外国語
としての日本語の習得研究─「台湾人日本語学習者作文コーパス」の 構築と分析を中心に─』に新たなデータを加え、修正したうえで、正 式に出版するものである。