• 沒有找到結果。

データの電子化

─データの収集および電子化と作成技術を中心に─

3.  データの電子化

収集された作文は手書きであるため、電子化のための作業を必要 とする。その作業として、まずは作文のテキスト入力を行った。ま た収集された作文には、教師による添削が行われる11。そしてその添 削は、手書きによるものであるので、電子化のためのもう一つの作 業として、教師による添削情報にタグを付加する作業を行う。

3.1 柳田(2006)におけるタグセット

本稿におけるタグおよびそのセットは柳田(2006)を参考と した。柳田(2006)のタグは SGML12を参考にし、教師によって 添削された箇所を、開始タグ「< >」と終了タグ「</>」で挟み込 む形をとっている。またタグとしては添削情報に対応させて①置 換・削除・挿入を示す「< ></>」、②他候補の「<op></>」、③移動 の「<m1><m1/><m1@>」、④コメントの「<c1><c1/>」という 4 種 類、6 用法のセットが準備されている(pp. 65-66)。

これによれば、具体的な表示は次のようになる13。①の置換は

「【学】わかるようになった→【添】知ることになった→【タ】< 知 ること > わかるよう </> になった」、

削除は「【学】知らない話しがたくさん→【添】知らない話がたく さん→【タ】知らない話 < > し </> がたくさん」、

挿入は「【学】終わってしまったけれども→【添】終わってしまっ

11 2003学年度のデータにおける作文には、教師による添削が完成した。またそ の他の作文については、添削が行われている最中である。

12 SGML(Standard Generalized Markup Language)はテキストに付加情報を記述 するためのメタ言語である。

13 以下の【学】は学習者の作文、【添】は教師の添削、【タ】はタグを表す。

また④コメントの【添】の「[ ]」は、教師からのコメント内容を表す。なお、

これらの例は柳田(2006)の表3より(p. 65)。

たのですけれども→【タ】終わってしまった < のです ></> けれども」

となる。

②他候補は「【学】強そうです→【添】強 そうです/いようです

→【タ】強 <op いようです > そうです </>」となる。

また③移動は「【学】まるで先輩と後輩の関係を上下の→【添】

先輩と後輩の関係をまるで上下の→【タ】<m1> まるで <m1/> 先 輩と後輩の関係を <m1@> 上下の」となる。

④コメントは「【学】持っているはずです。→【添】持ってい るようです。[論理的帰結]→【タ】持っている < よう ><c1> はず

<c1/></> です。「文末に」コメント 1:論理的帰結」となる14

3.2 本稿におけるタグセット

本稿においては、上記のタグとその形式を参考にしたが、新た にいくつかのタグを加え、7 種類、9 用法のタグセットとした。ま たタグは柳田(2006)と同様に、開始タグ「< >」と終了タグ「</>」

で挟み込む形とした。本稿におけるタグセットの詳細を表 8 に示す。

表8. 本稿におけるタグセットの詳細

タグ番号 添削種類 記号 記号の意味

1 置換 < ></>

2 削除 < ></>

3 挿入 < ></>

4 削除可 <de></> deletable 5 移動 <m1><m1/><m1@> move 6 意味不明 <uk></> unknown

1 4 ③ 移 動 と ④ コ メ ン ト に つ い て は 、 「 <m 2 > < m 2 / > < m 2 @ > 」

「<m3><m3/><m3@>」や「<c2><c2/>」「<c3><c3/>」と、添削によってその数を 増やすことが可能である。

7 他候補 <pr></> preferable 8 複数提示 <or></> or 9 コメント <c1><c1/>[] comment

具体的には、(1)置換、(2)削除、(3)挿入を「< ></>」、(4)

削除可(教師が「( )」などで示した削除可能な部分)を「<de></>」、(5)

移動を「<m1><m1/><m1@>」、(6)意味不明(教師が下線などで「?」

と示した意味不明の部分)を「<uk></>」、(7)他候補を「<pr></>」、

(8)複数提示(教師が下線などを引き、その部分に複数の訂正候 補を提示している部分)を「<or></>」、(9)コメント(教師による コメント部分)を「<c1><c1/>[ ]」とした。

(1)から(3)および(5)、(7)、(9)については、柳田(2006)

と同様の添削情報の付加形式である。また(5)、(9)について も、「<m2><m2/><m2@>」「<m3><m3/><m3@>」や「<c2><c2/>[ ]」

「<c3><c3/>[ ]」ように、添削によってその数を増やして行くこと を可能にした。(7)他候補ついては、柳田(2006)は「<op></>」

とし、本研究では「<pr></>」としたが、表記の違いはあるものの、

添削情報の付加形式は同様である。また、柳田(2006)は「強

<op いようです > そうです </>」と表記しているが、これは「強

<op そうです > いようです </>」の誤りであると思われる。なお、

(9)コメントについても付加形式は同様であるが、表 8 のように

「<c1/>」のすぐ後ろに「[ ]」を挿入し、その中に以下の(a)から(c)

の順番でコメント内容を付加することとした。

(a) 「文頭に」「文中に」「文末に」「文の前半に」「文の後半に」「文 全体に」「段落に」「作文全体に」のコメントの位置を付加する。

(b)コメントの位置の後ろに半角の「:」を付加する。

(c)「:」の後ろに添削者が示したコメント内容を付加する。

また文末に終了タグ「</>」を付加する場合、「。」「!」「?」「.」

「・」「・・・」などの文末最終記号は「</>」の後ろに挿入することと した。これは一文の終わりをこれらの記号でマークアップし、検 索結果を表示させるためである。

以下に具体例を述べる。(1)から(3)の置換、削除、挿入と

(5)移動の例は、柳田(2006)と同様である。その他のタグにつ いて、(4)削除可は「【学】昨日、遠東というデパートへ行った。

→【添】昨日、遠東(という)デパートへ行った。→【タ】昨日、

遠東 <de> という </> デパートへ行った。」となる。(6)意味不明 は「【学】今日は 6 時に起きた。そしてテレビは面白くないから、

今日はいい天気になるといい。→【添】今日は 6 時に起きた。そ してテレビは面白くないから、今日はいい天気になるといい。? →

【タ】今日は 6 時に起きた。そして <uk> テレビは面白くないから、

今日はいい天気になるといい </>。」となる。また作文に空白があっ た場合も(6)を用いて「【学】昨日帰る時、  を拾いました。→【添】

昨日帰る時、    ? を拾いました。→【タ】昨日帰る時、<uk>

□□□ </> を拾いました。」とする。そして空白部分には「□」を 3 つ挿入する。(7)他候補は「【学】来週の試合相手は、私たちの チームより強いようです。→【添】来週の試合相手は、私たちの チームより強 そうです/強いようです→【タ】来週の試合相手は、

私たちのチームより <pr 強そう > 強いよう </> です。」となる。(8)

複数提示は「【学】A 店へ行ったときには、毎次この料理を食べま す。→【添】A 店へ行ったときには、毎次いつも、毎回この料理を食べ ます。→【タ】A 店へ行ったときには、< いつも or 毎回 > 毎次 </>

この料理を食べます。」となる。(9)コメントは「【学】」10 年ぶ りに昔の恋人に会って、おしゃべりをしました。そして私はある ことを知りました。彼はもう結婚したようです。→【添】(前略)

彼はもう結婚したようです。 コメント:結婚したことについて、

あなたは彼から直接聞いたのですか。それともあなたがそう感じ たのですか。直接聞いたのなら「そう」を使ってください。また あなたがそう感じたのなら「よう」を使ってください。→【タ】(前略)

彼はもう結婚した <c1> よう <c1/>[ 文末に : 結婚したことについて、

あなたは彼から直接聞いたのですか。それともあなたがそう感じ たのですか。直接聞いたのなら「そう」を使って下さい。またあ なたがそう感じたのなら「よう」を使って下さい。] です。」となる。

なお、これらのタグは複合的な付加も可能である。例えば(3)

挿入と(4)削除可を組み合わせて「【学】子どもの頃、よく砂で 城を作りました。→【添】子どもの頃、よく砂で(お)城を作り ました。→【タ】子どもの頃、よく砂で <<de> お </>></> 城を作り ました。」のように、添削のされ方によってタグを柔軟に組み合わ せて使用することが可能である。