─データの収集および電子化と作成技術を中心に─
3. データの電子化
収集された作文は手書きであるため、電子化のための作業を必要 とする。その作業として、まずは作文のテキスト入力を行った。ま た収集された作文には、教師による添削が行われる11。そしてその添 削は、手書きによるものであるので、電子化のためのもう一つの作 業として、教師による添削情報にタグを付加する作業を行う。
3.1 柳田(2006)におけるタグセット
本稿におけるタグおよびそのセットは柳田(2006)を参考と した。柳田(2006)のタグは SGML12を参考にし、教師によって 添削された箇所を、開始タグ「< >」と終了タグ「</>」で挟み込 む形をとっている。またタグとしては添削情報に対応させて①置 換・削除・挿入を示す「< ></>」、②他候補の「<op></>」、③移動 の「<m1><m1/><m1@>」、④コメントの「<c1><c1/>」という 4 種 類、6 用法のセットが準備されている(pp. 65-66)。
これによれば、具体的な表示は次のようになる13。①の置換は
「【学】わかるようになった→【添】知ることになった→【タ】< 知 ること > わかるよう </> になった」、
削除は「【学】知らない話しがたくさん→【添】知らない話がたく さん→【タ】知らない話 < > し </> がたくさん」、
挿入は「【学】終わってしまったけれども→【添】終わってしまっ
11 2003学年度のデータにおける作文には、教師による添削が完成した。またそ の他の作文については、添削が行われている最中である。
12 SGML(Standard Generalized Markup Language)はテキストに付加情報を記述 するためのメタ言語である。
13 以下の【学】は学習者の作文、【添】は教師の添削、【タ】はタグを表す。
また④コメントの【添】の「[ ]」は、教師からのコメント内容を表す。なお、
これらの例は柳田(2006)の表3より(p. 65)。
たのですけれども→【タ】終わってしまった < のです ></> けれども」
となる。
②他候補は「【学】強そうです→【添】強 そうです/いようです
→【タ】強 <op いようです > そうです </>」となる。
また③移動は「【学】まるで先輩と後輩の関係を上下の→【添】
先輩と後輩の関係をまるで上下の→【タ】<m1> まるで <m1/> 先 輩と後輩の関係を <m1@> 上下の」となる。
④コメントは「【学】持っているはずです。→【添】持ってい るようです。[論理的帰結]→【タ】持っている < よう ><c1> はず
<c1/></> です。「文末に」コメント 1:論理的帰結」となる14。
3.2 本稿におけるタグセット
本稿においては、上記のタグとその形式を参考にしたが、新た にいくつかのタグを加え、7 種類、9 用法のタグセットとした。ま たタグは柳田(2006)と同様に、開始タグ「< >」と終了タグ「</>」
で挟み込む形とした。本稿におけるタグセットの詳細を表 8 に示す。
表8. 本稿におけるタグセットの詳細
タグ番号 添削種類 記号 記号の意味
1 置換 < ></>
2 削除 < ></>
3 挿入 < ></>
4 削除可 <de></> deletable 5 移動 <m1><m1/><m1@> move 6 意味不明 <uk></> unknown
1 4 ③ 移 動 と ④ コ メ ン ト に つ い て は 、 「 <m 2 > < m 2 / > < m 2 @ > 」
「<m3><m3/><m3@>」や「<c2><c2/>」「<c3><c3/>」と、添削によってその数を 増やすことが可能である。
7 他候補 <pr></> preferable 8 複数提示 <or></> or 9 コメント <c1><c1/>[] comment
具体的には、(1)置換、(2)削除、(3)挿入を「< ></>」、(4)
削除可(教師が「( )」などで示した削除可能な部分)を「<de></>」、(5)
移動を「<m1><m1/><m1@>」、(6)意味不明(教師が下線などで「?」
と示した意味不明の部分)を「<uk></>」、(7)他候補を「<pr></>」、
(8)複数提示(教師が下線などを引き、その部分に複数の訂正候 補を提示している部分)を「<or></>」、(9)コメント(教師による コメント部分)を「<c1><c1/>[ ]」とした。
(1)から(3)および(5)、(7)、(9)については、柳田(2006)
と同様の添削情報の付加形式である。また(5)、(9)について も、「<m2><m2/><m2@>」「<m3><m3/><m3@>」や「<c2><c2/>[ ]」
「<c3><c3/>[ ]」ように、添削によってその数を増やして行くこと を可能にした。(7)他候補ついては、柳田(2006)は「<op></>」
とし、本研究では「<pr></>」としたが、表記の違いはあるものの、
添削情報の付加形式は同様である。また、柳田(2006)は「強
<op いようです > そうです </>」と表記しているが、これは「強
<op そうです > いようです </>」の誤りであると思われる。なお、
(9)コメントについても付加形式は同様であるが、表 8 のように
「<c1/>」のすぐ後ろに「[ ]」を挿入し、その中に以下の(a)から(c)
の順番でコメント内容を付加することとした。
(a) 「文頭に」「文中に」「文末に」「文の前半に」「文の後半に」「文 全体に」「段落に」「作文全体に」のコメントの位置を付加する。
(b)コメントの位置の後ろに半角の「:」を付加する。
(c)「:」の後ろに添削者が示したコメント内容を付加する。
また文末に終了タグ「</>」を付加する場合、「。」「!」「?」「.」
「・」「・・・」などの文末最終記号は「</>」の後ろに挿入することと した。これは一文の終わりをこれらの記号でマークアップし、検 索結果を表示させるためである。
以下に具体例を述べる。(1)から(3)の置換、削除、挿入と
(5)移動の例は、柳田(2006)と同様である。その他のタグにつ いて、(4)削除可は「【学】昨日、遠東というデパートへ行った。
→【添】昨日、遠東(という)デパートへ行った。→【タ】昨日、
遠東 <de> という </> デパートへ行った。」となる。(6)意味不明 は「【学】今日は 6 時に起きた。そしてテレビは面白くないから、
今日はいい天気になるといい。→【添】今日は 6 時に起きた。そ してテレビは面白くないから、今日はいい天気になるといい。? →
【タ】今日は 6 時に起きた。そして <uk> テレビは面白くないから、
今日はいい天気になるといい </>。」となる。また作文に空白があっ た場合も(6)を用いて「【学】昨日帰る時、 を拾いました。→【添】
昨日帰る時、 ? を拾いました。→【タ】昨日帰る時、<uk>
□□□ </> を拾いました。」とする。そして空白部分には「□」を 3 つ挿入する。(7)他候補は「【学】来週の試合相手は、私たちの チームより強いようです。→【添】来週の試合相手は、私たちの チームより強 そうです/強いようです→【タ】来週の試合相手は、
私たちのチームより <pr 強そう > 強いよう </> です。」となる。(8)
複数提示は「【学】A 店へ行ったときには、毎次この料理を食べま す。→【添】A 店へ行ったときには、毎次いつも、毎回この料理を食べ ます。→【タ】A 店へ行ったときには、< いつも or 毎回 > 毎次 </>
この料理を食べます。」となる。(9)コメントは「【学】」10 年ぶ りに昔の恋人に会って、おしゃべりをしました。そして私はある ことを知りました。彼はもう結婚したようです。→【添】(前略)
彼はもう結婚したようです。 コメント:結婚したことについて、
あなたは彼から直接聞いたのですか。それともあなたがそう感じ たのですか。直接聞いたのなら「そう」を使ってください。また あなたがそう感じたのなら「よう」を使ってください。→【タ】(前略)
彼はもう結婚した <c1> よう <c1/>[ 文末に : 結婚したことについて、
あなたは彼から直接聞いたのですか。それともあなたがそう感じ たのですか。直接聞いたのなら「そう」を使って下さい。またあ なたがそう感じたのなら「よう」を使って下さい。] です。」となる。
なお、これらのタグは複合的な付加も可能である。例えば(3)
挿入と(4)削除可を組み合わせて「【学】子どもの頃、よく砂で 城を作りました。→【添】子どもの頃、よく砂で(お)城を作り ました。→【タ】子どもの頃、よく砂で <<de> お </>></> 城を作り ました。」のように、添削のされ方によってタグを柔軟に組み合わ せて使用することが可能である。