• 沒有找到結果。

文章概念結構

在文檔中 中文主題詞辨識與其應用 (頁 56-62)

第四章 作文主題分析與應用

4.4 文章概念結構

長句主題詞除了可作離題偵測外,還可勾勒出文章的結構。我們可利用辨 識出的長句主題詞與其概念,畫出文章敘述的結構圖,如下圖 4-6 所示。

長句主題詞:總統Æ美國Æ方向Æ美國Æ美國Æ創投Æ人才Æ美國Æ人才

總統 美國 1 方向 2

創投 3

人才

圖 4-6: 社論文章之結構圖

圖 4-6 的社論由美國布希「總統」提出國情咨文開始,敘述「美國」對經濟 持續開放的立場,包含對於租稅「方向」朝鼓勵創投之優惠減免措施,故「美國」

才能維持蓬勃的「創投」活動。但隨著全球科技「人才」的短缺,「美國」勢必 也將會受其限制,故必須提早因應人才不足的問題。我們的科技研發雖已漸受重 視,但「人才」的培養則仍待各個政府部門提早整合規劃。

根據圖 4-6,社論文章的結構上有許多重複的主題,例如「美國」與「人才」

就在結構圖中重複到訪兩次以上,這顯示社論的文章結構較為嚴謹。而在學生作 文中,高分作文的結構理應要比低分作文嚴謹,我們從「最上一層樓」抽取數篇 高分與低分作文來觀察其結構。

富翁

房屋 Æ 地基 Æ 基石 Æ 學習 Æ 故事 Æ 羅馬 大樓 Æ 工人

圖 4-7: 18 分作文 A 之結構圖

如圖 4-7 顯示 A 的第一段由「富翁」破題,第二段敘述「房屋」的「地基」

與「基石」重要性(「地基」與「基石」概念相同),對應「學習」也是需要基礎 的,「故事」就是想告訴我們「羅馬不是一天造成的」,之後第三段回到「大樓」

也不是一天就可以蓋好,建築「工人」們沒有基石不可能蓋成,唯有一步步腳踏 實地才能達成。其中「大樓」與「房屋」概念相同。

富翁 Æ 房屋 地基 Æ 富翁

青年 Æ 二樓 Æ 腳印

圖 4-8: 17 分作文 B 之結構圖

圖 4-8 顯示作文 B 以「富翁」破題,並講述「房屋」與「地基」的關係,

之後回到「富翁」沒有地基不可能蓋成樓房,末段呼籲現代「青年」若想築高樓,

絕不可忘記「一、二樓」的重要,要「一步一腳印」地紮實基礎。

平地 Æ 富翁 Æ 下場 Æ 地基 Æ 學子 Æ 基礎 Æ 富翁

圖 4-9: 17 分作文 C 之結構圖

圖 4-9 中,作文 C 以「萬丈高樓平地起」破題,敘述「富翁」與其「下場」

肯定是高樓塌陷,因為忘記了「地基」的重要。最後呼籲「學子」,一定要從「基 礎」做起,不可如「富翁」想一步登天。

以下我們舉三個低分文章的例子:

長句主題詞:爸Æ地方Æ景色Æ天空Æ時候Æ時候 爸 Æ 地方

景色 Æ 天空 時候 Æ 時候

圖 4-10: 2 分作文 D 之結構圖

圖 4-10 中,作文 D 開頭是「爸」養了一隻畫眉鳥,之後與爸回到鄉下「地 方」,看見美麗的「景色」與「天空」,以及描述白天與夜晚「時候」的鄉間風景。

意義 叢林

工程 Æ 讀數字

圖 4-11: 5 分作文 E 之結構圖

圖 4-11 中,作文 E 開頭敘述萬丈高樓平地起的「意義」,並以自己生活在

「都市叢林」中,許多的建築「工程」都必須先做好基礎,最後以「讀數字」為 例,必須要先看懂數字,才能作四則運算。

本能 米粒 人

圖 4-12: 3 分作文 F 之結構圖

圖 4-12 中,作文 F 開頭以我們人類的「本能」是要腳踏地上才有安全感,

並舉自己在高樓的經驗,看見如「米粒」般的地上景物,便恐懼起來,所以「人」

不能築太高的高樓,否則恐懼便會揮之不去。 重複到訪主題的作文平均分數(8.96 分),比含有重複到訪主題的平均分數(10.37 分)要低,且 16~18 分的作文 6 篇中 5 篇都含有重複到訪主題,0~3 分的作文則

表示描述主要主題之後,間隔 2 長句以上才回到原本主要主題,這中間的間隔可 以是引名言、例證等強調主題,可以是多方取材而造成重複到訪主題的距離增 加,故其平均分數(10.93 分)明顯比距離小於 2 的平均分數(9.52 分)要高。

而在未含重複到訪主題者,若含連續主題,其平均分數(10.29 分)明顯比未 含連續主題者的平均分數(8.76 分)高,且也比含重複到訪主題但距離小於 2 者(平 均分數 9.52 分)稍高一些,表示含連續主題比未含連續主題者的結構嚴謹,且與 其說沒兩句話就重回重要主題,不如對重要主題繼續加以強調來得較佳。

在「我發明了一種藥」的語料中,8 篇作文中共 3 篇含有多個重複到訪主題,

皆為 6 級分。而含單一重複到訪主題者有 3 篇,分別為 6 級分(距離=1)、4 級 分(距離=2)與 3 級分(距離=1)。未含重複到訪主題但含連續主題者有 2 篇,

皆為 5 級分。除了到訪距離<=2 中有一篇 6 級分之外,大致上符合我們的假設:

多重複到訪主題 > 單重複到訪主題(距離>2) = 連續主題 > 單重複到訪主題 (距離<=2) > 無到訪主題且無連續主題。

除了觀察有無重複到訪主題之外,我們還可觀察相鄰主題之間的推導關 係。我們將相鄰的三個主題組成三組主題推導,例如主題串 A→B→C 可組成 A

→B、B→C 、A→C 三組推導。之後我們統計主題推導的出現次數,如下表 4-6 所示。

表 4-6:「最上一層樓」主題推導之統計次數

全部作文 高分作文 (16 分以上) 低分作文 (3 分以下) 主題配對 出現次數 主題配對 出現次數 主題配對 出現次數 樓房→地基 11 樓房→地基 4 富翁→身心 2

樓房→人 8 樓房→工匠 2 故事→慾望 2 人→富翁 7 樓房→道理 2 凡事→背後 2 富翁→人 6 事→樓房 2 富翁→美景 1 富翁→樓房 6 下場→地基 2 富翁→職業 1

我們可以發現主題「樓房」後常接另一個主題「地基」,因引導文之本意便

是要學生瞭解建築「樓房」最需要的是底層厚實的「地基」。在全部作文中,「樓 房→地基」出現了 11 次,其中 4 次出現在高分作文,而低分作文則完全沒有「樓 房→地基」的推導存在。

而在「我發明了一種藥」的語料中,由於作文並未強調要發明何種藥,可 以任憑學生自由發揮,未如「最上一層樓」有明確的目的:要學生理解「樓房」

與「地基」之間的關係,且語料亦僅有 8 篇作文,因此在表 4-7 中並未產生較有 實質意義的主題推導出現。

表 4-7:「我發明了一種藥」主題推導之統計次數 主題配對 出現次數

事情→藥 3

地球→藥 2

藥→病人 2

藥→瘡 2

藥→大地 2

在文檔中 中文主題詞辨識與其應用 (頁 56-62)

相關文件