• 沒有找到結果。

第一章 緒論

第四節 名詞釋義

壹、基模

基模(Schemata)是心理學家 Bartlett 所提出的專有名詞,Bartlett 的定義為

「基模是對於過去反應或經驗的活動性結構(an active organization of past reaction or past experience)」(Bartlett, 1932)。Rumelhart(1977)認為基模是先備知識結構,

所謂的先備知識結構指的是呈現記憶裡的概念時所需要的資料結構。知識結構除 了對象的訊息之外,此知識的運用方法也在內,透過經驗或學習存放在記憶裡的 知識結構即為先備知識結構。

基模可以分成兩種,一種是形式基模(formal schemata)。每篇文章具有固定 的篇章結構(rhetorical structure)以及體裁(genre)等形式上的特徵。我們可以 依據形式上的特徵判斷文章的種類。只要知道文章的種類,我們能夠使用與文章 種類有關的知識,更快速地達成閱讀目標。達成閱讀目標的過程當中我們所使用 的與文章形式有關的知識結構即謂「形式基模」;另一種是內容基模(content schemata),內容基模是與文章內容有關的背景知識結構。與文章的形式無關,讀 者只要具備與文章內容有關的知識,即能更快速地達成閱讀目標,屬於此類型的 知識結構即可謂內容基模。本研究將關注的部分為內容基模與閱讀的關係。

貳、輸入強化

為了讓學習者能夠關注教育目標項目,使用不同的方法操作學習文本或資料,

讓教育目標項目變得更凸顯的教育介入,即謂輸入強化(Smith, 1993)。輸入強化 的方法可以分成兩種(Long, 1990)。一種是「Focus on formS」。Focus on formS 將 意思與形式分開,讓學習者僅關注形式的部分。例如,教師對於語法規則的解釋 屬於 Focus on formS。另一種是「Focus on form」。Focus on form 讓學習者同時關

注意思與形式的部分。例如,大劑量輸入(input flood)、輸入處理(input processing)、 文本增顯(textual input enhancement)等皆屬於 Focus on form。本研究將關注的 部分為文本增顯與閱讀的關係。

參、自然語言處理

一、自然語言處理

人類根據已有的知識結構創造的語言叫做「人工語言(constructed language)」。 相對的,人類在日常生活當中使用的語言則稱為「自然語言(natural language)」。 自然語言處理研究的內容是對自然語言加以適當的處理,使電腦理解人類的語言,

實現人與電腦之間的有效溝通。

二、中文斷詞

以空格區分不同獨立詞彙的作業叫作中文斷詞。電腦理解人類語言的作業,

均是由斷詞作業開始,因此自然語言處理領域斷詞作業是一個基本的程序。因為 中文與其他語言不同,詞間沒有留空格,所以在中文自然語言處理領域,斷詞是 既不可缺少也難以實現的作業(Huang, Chen & Chang, 1997)。本研究將關注統計 式斷詞法-圖形理論(graph theory)、隱藏式馬可夫模型(hidden markov model)

與維特比演算法(viterbi algorithm)。

三、關鍵詞擷取

關 鍵 詞 擷 取 技 術 是 在 資 訊 檢 索 ( information retrieval )、 文 本 分 類 ( text categorization)、話題檢測(topic detection)、文件摘要(document summarization)

等的文字探勘(text mining)領域裡為了擷取文本的主要屬性而使用的技術方法。

電腦根據特定的模型計算文本中詞彙的重要度,再以重要度的排序決定該文本的 關鍵詞。本研究將關注 TF-IDF 模型(term frequency-inverse document frequency model)。

四、Python & Jieba

Python 是在 1989 年由吉多·范羅蘇姆開發的一種物件導向(object-oriented programming)、直譯式(interpreted)電腦程式語言。Python 提供強大的標準程式 庫(standard library)與第三方程式庫(third-party library)。Jieba 即是 Python 第 三方庫的一個模組。它支援中文自然語言處理的斷詞功能以及關鍵詞擷取功能,

適合當作本研究華語閱讀輔助工具之重點開發模組。

相關文件