• 沒有找到結果。

結論與未來展望

在文檔中 部落格文章寫作輔助系統 (頁 11-50)

1.3 論文架構

第一章:緒論,快速簡單的介紹論文研究的動機,以及探討期望的目的。

第二章:相關研究,說明自然語言領域中關於文本資料處理的研究,以及概 述本論文中所使用的技術背景知識。

第三章:系統設計,將整個論文研究的每一部分和環節作完整詳細的解說,

包含詞句重點的萃取、資料文本的蒐集、提示句子的產生與分類。

第四章:實驗結果與討論,根據論文研究所提出的理論實作系統,實際尋找 人員操作系統並紀錄寫作時間和使用者評價,最後探討實驗數據所 呈現的分布結果和原因。

第五章:結論與未來展望,對整個論文研究作總結統整,並且提出結論與未 來系統研究的方向。

4

第二章、相關研究

2.1 文章斷詞與詞性標記

對於電腦而言,文章僅是一堆代碼與符號的組成,實際上電腦並不懂得其中 所代表的真正涵意,更遑論分析文章中的重點為何。因此,在自然語言處理的相 關應用領域中,文章斷詞與詞性標記的工作是一項重要且不可或缺的部分。舉凡 是機器翻譯、語言分析、摘要製作和資訊擷取等研究,都需要先將文章經過斷詞 處理,萃取出較小且有意義的單位詞,而後才能利用數學統計的模型,進而找出 文章重點詞彙的所在。

由於中文語言的特性,句子中所組成的各詞之間是相互連續直到結束或遇到 標點符號為止,並沒有如英語文章般詞與詞之間會透過空格單元分別開來,所以 在斷詞處理的比較上,中文遠比英語要來的困難許多。下列將舉一簡單例子說明 中文斷詞處理的工作。

欲處理的原始句:今天天氣真好。

可能的斷詞結果:[今] [天] [天] [氣] [真] [好]。

[今天] [天] [氣] [真] [好]。

[今天] [天氣] [真好]。

[今天天氣] [真好]。

正確的斷詞結果:[今天] [天氣] [真] [好]。

由上述例子中,可以 觀察到中文斷詞的組合千變萬化,若斷詞的結果造成錯 誤,將使得語意上的解釋迥然不同,並且嚴重的影響後續研究的成果。因此,

我們將藉由使用中央資訊科學研究所詞庫小組中文斷詞系統[3],完成斷詞與 詞性標記的工作,經過分析統計其斷詞結果的正確率可高達95%。

5

2.2 人機介面

工程師在開發軟體的同時,時常會忽略使用者介面設計的重要性。其中人機 介面的核心概念即為Usability,簡而言之,就是探討使用者運用系統提供的功 能達到目的的難易程度。一個堪稱為好的系統,除了能提供完善的服務外,人機 介面的設計同樣需要經過謹慎妥當的考量。因此,於本篇研究中,使用者的操作 介面亦是我們探討的重點之一。

自古以來,人們就習慣於使用筆書寫文章,若系統能提供以手寫筆為輸入媒 介,使用者便可以最熟悉的方式來完成文章的寫作,簡單快速的輸入文字。因此,

平日不熟悉使用電腦鍵盤的族群,就不需花費大量時間於尋找文字按鍵的位置,

可以專注於文章的創作;對於長期使用鍵盤為輸入的人們,亦是一個可以練習文 字書寫的好機會。

目前市面上最為廣泛使用的手寫輸入裝置為平板電腦[4][5],使用者可以透 過觸控筆來進行系統的操作。原理共分為三種:電阻式、電容式和電磁式,其中 電磁式是現今手寫裝置主要的運用理論,方法為電腦中的數位板會於螢幕的表面 產生微弱的磁場,而這種磁場僅會對觸控筆中的裝置發生作用。所以,只有當觸 控筆於螢幕表面上移動或點擊時,數位板才會進行快速的定位,並且通知作業系 統完成滑鼠相對應的動作。

近幾年,由任天堂株式會社所開放的電玩手把,Wii Remote,利用紅外線定 位與藍芽傳輸技術,當玩家握住手把操作時,使用者的動作將會同步對應到遊戲 中角色的動作,其主機暢銷成功的原因即是充分發揮人機互動的中心理念。然而,

考慮該手把背後欲傳達的互動方式,若將手把對應成筆來寫字,亦不失為一種低 成本的手寫裝置。

6

由於Wii Remote所提供的硬體資源與易取得性,網路上有許多開發教學的文 章[6]和應用於電腦互動的實際案例,如:將手把模擬成電腦滑鼠或簡報筆使用。

實際上使用者所握的手把是紅外線接受器,當玩家揮舞動作時,手把從前方紅外 線發射器所偵測到的紅外線光源訊號就會改變位置,此時手把再透過藍芽傳輸將 資訊傳達給後方的遊戲主機或電腦處理,並產生相對應的畫面動作。

Johnny Chung Lee[7]針對手把的互動原理提出新穎的思維和改良方法,並 且成功的以電子白板系統展示說明改變後的好處。如圖2-1所示,原始的互動模 式為使用者握著手把揮舞動作,接收紅外線訊號,但長時間的握住手把懸空,容 易令人感覺到疲勞。如果手中握的是體積小且較輕的筆,使用者便可以長時間且 舒適的操作系統。因此,Johnny Chung Lee反其道而行,將發射器與接收器兩者 的動作互換過來 ,並且將紅外線發射器製作成筆的外型方便操作,其實驗結果於 網路上有大量的點閱率,甚至白板系統也被運用在學校課堂教學時使用。

圖2-1:Johnny Chung Lee的設計思維。

7

在文章寫作中,手寫文字是一項繁瑣卻無可避免的過程,如何能減少中間所 耗費的時間成本,可以藉由許多不同的手段達成。最簡單的方式即是提供手寫文 字辨識的功能,讓使用者不需要完整的輸入文字的所有筆畫。更為有效的方法則 是讓系統進一步的預測使用者接續欲輸入的文字,並且提供良好的介面讓使用者 能夠容易且快速的選取,Kurihara等人提出Speech Pen[8],即是以上述目的為 出發點的相關研究;以演講者的報告內容、電腦上的手寫文字作為基本資料,經 過文字和語音辨識的分析,系統會即時將有用的資訊建立至資料庫中,當演講者 在電腦上撰寫筆記和重點時,系統經過演算法的判斷處理尋找使用者可能要寫下 的句子,並提供手寫提示,節省使用者單純手寫文字所花費的時間,如下圖2-2 所示,當使用者僅寫下字串「Rec」時,系統經過即時判斷辨別出是欲寫的字為

「Recognition」或「Recommended」,以及後續分別可能使用的詞彙,「technology」、

「logic」等詞,方便使用者快速選取。

圖2-2:手寫辨識輔助提示。

2.3 文章輔助寫作系統

各式各樣的寫作輔助的工具陸續問世,針對不同的主題或領域,所提供的服 務功能或系統的呈現方式也許有所差異,但其本質和目的殊途同歸,皆是為撰寫 文章時給予使用者適當的寫作提示,幫助人們觸動寫作的靈感,讓文章的內容不 僅兼具深度和廣度,用字遣詞亦多變豐富。

8

WriteAhead[9]是一個論文摘要輔助寫作的系統,支援撰寫多達 11 種不同領 域的英文摘要,系統會依據使用者寫下文章和句子作為查詢依據,選擇適當的字 詞、片語、搭配詞和轉折語提供使用者撰寫摘要時多元的參考。另外,對於大部 分以英語為第二語言的人,往往在英語寫作上碰到不少問題,如:文章上下語意 不連貫、詞義不明、選詞不當、冠詞和時態的使用方法。因此,Ting Liu等人[10],

針對中文語言的使用者開發一套輔助系統,幫助人們學習英文句子正確的寫作方 式。微軟研究院所開發的線上英語寫作軟體1[11],如圖 2-3 展示,不僅包含拼 字與文法上的檢查服務,並且即時提供合適的寫作範例。

圖2-3:Microsoft Research ESL Assistant。

1 http://www.eslassistant.com

9

目前盛行的部落格網誌,亦有相關的輔助寫作工具。由 Tien-Chi Huang 等 人[12]發表的輔助系統,其功能為參照使用者曾經閱讀的文章和撰寫的網誌,進 行內容的分析,並且萃取出關鍵字串作為利用 Google Blog Search Engine[2]

搜尋資料的依據,最後將取得的相關文章顯示給使用者參考。與本研究最主要的 差異在於此輔助系統僅幫助使用者匯整關聯的網誌,並將整篇文章完整的顯示給 使用者參考,只提供整個段落的寫作範例。因此,使用者須在自行閱讀文章範例 後,才能找出對文章主題寫作有用的句子。而本系統則會於蒐集相關網誌後,對 文章做更深層的分析,並萃取出資料中可用的提示句予人參考,如:使用者寫下

「今天天氣很好」,則本系統會即時提供類似「我和家人決定一起到郊外踏青」、

「藍天白雲好漂亮」、「心情特別好」等寫作方向,而非描述有關「天氣好」的 整篇部落格文章。因此,使用者可以減少閱讀相關資料和融會貫通所需花費的大 量時間。另外,本系統以手寫辨識為輸入介面,並提供常用詞彙等功能,可以給 予使用者在撰寫文章時適當的輔助。

線上智慧型文章生成輔助系統[13],則是提供另一種輔助寫作的型式;透過 事先收集網路上大量的部落格文章,經過程式訓練產生文章生成的模型,而後使 用者僅需要選擇文章的主題概念,系統便會自動生成相關的文本提供使用者參考。

國外網站亦有類似功能的輔助寫作工具[14],藉由讓使用者手動填入主題和論點,

再以此資訊自動產生相關文章的內容,並提供文章細節修改。Kiyotaka Uchimoto 等[15]的研究論文,想法原理與線上智慧型文章生成輔助系統[13]類似,方法是 運用關鍵字為基礎資訊,並利用語料庫對每個關鍵字進行擴展,最後再根據詞彙 語意和相依關係組合擴展後的項目成為生成句子。

10

2.4 Support Vector Machine

支援向量機 (Support Vector Machine),由Vapnik等[16]於1995年根據統 計學習理論提出的方法,是目前表現較好的一種分類演算法,其概念為事先給予 一群分類好的資料集,如圖2-4所示,利用這些已知的資料訓練產生預測模型。

爾後,若有尚未分類的資料時,都可以直接使用該模型預測該資料的結果。簡而

爾後,若有尚未分類的資料時,都可以直接使用該模型預測該資料的結果。簡而

在文檔中 部落格文章寫作輔助系統 (頁 11-50)

相關文件