視覺障礙者英文聽力輔助學習工具開發 與系統易用性評估
吳方
1賴紀廷
1溫伊梵
2林育伶
1張千惠
2張智凱
11國立臺南大學數位學習科技學系
2國立臺灣師範大學特殊教育學系
摘 要
資訊數位化帶來便利與快速,卻因資訊取得方式與溝通管道不同,現今 社會依然有部分學習者因獲取資訊管道不同而帶來數位落差 (digital divide)
的問題,在學習上也有相當大的限制。視覺障礙者因為視覺上的機能損害,
失去視覺的學習管道,在求知的過程中比一般生更加困難,對資訊的取得過 程中將遭遇許多問題,但因學習機能未全喪失,只需經由適當的輔助,仍可 運用其他感官來接受教育。為給予視覺障礙者適當的輔助,因此本研究設計 無壓力的教室中英語學習活動,藉由學習者喜好的影音進行英語學習同時達 到刺激學習者的學習動機、提升學習效果、及促進主動學習等多重功用,並 開發實現此學習活動所需的 「視障生英文聽力輔助學習系統」。系統設計過程 中考量到視障生使用盲用電腦之情形,在無須其他硬體輔助科技的前提下,
運用語音合成技術完成系統。系統易用性評估先以 30 位一般學習者戴眼罩 進行實驗,依據初步回饋調整系統後再以 30 位視覺障礙者進行學習活動實 驗,以了解此系統是否滿足學習過程中的資訊需求,並觀察使用系統時所面 臨的困難。實驗結果顯示學習者對於本系統易用性持滿意觀感,且視覺障礙 學習者在主觀上對於本系統之滿意度較高。未來將根據自然學習法 (natural approach) 的五大假設及學習者建議修正系統,並加入語料庫、同義詞集等 輔助語言學習功能,營造互動式語言學習之情境,使得學習者學習經歷能加 以延伸,更進一步對弱勢的視障族群英語學習有所幫助。
關鍵字: 數位落差、視覺障礙、語音合成、自然教學法、同義詞集
壹、研究背景
隨著國際化來臨,英語成為大部分非英語國家主要學習的第二語言,儼然成為全球化 國際語言,更是國際會議與各國人士討論、經商貿易溝通與重要外商人士協商、出國旅遊 向本地人溝通、問路等等的重要工具,因此提升英語能力是極為重要之議題。在多種進行 語言學習的方法中,採用觀看電影、影集等多媒體影片而達到輔助英語學習之方式於近年 來越來越受歡迎,成為最為普遍的英文學習方法之一。由於手機、平板等行動裝置技術日 趨成熟,個人電腦及行動裝置已成為主流,再加上越發迅速的網際網路,透過網路來取得 多媒體影音以進行學習更顯便利,人們只要開啟電腦或是行動裝置便能夠開始進行學習。
即使科技發展迅速造成學習資源更加多元化,卻依舊有部分學生被屏除在時代的洪流外。
雖然現在有許多不同且多樣化的工具能夠進行學習,但大多仍是需要依靠視覺來做為資訊 接收的主要器官,其中的代表符號或是語言的用法,若沒有視覺上的輔助,將很難理解其 意義。對視覺障礙學習者來說,需要依靠視覺的學習工具,將使視覺障礙學習者在學習上 比起一般學習者還要來的艱辛,因為視力不足所造成的生理缺陷,使其對學習產生卻步,
甚至加深視障生對於資訊取得的障礙而產生挫折。因目前教學資源有限,視障生必須仰賴 電腦報讀等相關軟體進行輔助學習。
陳怡佩的研究指出,一般人有 80% 皆是透過視覺感官來獲取資訊學習,對於外界認 知與事物的感官也是由視覺來進行觀察與學習,而對於視覺障礙人士來說,無論是全盲或 弱視,必須借助其他感官如聽覺、味覺、觸覺、或人工輔助器材來學習 (陳怡佩,2006)。
而隨著電腦與行動裝置在教學應用上的普及,許多教材開始進行數位化,但對於視覺障礙 的學生來說,學習上會遇到因為視覺造成的種種障礙,再進行數位環境的學習參與比起一 般生更加困難,因此產生了資訊上的不對等情況進而造成了數位落差,所以視障生必須仰 賴其他科技輔具來彌補其無法看見或是弱視的缺陷。
為了能讓視障生能與一般學生相同,運用多媒體影音來輔助英語學習,因此本研究針 對視障生的主要學習感官-聽覺,開發一套電腦學習輔助軟體,讓視覺障礙學習者能夠依 其興趣,在網路上自由選擇影片,並在聽取影音檔同時能夠透過敲擊特定鍵盤來進行簡 易、直覺的操作,當遇到生澀難懂的生字時,可以適時地進行單字查詢,進而學習英文單 字與其含意,以解決視覺障礙學習者無法利用視覺觀看同步字幕學習英文的問題。隨著資 訊科技的迅速進步與各國政府的逐漸重視,即使視覺障礙的學生無法與一般學生以相同的 方法進行學習,仍有不少學術單位,在進行相關輔具工具的研究與開發,如私立淡江大 學、國立臺南大學等等,都在為視覺障礙學習者盡一份心力;政府也陸續頒訂了相關法 規,如無障礙網頁規範 (劉嘉馨、宋雪芳,2005)。在視覺障礙者所能使用的科技輔助學 習工具功能越來越多樣化的情況下,設計一系統適合視覺障礙學習者使用,並讓視障學習
者能夠真正達到無障礙學習環境,將會是本研究開發系統所要努力的最終目標。為了瞭解 系統是否能真正達到研究預期之成效,本研究針對視覺障礙學習者進行系統測試,進而了 解聽覺學習的成效並獲取實驗者相關使用經驗與對本系統之建議。
貳、文獻探討
一、學習障礙者的數位參與
數位參與 (e-participation) 一開始是由歐盟中提出的數位參與計畫出現,其主要是在 藉由先進資訊概念、工具和解決方法來鼓勵公民上網參與公共行政決策過程,以執行最高 效能與最適當的政策 (European Commission, 2006),在現代資訊科技社會中,數位參與也 漸漸成為重要的公民議題,公民利用數位科技參與數位環境中的各種活動,就像是傳統社 會中公民參與一般社會活動 (European Commission, 2008a),而數位參與可藉由資訊科技 的可及性或近用性 (accessibility) 與運用資訊通訊科技 (information and communication technology, ICT) 這兩個層面來進行分析。
而根據教育部特殊教育通報網顯示,對於在數位情境中,擁有讀寫障礙、書寫障礙與 閱讀障礙的學習者,可能會有學習上的困難,導致他們在數位環境中的參與造成阻礙,而 產生數位落差 (吳亭芳、陳明聰、王華沛、陳淑雲、葉耀明,2012)。其他研究也指出,
有學習障礙的學生在資訊可及性方面,使用電腦與網路的頻率和其他同儕相比並沒有差 異,但在資訊應用能力方面,包含文書處理,網路運用、電腦運作等能力,學習障礙的學 生在各年級皆低於同儕 (Wu, Wang, Chang & Chen, 2011)。雖然學習障礙的學生在使用電 腦的時間不比一般人少,但對於學習的成效上也會因為身心上的障礙而比一般人還要來的 慢或是不足。
二、視障生學習現況
聽覺與視覺是人們獲取資訊的主要管道,其中估計有 80% 至 90% 的比例是由視覺管 道所獲得,利用視覺管道還可遠距離獲取資訊,其所得到資訊的速度與資料量是其他感官 難以取代的 (Geruschat & Smith, 1997)。因此書籍、圖畫、幻燈片、電視、電影、電腦等 視覺媒體成為人們重要的學習來源,其次為唱片、廣播、錄音帶、錄音筆等聽覺媒體。視 覺障礙者可能因為先天上的缺陷,或是後天視覺上所造成的損傷,失去了主要學習管道,
在求知的過程所遇到的關卡甚至比其他身心障礙者更加困難,對資訊的取得更是遭遇許多
問題。有研究者認為,因為視力喪失,會造成視障者行動上的不便,削弱其移動動機,失 去視力將對個人的學習與發展造成相當程度的影響,進而在視障兒童的學習成長歷程上影 響其經驗的範圍與種類 (毛連塭,1992)。
但研究者也指出,「如果給予視障學生適當地教育和輔導,一樣可以與其他同儕競 爭,並達到令人滿意的程度」(毛連塭,1971)。視覺障礙者在傳統教學環境下,需要面臨 內在心理的不平衡、生理限制的困擾、外在他人的批判與環境不支援等因素所造成的學習 障礙。學校所提供的環境設施與支持性服務、任課老師對視覺障礙者學習需求之主動了 解、同學之善意相處互動均是改善學習障礙之重要關鍵。不同程度之視覺障礙的視障生,
因為遇到的學習障礙有程度上的差異,其所使用的電腦輔具並不相同,全盲之視覺障礙者 因已無視覺功能,所以針對其所開發的輔具大部分為感官替代輔具,主要為聽覺,其次則 為觸覺、嗅覺;而弱視者因仍有微弱視力,故其使用之輔具大部分為輔助視覺電腦輔助軟 體,如放大、擴視類、或有聲類,但在學習上仍會造成很大的困擾。
英語學習對視障學生扮演著重要的角色,英語學習可以協助視障生認識異國文化,提 高視野以及自身的素質,建立自己健康人生觀。此外,英語學習有利於認識外國朋友並建 立跨國友誼。再加上英語學習亦可擴充視障學生吸收其感興趣之專業學科的管道,以便未 來拓寬自身就業選擇自由度。隨著國內經濟建設的飛速發展,與國際間的互動日漸頻繁,
英語已成為國際交流之重要語言。因此,英語學習越來越被重視。國內早在 2001 年,在 國民小學三年級階段開設英語課程,推動小學英語學習。因此,英語學習在全民教育成為 一個不可或缺的部分。而視障生的英語學習更不例外。
然而,視覺障礙者受限於視覺能力,使得他們在接收及輸出訊息受到限制,因此視障 學生的英語學習遠遠滯後於一般生的英語學習。李淑娥 (2005) 在視障生語言特質及訓練 中,列出五點常見的視障生語言學習障礙,分別是 「語言理解困難」,「語彙缺乏」,「語法 不完整」,「語用能力差」,「仿說現象多」。「語言理解困難」 即是因為看不到,無法將聽到 的話和實際情境相結合,所以常會誤解真正的意思,尤其和視覺相關的抽象詞彙更難體 會,如討厭、美麗等。而 「英文語彙能力缺乏」 則是因視覺障礙導致理解語彙較困難,無 法將其語彙類推到其他情境。舉例來說,形容詞、副詞等抽象用語就學得慢。就 「語法不 完整」 而言,視障生的語句發展比一般生慢,句長也普遍短。「語用能力差」 是指無法在不 同的情境中正確理解並使用適當的語言來進行溝通。洪續 (2009) 表示,視障生英語學習 方面存在幾個現象:(一) 在模仿和學習語言時僅憑聽覺,看不到口形,導致發音不正確;
(二) 聽覺取得的辭彙偏為空洞,有時不清楚內容為何意;(三) 針對某些詞性或字彙,缺 乏完整或明確的影像。
儘管如此,根據感官補償說,某一感覺通道有缺陷,其他感覺功能會自動增強,所 以,聽覺對視覺障礙兒童來說要比普通兒童敏銳。張卓和李媛 (2008) 列出三點視障生 「聽
覺特長」、「記憶特長」、「觸覺特長」 等。運用這三點特長,再結合英語學科的特點,創設 特殊的教學方法。換言之,根據視障學生的認知特點,選擇合適的教學法,以提高視覺障 礙學生對英語學習的興趣就變得更重要。
Guinan (1997) 針對視障生的英語學習一文中,倡導著英語學習應可著手於 「聽說教 學法 (aural-oral input)」。他表示,視障生的英語學習可搭配點字系統 (Braille) 的輔佐增加 觸覺刺激,以聽說教學法搭配,並鼓勵學生以日常生活的對話和人際關係的語言學習為 主。Munoz (2000) 也提到視障生在英語學習時,必須具體地針對學生的問題,提供必要 的學習協助,例如,輔助點字教材得以增加視障生的觸覺學習或是以特殊眼鏡或是聽力教 材輔佐。另外,鼓勵視障生參與互外活動,多多接觸人群或是外國人士,將所學的字彙或 新知應用於談話中,得以體驗母語和英語學習差異。「聽讀法」 是將教材及課外讀物製成 有聲教材,以代替點字書籍和大字課本的教學方法。而 「多種感官刺激法」 則是利用各種 不同的活動,遊戲,歌曲旋律或是社會互動法直接與個人或圖體互動交流,多元方式學習 管道,補償視覺障礙,圍繞多種感官刺激學習。由二位學者的探討,我們可以綜合得知,
「聽說教學法 (aural-oral input)」「聽讀法」 以及 「多種感官刺激法」 對於視障生的英語學習 具有極大助益。
三、視障者使用輔助學習工具現況
資訊數位化帶來便利與快速,卻因資訊取得與通訊科技使用機會不同,為當今社會帶 來數位落差 (digital divide) 的問題 (林欣儀,2007)。根據行政院研究發展考核委員會的身 心障礙者數位落差與數位生活需求調查報告中指出,雖然身心障礙者的電腦使用率已有上 升的跡象,卻依然只有 29.9% 的身心障礙民眾曾使用過電腦。調查報告亦發現,在不會使 用電腦的身心障礙者中有 83.6% 並不願意參與學習數位資訊,其中 18.4% 是因為生理上的 缺陷造成對學習的卻步。另外,有研究報告指出大多數的視障者還是認為可以使用或知道 更多數位科技,將會有助於提升工作機會。因此,開發輔助科技工具幫助視障人士克服生 理障礙的限制,及如何利用數位科技來進行學習,成為一個重要的課題。
輔助性科技運用在身心障礙者的目的是在擴大殘存能力、超越無法提升的能力、以及 補償仍待提升的能力,建立一個無障礙學習、工作及生活之環境 (吳武典、王華沛,
1999)。因此,從一般的科技輔具,如斜坡道與無障礙廁所,到高科技輔具的運用,如盲 用電腦、無障礙網頁設計等,都是屬於輔助性科技的其中一環。盲用電腦對視覺障礙者產 生了許多影響。在學習上,讓視覺障礙者讀書、寫作業比以往來得方便,在工作上也能與 一般人一樣進行文書處理與編輯;在生活上,盲用電腦讓視覺障礙者獲得知識的管道更加 豐富,不再侷限於大字書、有聲書、點字書或仰賴他人報讀報章、雜誌內容以獲取資訊。
盲用電腦讓視覺障礙者的生活大大改變,長遠而言,視覺障礙者在資訊世界追尋無障礙空 間,與現實生活相比應較容易達成 (徐秀珍,1997)。張金順、余月霞、葉豐輝 (2005) 表 示,視覺障礙學習者使用電腦時,除了一般的軟硬體設備外,還有兩個問題必須克服,分 別為 「如何知道螢幕上所出現的訊息」 和 「如何透過鍵盤輸入文字」。要解決這兩個問題,
需仰賴電腦相關輔助工具的應用。就第一個問題來講,視障者可以藉由螢幕報讀軟體的功 能,經由程式轉換為點字輸出到點字觸摸顯示器,或者利用語音合成器與音效卡成為語音 輸出,視障者則能透過點字和語音瞭解螢幕上的資訊。而要解決第二個問題則是使用 「無 字天書輸入法」 或者其他輸入法,讓視障者能在一般鍵盤上或是專用的點字機輸入中英文 點字,系統則會將之轉成一般人使用的文字。
大多數身心障礙者對於數位學習抱持開放的態度,認為數位學習提供的多媒體教材包 含聲音、動畫與影片等,有助於學習成效之提升,更可減少舟車勞頓的辛苦。由於數位學 習的特性不同於傳統的學習方式,能幫助身心障礙者改善學習時所遭遇的困難 (楊戴寧,
2008)。輔助學習工具雖然對視覺障礙者帶來學習上的便利性,但視障者並非對輔助工具 全抱持著正面的看法。有研究者認為:沒有一種輔助工具是適合所有學生,不同案例對於 電腦輔助科技的適應情形不同,每位視障者因應視力、能力以及環境等種種條件差異,對 於輔助工具的適應不一定都是良好的。雖然視障者普遍認同電腦輔助科技給予的助益,卻 也同時感受到電腦輔助科技帶來的壓力,例如:取得電腦配備的時間有所延誤,或沒有充 分的時間學習新配備等。(劉珍華、鄭靜瑩、賀夏梅,2012)。
輔助工具對於視障者來說,帶有兩種極端的意義。就正面意義而言,輔具可以協助視 障者節省時間和精力,提高其獨立性並能夠像明眼人一般參與活動;反面來說,輔具會加 重視障者的依賴性,輔具笨重又佔空間,反而會阻礙視障者活動,且明顯可見的輔具反而 會凸顯使用者的與眾不同 (Larsson Lund, & Nygard, 2003)。視障者使用輔助科技的情形越 來越普遍,尤其是電腦與網際網路的應用,在視障生的學習過程中已逐漸成為不可或缺的 一環,然而不管在軟硬體或整個使用環境,仍然有不少可以改進的空間,才能達到無障礙 的理想。
四、一般生與視障生的可用性差異
Nielsen (2001) 在研究中指出,在進行網頁的可用性實驗中,一般人比視障生的可用 性高出了三倍。藉由指派測試者進行網路購買、資料查找、資料比較等等任務來證實以上 之結果。下頁表 1 為實驗者分為視障生、弱視生與一般生進行上述任務所各自達成的成功 率 (Nielsen, 2001)。
由下頁表 1 可以看出,對照組的成功率為 78%,而視障生與弱勢生的成功率約為對照
組的 1/3 倍,在有科技輔具輔助的情況下,有著相差 3 倍的可用性差異。本研究希望藉由 易用性量表來測量出視障生是否對於本系統之可用性是足夠的。
參、研究方法
一、研究架構
本研究運用 Python 程式語言模組,開發一視障生英文聽力輔助學習系統,將多媒體 影片載入後,透過系統進行英文字幕擷取及中英文單字翻譯,並利用語音合成,以提供視 覺障礙學習者進行英文學習,如圖 1 所示。一般對於句子無法理解的情形大致可分成發音 聽不清楚以及句子包含未知詞兩種,因此系統設計上將針對這兩種情形進行功能規劃,包 括句子重複朗讀以及單字解釋。在使用者觀看影片時,如果遇到不熟悉的句子將可以透過
表 1 網頁可用性實驗
螢幕報讀軟體 (視障生) 螢幕放大鏡 (弱視生) 對照組 (一般生)
成功率 12.5% 21.4% 78.2%
花費時間 16:46 15:26 7:14
錯誤 2.0 4.5 0.6
主觀評分 2.5 2.9 4.6
影片
語音合成
詞幹提取
WordNet 語音合成 擷取字幕
未知詞分析
字義解釋
發音報讀 發音報讀
視障生 字典
資料庫
工研院
伺服器 語音合成
字義解釋
發音報讀
圖 1 系統架構圖
特定按鍵操作系統進行語音合成,重複聽取該句子。句子中不熟悉的單字則可以透過更進 一步的操作,先是對單字進行詞幹還原,再找取其中英文單字解釋,回饋給使用者。
二、系統操作介面
系統操作流程如圖 2 所示,系統操作開始前會先載入所需要模組,包含 pygame、
pyspeech 和 NLTK, 並 由 pygame 載 入 事 先 錄 製 好 的 中 文 導 引 語 語 音 檔 (.wav file), pyspeech 則會呼叫 Windows 語音辨識系統。接下來系統會要求使用者輸入影音檔名稱,
其檔案格式為 MPEG 檔 (.mpg file),輸入完成後會跳出 pygame 視窗,並載入影音檔進行 影片播放,同時會載入與語音檔同名稱的字幕檔 (.srt)以便稍後的暫停字幕抓取。當使用 者聽到不熟悉的句子時,可以按下「空白鍵」,系統便會將當下的時間以秒為單位儲存,
並結束播放影音檔的 pygame 視窗,再開啟一新視窗以導引語講解系統接下來的會匯出的 語音合成及可進行之操作,例如當使用者於觀看影片時按下 「空白鍵」 後,會播放內容為
開始
Python載入字幕檔
Pygame載入語音檔 影片播放
撥放完畢
結束
按下空白鍵 擷取時間軸
相對應字幕
按下空白鍵
按下下鍵 進入單字選取
左、右鍵選取單字 按下下鍵
詞幹提取
Wordnet 單字解釋 Pyspeech
語音合成
Pyspeech 語音合成 按下空白鍵
字典資料庫 工研院 伺服器 中文 語音合成 Python載入模組
單字過濾
是 是
是 否
否 是
否
否 是
按下alt鍵 開/關 是 導引語 否
是
圖 2 系統操作流程圖
「我將會唸出你不懂的句子」 的導引語,接著有 pyspeech 對暫停時的句子進行語音合成並 輸出。為了能夠抓取正確的句子,系統會將預先載入的字幕檔之時間軸的時間單位全換算 成秒,並利用先前存取的暫停秒數,在字幕檔中抓取出橫跨暫停秒數的時間軸所相對應之 字幕進行儲存,再讓 pyspeech 進行語音合成回饋給使用者。當句子唸完後,會再次播放 導引語告知使用者,按 「空白鍵」 會繼續,「左方 alt 鍵」可再聽取句子一次,「下鍵」 則可 進入單字字義解釋查詢的功能。
在剛開始進入單字字義解釋時,系統會將剛才抓取的句子進行簡單字過濾,因為不確 定視覺障礙學習者的英文程度,所以目前選擇使用常見單字 Dolch Sight Words 220 字進行 過濾,過濾完的單字可以讓使用者利用 「左鍵」 和 「右鍵」 選取,而每當單字被選取到時,
pyspeech 會對該單字進行語音合成,讓使用者可以得知自己選到了哪個單字。當使用者聽 到不懂的單字時,可以選按 「下鍵」,系統會先利用 NLTK 中 WordNetLemmatizer 模組進 行詞幹還原,再從 NLTK 的 WordNet 語料庫中找到英文單字的字義解釋,最後由 pyspeech 輸出給使用者。至於中文單字解釋的部分一樣會先將單字進行詞幹提取,並在本機端的字 典資料庫搜索其中文字義解釋,再將中文解釋傳送到工研院文字轉語音的伺服器中,經過 語音合成後,系統再抓取伺服器中的資訊回傳至本地端,並將中文語音合成的單字解釋回 饋給使用者。如果無法找到該單字的字義解釋,則會告知使用者該單字為 no definition。
當使用者已經完全明白過濾後單字的意思,即可按「上鍵」再聽取暫停的句子一次,或直 接使用「空白鍵」繼續撥放影片。
每當按下 「空白鍵」 暫停時,pygame 會關閉整個影片,因此當再次按下 「空白鍵」 繼 續撥放影片時,pygame 會利用先前儲存的暫停秒數,在再次載入影片的時候直接跳過暫 停前撥放過的部分,使影片能夠接續撥放,如圖 3 所示。
圖 3 系統使用介面
三、研究工具
(一)語音合成
語音合成系統 (Text-to-Speech, TTS),廣義而言指任何能將電腦中的文字模擬成人聲 發出語音的軟硬體技術。其語音的形成是透過電腦程式裡的聲韻規則比較,然後藉由語音 合成器或電腦擴音器輸出。電腦語音合成系統包括語音合成軟體 (TTS software)和語音 合成引擎 (TTS engine),語音合成軟體負責的是程式外顯的功能,例如:提供入字輸出或 文書處理軟體的介面、速度上的調整或按鈕的點選操作等;而語音合成引擎則是負責把語 音合成軟體上的文字和預先程式化好的發音規則 (preprogrammed pronunciation rule) 相比 對,然後組成電腦的語音輸出。語音合成系統目前的應用層面大多仍在閱讀電腦螢幕上的 文章,語音指引,互動回饋,或輔助說明。其困難點在於發音的自然度,包括清晰度與流 暢度,以及即時處理的能力。本研究採用的 Python 模組為 pyspeech,它提供一個簡單的 介面,可以進行 Windows 內建的語音辨識和語音合成功能。系統中利用語音合成技術,
可以重複念出視障生不懂的句子及單字,並依使用者需求念出查找好的英文單字字義解 釋。
(二)詞幹提取
詞幹 (stem) 為詞的某一部分,會因使用情況的不同而使字義有所差別,其本身具有 多種涵義,包括詞綴和詞型變化。詞幹提取是指去除詞綴得到詞根的過程,詞幹並不需要 完全相同。計算機科學領域陸續提出詞幹提取相應演算法,其包含多種演算法,分別在性 能及準確度上對於詞幹的提取有所不同。相應演算法包含查找演算法、詞綴去除演算法、
Lemmatization 演 算 法、 隨 機 演 算 法 及 匹 配 演 算 法 等 多 種 詞 幹 提 取 演 算 法 ( 林 育 伶,
2013)。本研究為了能正確找到單字解釋,採用詞幹提取之方式將詞性還原,再用還原後 的單詞進行字義查找,以避免詞性變化與語料庫不足而導致查無字義解釋。初始採用 NLTK 之模組- Porter 和 Lancaster 演算法,如下表 2 所示,這兩者詞性還原大多直接將字 尾為 s、ing、ed 等字眼直接刪除,正確率甚差,因此並未將此詞幹題取之方法加入實驗 中。若能加入更佳的詞幹提取應能改良本系統字義查找之正確性,將有利於單字解釋的查 找,以減少 no definition 的狀況,因此在後續工作中持續進行詞幹題取之研究,最後決定 採用 NLTK 中的 WordNetLemmatizer 模組。此模組採用 WordNet 語料庫進行詞幹提取,若 發現該詞未在語料庫中即不會進行更動。但如下頁表 2 所示,此模組無法解決現在分詞、
過去分詞等 ed、ing 結尾變化之詞;亦無法解決不規則變化之詞。但由於此模組較不會產 生錯誤,因此將於系統中加入此模組以提高字義查找之精準性。
(三)語料庫
在語言學中,語料庫,或稱文字語料庫,是一個大量結構化的自然語言文本集合,現 今常以電子形式儲存運作。通常用於在特定的領域中進行語言的統計分析、區別常用性及 證實語言規則。藉由語料庫,使用者可以迅速了解某個字詞在所有情境下的使用,例如學 術論文寫作。NLTK 是澳洲學者以 Python 為基礎開發的模組,其提供了相當多種的語料 庫,包括本系統所使用的 WordNet 也為其提供的語料庫之一。在使用者選取完不懂或不確 定的單字時,可使用 WordNet 提供的 definition 來查找字義解釋,並以 pyspeech 進行語音 合成回饋給使用者。
(四)中文語音合成
本研究利用 SOAP 通訊協定 (Simple Object Access Protocol) 來連結至工研院提供的中 文語音合成網路服務 (Web Service) 達成中文語音合成的功能。簡而言之,SOAP 是一種 以 XML 為基礎的通訊協定,讓軟體元件或應用程式可以藉此透過 HTTP 來進行溝通,其 作用是編譯網路服務所需的要求或回應後,再將編譯後的訊息送出到網路,即為應用程式 和用戶之間傳輸資料的一種機制。SOAP 包含了封包、訊息標頭紀錄和訊息主體三種要 素,封包用來定義整個訊息的內容,訊息標頭紀錄則是記錄標頭應該登錄的資料,而訊息 主體包括了所有的呼叫描述與回應內容 (賴紀廷、吳方 、林育伶、張智凱,2013)。
本研究利用 Python 程式語言中的 suds 模組來實現 SOAP 之功能,如下頁圖 4 所示,
使用者端利用 SOAP 來連結至工研院的 Web Service API,先將請求從本地端傳送至具有 Web Service 功能的 Web 站點,接下來會將請求傳送至 TTS Service 進行語音合成的工作,
並回傳執行狀況到 Web Service,若語音合成完成,則會回傳合成音檔輸出回饋給使用者。
四、實驗流程
因為視覺障礙學習者樣本較難取得,因此本研究先採用三十位一般明眼學習者利用戴 表 2 Porter、Lancaster 與 WordNetLemmatizer 演算法之詞幹提取範例
原始 Porter Lancaster WordNetLemmatizer 正確
campus campu camp campus campus
stories stori story story story
joining join join joining join
listened listen list listened listen
taken taken tak taken take
眼罩的方式,對目前已完成的系統進行方便樣本的系統測試。一般生組進行完實驗後,先 進行一般生建議修改以及實驗中系統不穩定的錯誤更正後,再採用三十位視障生樣本來進 行第二次實驗。兩次的實驗後,會先剔除極端數據,如此一來一般生組以及視障生組都只 剩下 27 人,再針對剩下的數據進行分析。
如圖 5 所示,本實驗流程分成三大部分,包含英文聽力前測、系統試用以及問卷後 測。實驗進行前會先針對使用者的英文聽力程度進行檢定,採用的試卷為全民英檢初級聽 力測試,其中視障生組會略過第一部分的圖片題,並採用選項報讀代答的方式作答。在確 保受測者有一定的英文程度後,接著會進行系統使用介紹,包括系統的構想、按鍵功能的 操作,詳細講解完後會有三部十分鐘影片讓實驗者進行系統試用。實驗結束後,會請受測 者填寫系統易用性量表 (System usability scale, SUS),來針對使用者進行系統易用性調 查,視障生組的量表乃採報讀代填的方式進行。
圖 4 SOAP 連線至 Web Service API 架構圖 網路網路
用戶端 SOAP
回應 Web Service TTS Server
Data 合成編號 Base
檔案網址 參數設定 Web Service位置:http://
tts.itri.org.tw/TTSService/
Soap_1_3.php?wsdl ConvertSimple
(申請帳號,
申請密碼,
欲合成TTS文字)
Result(String)–
執行狀況代碼&
執行狀況說明&
檔案Convert ID SOAP
請求
實驗開始
英文聽力前測 系統試用 SUS問卷後測
一般生組
視障生組 英文聽力前測
(報讀代填) 系統試用 SUS問卷後測
(報讀代填)
圖 5 系統實驗流程圖
肆、研究結果
本研究的系統易用性量表所求得的 Cronbach's Alpha 值為 0.849。達到一般所認定量表 總信度為 0.7 以上,學者 DeVellis(1991)提出總信度介於 0.80 至 0.90 之間達非常好程度,
表示此量表之穩定性高具有內部一致性,因此具有良好信度。系統易用性量表內容共十 題,條例如下:
Q1 我會願意經常使用這個系統
Q2 我覺得這個系統過於複雜 (反向題)
Q3 我認為這個系統容易使用
Q4 我想我會需要技術人員的協助,才能使用這個系統 (反向題)
Q5 我覺得這個系統的各種功能彼此整合的很好 Q6 我認為這個系統內有太多的不一致 (反向題)
Q7 我可以預見大多數的人都能很快學會使用這個系統 Q8 我覺得這個系統使用起來非常困難 (反向題)
Q9 我很有自信能夠使用這個系統
Q10 我需要先學習很多知識,才能開始使用這個系統 (反向題)
研究者將所有填答經過換算過後所得數據如表 3 所示,學習者對此系統易用性的平均 數為 70.83 分,中位數為 72.5 分,眾數為 72.5 分,最大值及最小值分別為 92.5 分及 35 分,
標準差為 13.05 分,一般而言商用的實用系統的系統易用性分數最好可達到 70 分,本系 統的系統易用性達 70.83 分,顯示學習者對此系統的易用性持滿意觀感。
由於本研究實驗對象分為一般生及視障生兩組,故將兩組別對系統易用性分別進行統 計分析,由表 4 得知,視障生組別平均數高於一般生組別,依據易用性量表分數百分比和 等級來看,一般生 SUS 分數 62.96 分,被分類在 C 等級,視障生組別 SUS 評分分數達到 78.7 分,轉換成百分等級為 70%,被分類在 B 等級,請參閱下頁圖 6,具有較高的易用
表 3 系統易用性量表分數全體樣本敘述統計結果
樣本數 平均數 中位數 眾數 最大值 最小值 標準差
54 70.83 72.5 72.5 92.5 35 13.05
表 4 系統易用性量表分數分組敘述統計結果
樣本數 平均數 中位數 眾數 最大值 最小值 標準差
一般生 27 62.96 65 72.5 80 35 13.12 視障生 27 78.70 80 75 92.5 67.5 6.81
性。由表 4 顯示對 SUS 量表最高分落在視障組,而最低分 35 分則是落在一般生組;可看 出視覺障礙學習者在主觀上對於本系統之滿意度較高。
研究者將學習者填答後問卷進行分析,並將其中反向的敘述語句 (即所謂的反向題)
轉換為正向填答,進行各題項分析。由於此為 5 點量表,符合連續量尺的假設,故計算每 一題的平均值及標準差以表示學生平均同意程度。平均值大於 3 表示同意的學生多於不同 意的學生,而平均值大於 4 則表示學生對該題大多傾向同意。由表 5 分析顯示,視障生組 別在 SUS 量表 10 題題項中平均數皆高於一般生組別,絕大多數題項介於沒意見及同意之 間;一般組學習者絕大多數題項平均數較低,由此可得知,一般生學習者可能因視覺線索
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Percentile Rank
0 10 20 30 40 50 60 70 80 90 100
F D C B A
SUS Score
圖 6 系統易用性量表分數百分比等級(Sauro, 2011)
表 5 系統易用性量表各題項分組平均差異 一般生
平均數
一般生 標準差
視障生 平均數
視障生 標準差
視障生平均數與 一般生平均數差異
Q1 2.15 .662 3.19 .483 1.04
Q2 2.56 .801 3.22 .670 0.66
Q3 2.37 .967 3.33 .555 0.96
Q4 2.04 1.16 3.33 .620 1.29
Q5 2.04 .587 2.63 .629 0.59
Q6 2.44 .641 2.56 .641 0.12
Q7 2.78 .801 3.30 .542 0.52
Q8 2.85 .949 3.41 .501 0.56
Q9 2.81 .879 3.33 .555 0.52
Q10 3.17 .770 3.18 .483 0.01
(其中反向題數字已轉換為正向題)
被剝奪在主觀上對於本系統之滿意度較低。其中 Q5 與 Q6 兩題同時在一般生與視障生組 平均分皆低於三分,未來將針對系統整合以及功能一致性進一步改善。而於不需要先學習 許多知識,就能使用此系統之題項 (Q10),兩組別平均值皆高於 3 以上,表示同意的學生 多於不同意的學生。
接著針對一般生學習者及視覺障礙學習者進行易用性比較分析,利用獨立樣本檢定,
分析在兩組之間的易用性是否有差異。其結果如表 6 所示,一般生組及視障生組的學習者 平均數分別為 62.96 及 78.70,視障生組的易用性比一般生組來的高,其顯著性 p = 0.000(p
< .05),因此兩個組別平均數達到顯著差異,代表一般生組及視障生組的學習者對使用本 系統易用性滿意度有感到差異,但以平均數來看視障生組對於此系統的易用性上持滿意觀 感,而一般生組對於此系統的易用性滿意觀感較低。
進一步針對通過英語初級檢定學習者及未通過英語初級檢定學習者進行系統易用性比 較分析,利用獨立樣本檢定,分析在兩組之間的易用性是否有差異。其結果如下表 7 所 示,通過英語初級檢定組及未通過英語初級檢定組的學習者平均數分別為 64.60 及 76.20,
未通過英語初級檢定組的易用性分數比通過英語初級檢定來的高,其顯著性 p = 0.001 (p <
.05),因此兩個組間具有顯著性差異,表示有無通過英語初級檢定的學習者在系統易用性 有顯著的不同,未通過英語初級檢定組對系統易用性顯著高於通過英語初級檢定。
在獨立樣本檢定中,若是分組變數在檢定變數的平均數差異達到顯著差異,可進一步 求出效果值,效果值 (size of effect) 代表實務顯著性,意旨此差異在實務意義上具有價 值。效果值若小於或等於 0.06 表示分組變數與檢定變數間為低效果值,效果值若大於或 等於 0.14 表示分組變數與檢定變數間為高效果值,效果值若大於 0.06、小於 0.14 間表示 分組變數與檢定變數間為中效果值 (Nielsen & Landauer, 1993)。關聯量數中的 「Eta 平方」
欄數值為效果值,可以判斷兩個平均數達顯著性差異時,其差距之強度。實驗數據顯示 Eta 平方為 0.371 及 0.200,根據判斷標準,可知兩組學習者及其英文程度對系統易用性這
表 6 系統易用性分組平均數檢定結果
組別 個數 平均數 標準差 標準誤 顯著性
一般生 27 62.96 13.12 2.52 .000
視障生 27 78.70 6.81 1.31
表 7 依據英語能力分組的系統易用性平均數檢定結果
組別 個數 平均數 標準差 標準誤 顯著性
通過英語初級檢定 25 64.60 15.01 3.00 .001 未通過英語初級檢定 29 76.20 8.03 1.49
個變項的獨立樣本分析中具有中高效果值。
伍、結論與未來展望
本研究利用 Python 程式語言,結合 pygame、pyspeech 等開放模組,設計與開發一聽 力輔助學習系統,使視障生能在觀看影片的同時,對無法理解的影片內容使用系統輔助學 習;換言之,讓使用者在觀看影片的同時能夠針對不清楚的句子以及不懂的詞彙,利用簡 便、直覺的操作方式,包括空白鍵、方向鍵等,進行影片的字幕重複聽取與英文單字的 中、英文語音解釋功能。由於樣本取得不易,因此採用一般生帶眼罩的方便樣本進行初步 實驗,再利用視障生進行第二次的實驗。實驗分成英文前測、系統試用、問卷後測三大部 分,其中視障生組在前、後測的部分採報讀代填的方式進行。由實驗結果後的數據,兩組 扣除極端值後皆剩下的 27 份樣本數據中,進行統計分析,可以發現視障生對系統的主觀 滿意度高於一般生,與 Nielsen (2001) 的實驗結果不謀而合,再加上一般生組實驗完成後 有先對系統進行部分錯誤修改測試後才針對視障生組進行實驗,所以視障生組的系統將會 比一般生實驗時的系統更加穩定,因此視障生對系統的主觀滿意度會高於一般生。另外對 於已通過英文檢定考試的受測者而言,可能只要重複聽取句子幾次便能繼續接著觀看影 片,而英文程度較低的受測者則會比較需要重複使用單字解釋查詢的功能,此功能將使他 們更加容易了解影片內容,因此針對英文程度進行獨立樣本分析的結果,會得到未通過英 語初級檢定組對系統易用性顯著高於通過英語初級檢定組。
隨著電腦資訊與網路的發展,讓視覺障礙者的生活造成改變,獲取資訊的管道也更加 豐富。本研究希冀能夠開發一使視覺障礙者在語言學習上達到真正無障礙的系統,利用語 音合成技術重複聆聽亦可累積其第二外語經驗,增進其英文程度,因此由目前受測樣本 中,得到許多能使系統更加完善的寶貴建議。首先是增加單字字義解釋之語料庫,讓學用 者可以查找到更多不懂的單字字義解釋或聽取較為淺顯易懂的解釋,以更加了解影片內 容。再者,可針對系統增加更多可讓學用者自行設定的部分,包括開放語音合成速度的調 整、自由選擇重複朗讀及查詢字義解釋的句子、設定句子重複朗讀的次數或即時指令的執 行。未來將以學習者建議修正系統後,再針對自然學習法中的先天習得—後天學習假設
(acquisition - learning hypothesis) 與學習的自然順序假設 (natural order hypothesis),藉由 學習影片中的真實物件設計類似母語習得的聽力學習過程,對影片進行語音合成,並針對 影片出現之物品、詞彙、名稱等名詞,加入同義詞集(synsets)、相關例句及 WordNet 語 料庫等功能,營造互動式語言學習之情境,延伸影片的學習內容,達到讓學習者自然學習 語言的效果。
誌 謝
本研究承蒙臺灣行政院科技部專題研究計畫贊助,計畫編號:NSC 100-2628-S-024- 001-MY3、NSC 101-2511-S-024-007-MY2 以及 NSC 99-2511-S-003-025-MY2,謹此致謝。
參考文獻
毛連塭 (1971)。在普通班級中如何指導視障兒童。臺南:臺灣省教育廳。
毛連塭 (1992)。視覺障礙兒童輔導手冊。台北:國立臺灣師範大學特殊教育研究所。
李淑娥 (2005)。視多障兒童的語言特質及訓練。2013 年 12 月 16 日,取自:http://assist.
batol.net/academic/academic-detail.asp?id=45
吳武典、王華沛(1999)。加強身心障礙者輔助科技建設。特殊教育季刊,72,1-9。
吳亭芳、陳明聰、王華沛、陳淑雲、葉耀明(2012)。國小高年級輕度障礙學生電腦文字 輸入能力之研究。國立台灣科技大學人文社會學報,8(2),139-156。
林育伶(2013)。學習風格對適性字幕輔助行動英語聽力學習之有用性影響研究(未出版 之碩士論文)。國立台南大學數位學習科技學系,臺南。
林欣儀(2007)。供視覺障礙人士使用之再造數位學習系統(未出版之碩士論文)。高雄師 範大學資訊教育研究所,高雄。
洪續(2009)。小議盲校英語辭彙詞義呈現方法。2013 年 12 月 16 日,取自:http://assist.
batol.net/academic/academic-detail.asp?id=350#top 徐秀珍(1997)。黑暗世界的電腦光芒。亞洲週刊,83-84。
陳怡佩(2006)。視覺障礙兒童及青少年的資訊需求。臺灣圖書館管理季刊,2(3),32- 43。
張金順、余月霞、葉豐輝(2005)。中文盲用 Windows 學習指南。台北縣:淡江盲生資源 中心。
張卓、李媛(2008)。淺談我國盲人高等音樂教育的目標與方法。2013 年 12 月 16 日,取自:
http://assist.batol.net/academic/academic-detail.asp?id=237
楊戴寧(2008)。大學身心障礙生對數位學習系統使用之研究-以臺師大 Blackboard 數位 學習系統為例(未出版之碩士論文)。國立臺灣師範大學圖書資訊學研究所,台北。
劉嘉馨、宋雪芳(2005)。視障者使用網際網路之研究。台灣圖書館管理季刊,1(2),
85-98。
劉珍華、鄭靜瑩、賀夏梅(2012)。影響重度視覺障礙者使用輔助科技之因素-以博碩課
業使用之輔助科技為例。國立台南大學特殊教育學系特殊教育與復健學報,26,21- 44。
賴紀廷、吳方 、林育伶、張智凱(2013)。中文導讀書之視障生學習輔助工具系統開發。
第九屆數位內容國際研討會,238-242
DeVellis, R. F. (1991). Scale development: Theory and applications. Newbury Park, Calif.: Sage.
European Commission (2006). CALL FOR PROPOSALS - eParticipation. Official Journal of the
European Union (C series), 176, 32.
European Commission (2008a). ICT research: The policy perspective, e-government and e-participation. Retrieved March 19, 2014 from: http://www.unapcict.org/ecohub/resources/
ict-research-the-policy-perspective-e-government%20-and-e-participation/at_download/
attachment1
European Commission (2008b). Digital literacy: European Commission working paper and recommendations from digital literacy high-level expert group. European Commission.
Retrieved March 19, 2014 from: http://www.ifap.ru/library/book386.pdf
Geruschat, D., & Smith, A. J. (1997). Low vision and mobility. Foundations of orientation and
mobility, 2, 60-103.
Guinan, H. (1997). ESL for students with visual impairments. Journal of Visual Impairment &
Blindness, 91 (6), 555-563
Larsson Lund, M., & Nygard, L. (2003). Incorporating or resisting assistive devices: Different approaches in achieving a desired occupational self-image. OTJR: Occupation,
Participation and Health, 23(2), 67-75.
Muñoz, M. L. (2000). Second language acquisition and children with visual and hearing impairments. See/Hear Newsletter, 5(2).
Nielsen, J., & Landauer, T. K. (1993). A mathematical model of the finding of usability problems.
Proceedings of the INTERCHI'93 conference on Human factors in computing systems, 206- 213.
Nielsen, J. (2001). Beyond Accessibility: Treating Users with Disabilities as People. Jakob N i e l s e n ’s A l e r t b o x . R e t r i e v e d M a r c h 1 9 , 2 0 1 4 f r o m : h t t p / / w w w. u s e i t . c o m / alertbox/20011111.html.
Sauro, J. (2011). Measuring usability with the system usability scale (SUS). Retrieved March 19, 2014 from: http://www.measuringusability.com/sus.php
Wu, T. F., Wang H. P., Chang C. H. S., & Chen, M. C. (2011). Digital divide goes beyond
accessto technology: A survey of children with learning disabilities in grade 3 to grade 9 in Taiwan. Paper presented at the Oral presents at Asia-Pacific Conference on Technology
Enhanced Learning, Xi'an,China.作者簡介
吳方 ,國立臺南大學數位學習科技學系,大學生
Fang-Wen Wu is a College Student of Department of Information and Learning Technology, National University of Tainan, Tainan, Taiwan.
賴紀廷,國立臺南大學數位學習科技學系,大學生
Chi-Ting Lai is a College Student of Department of Information and Learning Technology, National University of Tainan, Tainan, Taiwan.
溫伊梵,國立臺灣師範大學特殊教育學系,博士生
I-Fan Wen is a Doctor of Department of Special Education, National Taiwan Normal University, Taipei, Taiwan.
林育伶,國立臺南大學數位學習科技學系,專任助理
Yu-Ling Lin is an Assistant of Department of Information and Learning Technology, National University of Tainan, Tainan, Taiwan.
張千惠,國立臺灣師範大學特殊教育學系,副教授(通訊作者)
Chien-Huey Sophie Chang is an Associate of Department of Special Education, National Taiwan Normal University, Taipei, Taiwan. (Corresponding Author)
張智凱,國立臺南大學數位學習科技學系,教授
Chih-Kai Chang is a Professor of Department of Information and Learning Technology, National University of Tainan, Tainan, Taiwan.
收稿日期:民國103年01月31日 接受日期:民國103年03月07日
DEVELOPMENT AND EVALUATION OF AN ASSISTED LISTENING COMPREHENSION
SYSTEM FOR EFL LEARNERS WITH VISUAL IMPAIRMENTS
Fang-Wen Wu
1Chi-Ting Lai
1I-Fan Wen
2Yu-Ling Lin
1Chien-Huey Sophie Chang
2Chih-Kai Chang
11Department of Information and Learning Technology, National University of Tainan
2Department of Special Education, National Taiwan Normal University
ABSTRACT
Although the information society brings much convenience, some learners will face the problem of a digital divide. One of the dimensions of the digital divide problem comes from subjects’ characteristics of connectivity, for instance the needs of people who are blind or have impaired vision. Learning a foreign language is more difficult for visual impaired learners than other healthy students because of their loss of visual learning channels. However, visually impaired learners can still use other senses and learn well through the appropriate framework. The study designed a learning activity according to learner preferences to stimulate learning motivation and enhance English listing comprehension. A precondition of the system’s design is to complete the required functions under the use of speech synthesis technology without additional hardware. The first preliminary usability evaluation was conducted with 30 general learners with eye- shape blinkers. After some minute adjustments, the second usability evaluation was conducted with 30 visually impaired learners. The experimental results show that most learners are satisfied with the system from a usability perspective; moreover, visual impaired learners scored higher than general learners. In the future, corpus, synonym sets, and interactive functions will be added on to the system to extend visual impaired learners’ experiences according the five hypothesis of the natural approach.
Keywords: digital divide, visual impairment, speech synthesis, natural approach, synonym sets