• 沒有找到結果。

透過聊天機器人技術建立

N/A
N/A
Protected

Academic year: 2022

Share "透過聊天機器人技術建立"

Copied!
177
0
0

加載中.... (立即查看全文)

全文

(1)

國立臺東大學教育學系 教育研究碩士班

碩士論文

指導教授:梁忠銘 博士

透過聊天機器人技術建立 LINE BOT 族語學習系統過程之研究

以建和卑南族語為例

研究生:施浩宇 撰

中華民國一一○年八月

(2)
(3)

國立臺東大學教育學系 教育研究碩士班

碩士論文

透過聊天機器人技術建立 LINE BOT 族語學習系統過程之研究

以建和卑南族語為例

研究生:施浩宇 撰 指導教授:梁忠銘 博士

中華民國一一○年八月

(4)
(5)
(6)

誌謝辭

大學畢業那年的我為了修讀小教學程回到家鄉報考了臺東大學的教育研究 所,在這過程中我很幸運的考上研究所與小教學程,並且順利在學程修畢的同時 完成論文,然而我能夠這麼順利的完成學業,都是因為在這過程中受到許多人的 照顧以及協助才能順利完成的。

我要感謝我的指導老師梁忠銘教授,謝謝老師在我就讀研究所的這段期間給 予我許多的協助,從我尚未簽指導教授一直到完成論文的這一刻,都持續不斷的 給我協助,在研究期間只要我遇到問題與困難時,老師就會給我許多勉勵的話來 鼓舞我,讓我一次次地衝破研究的貧頸,也很感謝老師讓我在研究上能夠不被限 制的自由發揮,讓我有很大的自主性,才能成就這麼特別的一個研究,就像老師 所說的,您怕我被太多的意見左右,最後放棄一個這麼好的研究題目,所以用不 同的方式來指導我,您告訴我論文就儘管寫,有問題我們後面再來解決,沒有什 麼不能解決的問題,最後也和老師所說的一樣,順利的在時間內完成了研究。同 時,也要感謝梁金盛教授以及鄭承昌副教授兩位口委老師給予我許多寶貴的意 見,讓我能夠將論文以最好的方式呈現出來。

我也要感謝洪婷嵐以及洪林梅華兩位老師,若沒有妳們的協助,依照我的族 語能力是無法完成這次的研究,很感謝兩位老師每次都能針對我提出的族語問題 進行解答,且能提供我許多不同的意見,讓我能夠順利進行研究,並且在我做研 究的期間時常鼓勵我,同時也肯定我的研究是很有價值的,讓我擁有充滿信心且 持有一定要完成的信念,為的就是能夠用我的專業及專長在族語傳承上做出不一 樣的貢獻。最後我想感謝我的家人們,若沒有家人在背後的支持,我也許就不會 回來臺東繼續進修,更不會有完成碩士學業的一天。

能夠回到家鄉就讀研究所是我的榮幸,很感謝在這過程中幫助我的每一個 人,不論是碩班的同學還是小教學程的同學們,若沒有大家的協助以及鼓勵,我 也沒辦法完成這個研究並且順利畢業,很高興在學期間可以認識這麼多值得交心 的朋友,和我一起共創這麼美好的一段回憶。

施浩宇 謹誌 國立臺東大學 教育研究所 中華民國110 年 8 月

(7)

i

透過聊天機器人技術建立 LINE BOT 語學習系統過程之研究 以建和卑南族語

為例

施浩宇

國立臺東大學教育研究所碩士班

本研究為質性取向,是依據軟體工程系統發展的歷程來進行研

究,目的在透過聊天機器人技術於通訊軟體 LINE 上建立建和卑南族

語學習系統,透過建立族語辭典與提供族語教材閱讀,同時實現自動 化拆解音節及族語語音合成的功能,在族語辭典上本研究將會建立新 的族語辭典,其內容包含中文、族語、中文例句、族語例句、字根、

級別等,可以讓學習者有更足夠的學習內容。本研究所開發的自動化 拆解音節以及族語語音合成功能,能夠讓學習者看到單字的音節拆解 以及聽到單字的發音,使族語學習者在沒有老師教導的情況下進行自 學。此外,本研究之訪談對象挑選方式為立意抽樣,挑選條件為通過 建和卑南族語優級和高級認證之族語教師,以便確保系統內容正確度 以及教學實用性。本研究具體目的為:一、設計適合於通訊軟體 LINE 上的族語學習系統。二、即時查詢族語單字。三、系統自動化 拆解音節以及合成族語語音。四、分析族語教師對於此系統的滿意程 度以及在族語學習上的幫助。

在給族語教師使用後獲得的回饋可知自動拆解音節的功能對於族 語學習最有幫助,其他三項功能也均獲得正面的評價,系統待改進的 方面如族語辭典資料的含量還能夠增加以及族語語音合成後的發音也 還能夠更精準。

關鍵字:聊天機器人、LINE BOT、建和卑南族語、族語學習系統

(8)

ii

Study on a process utilizing LINE chat bot for learning indigenous Pinuyumayan language in Jianhe

SHI, HAO-YU

Abstract

This research utilities qualitative methods to study the process of software engineering development. The purpose of this study is to use the chatbot features on instant messaging platform LINE to create a

Pinuyumayan language in Jianhe learning system. Providing course ware, a dictionary, an automatic syllable dividing and pronunciation function. In this study, we built a new dictionary with the following contents for language learning: words, translation in Chinese, example sentences, example sentences translated in Chinese, root words, and the levels of the words. The automatic syllable divider and pronunciation synthesis function can help learners self learn when teacher are not immediately available.

The interviewees in this study are chosen using purposive sampling.

Teachers who are certified Pinuyumayan language in Jianhe in levels Superior and Advanced are selected to ensure the contents are correct and relevant in teaching.

The purpose of this study:

1. Design a Pinuyumayan language in Jianhe learning system suitable on instant messaging platform LINE.

2. Instant vocabulary look up.

3. Automatic syllable divider and word pronunciation.

4. Analyse the system's effectiveness on teaching and learning from the teachers perspective.

From the teachers feedback we can assess syllable divider has been the most helpful function in learning. The other three functions have also received positive reviews. To be improved upon: Number of words in the dictionary, and more accurate pronunciation synthesis.

Keywords : ChatBot, LINE BOT, Pinuyumayan language in Jianhe, indigenous learning system

(9)

iii

... i

Abstract ... ii

... iii

... iv

... v

第一章 緒論 ... 1

第一節 研究背景與動機 ... 1

第二節 研究目的與研究問題 ... 4

第三節 名詞釋義 ... 6

第四節 研究範圍與限制 ... 8

第二章 文獻探討 ... 9

第ㄧ節 建和卑南族語發音及書寫系統 ... 9

第二節 卑南族語相關學習系統 ... 12

第三節 教育與聊天機器人之研究探討 ... 14

第三章 研究設計與實施歷程 ... 23

第一節 研究設計與工具 ... 23

第二節 研究架構與步驟 ... 29

第三節 研究場域與研究對象 ... 32

第四節 資料信實度 ... 33

第五節 研究倫理 ... 33

第四章 系統建置與評估 ... 35

第一節 系統設計 ... 35

第二節 程式設計 ... 73

第三節 系統功能整併及測試 ... 95

第四節 系統實施階段 ... 117

第五章 結論與建議 ... 139

第一節 結論 ... 139

第二節 建議 ... 141

參考文獻 ... 143

(10)

iv

表1-1 卑南族四大語別使用部落對照表 ... 7

表2-1 建和卑南族語元音及書寫文字 ... 11

表2-2 建和卑南族語輔音及書寫文字 ... 11

表3-1 研究對象資料表 ... 32

表4-1 流程圖圖形說明表 ... 35

表4-2 建和卑南族語千詞表 ... 36

表4-3 族語辭典資料表 ... 37

表4-4 族語符號發音表 ... 53

表4-5 族語單字錄音表 ... 57

表4-6 族語辭典查詢功能檢核表 ... 99

表4-7 自動化拆解音節功能檢核表 ... 101

表4-8 合成族語語音功能檢核表 ... 106

表4-9 教材閱讀功能檢核表 ... 107

表4-10 錄製音節發音表 ... 115

(11)

v

圖2-1 聊天機器人對話框架圖 ... 16

圖3-1 系統架構圖 ... 24

圖3-2 系統流程圖 ... 25

圖3-3 研究架構 ... 29

圖3-4 研究流程 ... 30

圖3-5 系統建置流程圖 ... 31

圖4-1 LINE Bot Designer 設計畫面圖 ... 38

圖4-2 查詢功能流程圖 ... 39

圖4-3 續查詢功能流程圖 ... 40

圖4-4 自動化拆解音節流程圖 ... 44

圖4-5 續自動化拆解音節流程圖 ... 45

圖4-6 續自動化拆解音節流程圖 ... 46

圖4-7 續自動化拆解音節流程圖 ... 47

圖4-8 續自動化拆解音節流程圖 ... 48

圖4-9 續自動化拆解音節流程圖 ... 49

圖4-10 續自動化拆解音節流程圖 ... 50

圖4-11 續自動化拆解音節流程圖 ... 51

圖4-12 續自動化拆解音節流程圖 ... 52

圖4-13 子音 p 發音錄製圖 ... 54

圖4-14 族語發音 pa 裁切圖 ... 55

圖4-15 自動化合成語音流程圖 ... 58

圖4-16 續自動化合成語音流程圖 ... 59

圖4-17 建和卑南族語第一階第一課之課名圖例 ... 61

圖4-18 建和卑南族語第一階第一課之課文圖例 ... 61

圖4-19 建和卑南族語第一階第一課之生詞圖例 ... 62

圖4-20 選擇第幾階畫面設計圖 ... 63

圖4-21 選擇第幾課畫面設計圖 ... 64

圖4-22 翻閱功能設計圖 ... 65

圖4-23 選擇第幾階功能流程圖 ... 67

圖4-24 選擇第幾課功能流程圖 ... 68

圖4-25 閱讀及翻閱課本功能流程圖 ... 69

圖4-26 續閱讀及翻閱課本功能流程圖 ... 70

圖4-27 續閱讀及翻閱課本功能流程圖 ... 71

圖4-28 續閱讀及翻閱課本功能流程圖 ... 72

(12)

vi

圖4-29 系統檔案分佈圖 ... 96

圖4-30 系統轉向流程圖 ... 97

圖4-31 續系統轉向流程圖 ... 98

圖4-32 測試操作畫面 辭典查詢功能 A ... 100

圖4-33 測試操作畫面 辭典查詢功能 B ... 100

圖4-34 測試操作畫面 子音+母音 ... 102

圖4-35 測試操作畫面 子音+母音+子音 A ... 102

圖4-36 測試操作畫面 子音+母音+子音 B ... 103

圖4-37 測試操作畫面 喉塞音+母音 ... 103

圖4-38 測試操作畫面 子音+母音+喉塞音 ... 104

圖4-39 測試操作畫面 大小寫輸入 ... 104

圖4-40 測試操作畫面 相連的母音 ... 105

圖4-41 測試操作畫面 lr 與 lh ... 105

圖4-42 測試操作畫面 特殊子音 lr 與 ng ... 106

圖4-43 測試操作畫面 合成族語語音功能 ... 107

圖4-44 測試操作畫面 教材閱讀 ... 108

圖4-45 測試操作畫面 選擇第幾課畫面 ... 108

圖4-46 測試操作畫面 閱讀功能 ... 109

圖4-47 測試操作畫面 翻頁功能 ... 109

圖4-48 更新後自動化拆解音節流程圖 ... 110

圖4-49 特殊子音測試圖 A ... 111

圖4-50 特殊子音測試圖 B ... 112

圖4-51 更新後自動化拆解音節流程圖 ... 114

(13)

1

第一章 緒論

本研究主要探討如何透過聊天機器人之技術於通訊軟體LINE 上建立族語學 習系統。本章節共分為四小節,第一節為研究背景與動機,第二節為研究目的與 研究問題,第三節為名詞釋義,第四節為研究範圍與限制,以下針對其內容做詳 細說明,分述如下。

第一節

研究背景與動機

一、研究背景

近年來在科技不斷進步的趨勢下,隨著智慧型手機的出現以及行動通訊技術 的發展下,有越來越多的通訊軟體出現在我們生活中,如:LINE、Messenger、

Telegram、WhatsApp 等多種方便用戶與用戶之間傳遞訊息的通訊軟體,這些通訊 軟體如雨後春筍般地出現,讓現今許多公務繁忙的人以及相距遙遠的人能夠透過 這些通訊軟體來迅速地傳達訊息。全球用戶人數約有兩億的LINE,在臺灣為多 數人使用的通訊軟體之一,由於LINE 能夠隨時且輕鬆的傳遞文字、語音、照片 及影片等訊息,除了被作為通訊使用的LINE,也被當作公眾人物及商家的宣傳 訊息使用,在部落裡有些族人也開始使用族語的書寫符號在LINE 上傳遞訊息。

隨著大數據(Big Data)與人工智慧(Artificial Intelligence)的迅速發展,搭配 通訊軟體與智慧型手機的使用,聊天機器人才得以快速發展,聊天機器人

(Chatbot)最早出現於 1966 年於 MIT 實驗室推出的 ELIZA(Weizenbaum, 1966),在這之後有更多功能的聊天機器人被開發出來。在過去十年中,聊天機 器人正成為與用戶進行交互的越來越受歡迎的選擇,並且聊天機器人的普及和採 用正在迅速普及(Smutny & Schreiberova, 2020)。目前在銀行、保險與線上客服 最常看到聊天機器人的應用,由於聊天機器人能夠二十四小時運轉,並且能夠透 過文字訊息間的關鍵字自動抓取、判斷使用者需要什麼功能,基於以上因素被廣

(14)

2

泛運用。而通訊軟體LINE 也從 2016 年開始提供讓開發者開發聊天機器人的環 境,讓每一位開發者都能夠在LINE 的平臺上開發各種應用的聊天機器人。

二、研究動機

臺灣原住民族歷經多年的正名,截至目前行政院核定之原住民族有16 族,

其語別共有42 種,從日治時期到國民政府的語言政策下,原住民語正面臨於消 失的危機,邱英哲(2008)也在其研究指出,長期推動的單一「國語」政策,限 制了弱勢語言的生存與發展。身為原住民族人,大部分要在學校才能學習自己的 語言,離開學校及課本後有很大機會無法持續學習,在部落裡能使用族語交談的 年輕人也少之又少。原住民族瀕危語言復振補助計畫中提及,現今30 歲以下族 人的族語使用能力已大幅降低(原住民族委員會,2019)。洪志彰(2006)在其 研究中提及下列五點族語學習的困難:一、家長在家不說母語。二、學校缺乏生 活化的族語環境。三、教材缺乏(族語教材及教學媒體)。四、教學時數太少。

五、部定族語能力指標太高。因此,復振族語以及族語教育的已不能再等也不能 再慢了。

根據原住民族語言調查研究三年實施計畫得知此調查透過下列四個構面做綜 合評估(原住民族委員會,2016):一、族語傳承。二、日常生活族語使用比 率。三、族語使用場合。四、族語能力測驗。研究中,根據前述四個構面所做的 綜合評估中提到卑南族的族語表現方面處於很危險的狀態。

為了傳承以及保留語言,有部分族人開始於LINE 上書寫族語來談話,但多 數族人不太熟悉書寫方式以及閱讀,有許多初學者更是面臨無法正確拆解音節、

發音,或是不懂字詞意思以及用法,若能夠有個系統能夠及時提供上述需求讓學 習者不因各種困難中斷學習,將會對於學習者在族語學習的這條路上有莫大的幫 助。

根據上述情形與需求,本研究欲建立一個具有辭典查詢、自動拆解音節、自 動合成語音等功能的族語學習系統,基於便利性,開發平臺選擇族人常用之通訊 軟體LINE,同時使用聊天機器人的技術來做為系統基礎,讓使用者能夠在傳遞 訊息之餘還能夠方便的查詢族語單字。其中自動合成語音的功能可以減少使用人

(15)

3

工錄製單字的麻煩,不論是舊有的單字還是創新詞,只要能夠使用建和卑南族語 的書寫符號將該單字或新詞書寫出來,皆可以自動拆解並自動合成語音,讓學習 者學習各種單字的發音。

最後,期望透過此研究開發之系統讓更多的人開始學族語,不論是卑南族人 或是對族語有興趣的人,都不再因為族語教師數量、時間與空間的限制以及族語 發音資料缺少,而放棄或中斷族語的學習。李壬奎(2010)認為臺灣南島語個別 差異大,但又保有許多古南島語的特徵,所以每一種臺灣南島語都很值得做深入 研究。因此,希望可以透過本研究,將自動拆解音節與自動合成語音等多種技術 擴散到16 族 42 語別,讓大家共同開發更多族語學習系統,一起守護並且傳承原 住民族美麗的語言。

(16)

4

第二節 研究目的與研究問題

根據上述研究動機,本研究欲探討如何在通訊軟體LINE 上建立族語學習系 統,並根據研究目的產生之研究問題作為此次研究重點。本研究具體研究目的及 研究問題如下:

一、研究目的

(一) 設計適合於通訊軟體 LINE 上使用的族語學習系統。

為了使族語學習者能夠更方便且隨時能夠學習族語,因此,本研究最主要目 的在於開發一款能夠在通訊軟體LINE 上的族語學習系統,期望透過此系統之開 發讓更多的人能夠不受教師與空間的學習族語。

(二) 即時查詢族語單字。

在學習族語過程中經常會遇到不懂的字詞,而有時會因為沒能來得及查詢錯 過學習機會,若能夠有個方便查詢並且翻譯族的單字的功能,在族語學習上能提 供非常大的幫助,不會因為時間或地點的限制阻礙了學習的機會。

(三) 系統自動化拆解音節及合成族語語音。

本研究之系統將會有以下兩點為主要功能,分別為自動化拆解音以及合成族 語語音,自動化拆解音節的功能能夠在使用者輸入族語單字後進行文字的辨識,

並且回饋拆解後的族語單字,如使用者輸入kasavakan 後系統將會回饋 ka-sa-va- kan,使族語學習者能夠更清楚族語單字音節。此外,自動化拆解音節也是合成 語音的基礎工作,透過音節的拆解後,系統將能夠使用拆解後的族語音節去合成 族語語音,最後族語學習者除了可以看到音節的拆解方式之外,也能夠聽到實際 的族語發音。

(四) 分析族語教師對於此系統的滿意程度以及在族語學習上的幫助。

系統開發中將會給予族語教師使用,並且根據其回饋去做系統的修正,由於 系統內容與族語教學相關,因此,對象必須為族語教師,除了能夠確保內容的正 確性,也能透過族語教師的教學經驗去了解系統提供的內容是否符合學生在學習

(17)

5

所需的內容。系統開發完成後將會請族語教師實際操作,並請族語教師根據使用 後的感想給予回饋,根據族語教師的回饋來探討此系統對於學生在學習族語上是 否有正向的幫助。

二、研究問題

(一) 適合於通訊軟體 LINE 上使用的族語學習系統。

1. 可以提供哪些學習內容?

2. 如何呈現學習內容?

(二) 透過系統即時查詢族語單字。

1. 如何建立有規律的族語辭典?

2. 族語辭典需要有哪些內容?

(三) 自動化拆解音節與合成族語語音。

1. 如何自動化拆解音節?

2. 如何自動化合成族語語音?

(四) 給予族語學習者正向幫助。

1. 聊天機器人是否有助於學習族語?

2. 系統的實用性以及便利性如何?

(18)

6

第三節 名詞釋義

本節將本研究所涉及的重要名詞,分別說明如下:

一、聊天機器人

一般定義上,聊天機器人是經由對話或文字進行交談的電腦程式,能夠模擬 人類對話,聊天機器人可用於客戶服務或資訊獲取,有些機器人會搭載自然語言 處理系統,但大部分的聊天機器人只會擷取輸入的關鍵字,再從語料庫中找尋合 適的應答句回覆,目前的聊天機器人是虛擬助理的一部份,可與許多組織的應用 程式、網站以及即時消息平臺連接。非助理應用的程式包含聊天室、研究和特定 產品促銷的社交機器人。本研究中,聊天機器人是指具有關鍵字輸入並於語料庫 搜尋資料回復之功能。

二、LINE BOT

LINE BOT 是 LINE 於 2016 年公佈的聊天機器人技術,任何開發者都能透 過其Messaging API 在 LINE 的平臺上開發多元的聊天機器人應用。本研究將透 過LINE 做為機器人開發平臺,開發一款適用學習建和卑南族語的系統。

三、學習系統

學習系統泛指任何提供學習者自學之系統,其系統型態可為軟體、網頁及 App 等多種型態,在本研究中所建立之學習系統將提供建和卑南族語學習的內 容,其內容可包括族語辭典查詢、族語教材閱讀、音節拆解、語音合成及語音播 放等多項功能,此外,本研究中的學習系統是基於於通訊軟體LINE 上所開發之 應用程式,因此使用者不需要安裝或下載任何的軟體,僅需透過通訊軟體LINE 即可以操作的學習系統。

(19)

7

四、建和卑南族語

卑南族分佈於臺東市以及卑南鄉之中,其十個部落分別為龍過脈部落

(Dandanaw)、初鹿部落(Ulivelivek)、上賓朗部落(Alripay)、下賓朗部落

(Pinaski)、南王部落(Puyuma)、寶桑部落(Papulu)、泰安部落

(Damalagaw)、利嘉部落(Likavung)、建和部落(Kasavakan)以及知本部落

(Katatipul)。

上述的十個部落均為卑南族,但其語別分為南王、知本、建和以及西群四大 語別,表1-1 為卑南族四大語別使用部落對照表,由表中可看到卑南族各語別與 使用部落的詳細對照,其中建和卑南語僅為建和部落使用。

表1-1

卑南族四大語別使用部落對照表

卑南族語別 使用部落

南王語別 南王部落、寶桑部落

知本語別 知本部落

建和語別 建和部落

西群語別 泰安部落、利嘉部落、龍過脈部落、

初鹿部落、上賓朗部落、下賓朗部落 資料來源:研究者自行整理

(20)

8

第四節 研究範圍與限制

本研究以建和卑南族語為主,主要設計出能讓卑南族語的學習者使用的學習 系統。本節將探討此次研究範圍及研究限制,分述如下:

一、研究範圍

為了清楚描述本研究的範圍,所以從研究對象及內容兩方面來說明,說明 如下:

(一) 研究對象

為確保本研究之系統內容正確性,研究對象挑選條件為通過建和卑南族語優 級、高級認證之族語教師為主要對象,由於研究對象為族語教師,因此,除了能 夠確保系統內容的正確性之外,也能夠確保其實用性,以及是否能夠幫助族語學 習者學習族語。

(二) 研究內容

依照族語學習者在學習過程中的困難,根據其學習需求在通訊軟體LINE 上 設計成方便學習者使用的聊天機器人,如:拆解族語單字音節、合成族語語音以 及提供九階教材的內容,期望提供族語學習者更佳學習族語的管道。

二、研究限制

(一) 時間與經費的限制

因研究時間以及經費限制,本研究之族語辭典編輯範圍為建和卑南族語千詞 表中的254 個初級單字做為基礎資料,因此未能涵蓋所有族語單字。

(二) 語別的限制

卑南族各語別之間的書寫系統以及發音有些微不同,因此本研究系統內所提 供的語音及辭典等功能,僅針對建和卑南族語之書寫方式及發音方式,未能涵蓋 所有卑南族語之發音與書寫方式。

(21)

9

第二章 文獻探討

本章主要探討相關研究與系統的內容,針對國內外學者的研究作分析。本章 共分為三節,第一節為建和卑南族語發音及書寫系統,在本節會先簡述原住民族 書寫系統的發展歷史,再將建和卑南族語的書寫文字、元音、發聲部位及發聲方 式整理成表格做對照,第二節為探討卑南族語學習相關系統,內容為分析國內現 有系統的介面、功能、問題即改進方向,第三節為教育與聊天機器人相關之研究 探討,本節內容將分別以聊天機器人的發展與應用、聊天機器人在教育上的應 用、現今聊天機器人的發展與困境三點分別說明,其中聊天機器人在教育上的應 用將探討少數語言及教育用途之聊天機器人的相關研究。以下針對其內容做詳細 說明,分述如下:

第ㄧ節

建和卑南族語發音及書寫系統

本節將敘述原住民族書寫系統的發展與歷史以及建和卑南族語的發音方式及 書寫文字,在建和卑南族發音方式及書寫系統上,本研究將透過元音、發音部位 及發音方式並加上書寫文字做為對照,分述如下:

一、原住民族書寫系統之發展

臺灣的原住民族並無發展自身的文字,因此在歷史上歷經多種外來的文字記 載與使用,若根據歷史來區分,臺灣的原住民文字書寫系統有以下五種不同的方 式與時期(李壬癸,2007):

(一) 羅馬字:從 17 世紀荷蘭統治台灣開始,荷蘭的傳教士就使用羅馬 字紀錄西拉雅語(Siraya)和費佛朗語(Favorlang),其中西拉雅族人 學會羅馬文字後也使用此方式書寫契約文書。

(二) 漢字:從 17 到 19 世紀,清朝時期的臺灣漢人曾使用漢字記錄臺灣 原住民的詞彙以及歌詞。

(22)

10

(三) 日文片假名:日據時代的警察及學者都會使用片假名紀錄臺灣原住 民語的資料,其中包含詞彙及會話。

(四) 注音符號:在臺灣光復之後,國民政府開始禁止使用羅馬字的書寫 方式,因此開始有部分的傳教士會使用注音符號來編輯聖詩和聖經。

(五) 國際音標:語言學者使用於編輯語言辭典。

在上述所提到的五種原住民文字書寫系統中,羅馬字和國際音標是最好使用 的書寫方式,在原住民各族群中又以羅馬字的使用最為廣泛,也因為如此,其書 寫方式最多版本,沒有統一的標準與規範。因此,從1992 年開始至 2005 年間,

原住民的書寫系統歷經教育部、各教會、語言學界以及原住民委員會的的努力,

最終在2005 年達成共識,並於同年 12 月 15 日公告實施。

(23)

11

二、建和卑南族語發音方式及書寫系統

本研究根據行政院於2005 年 12 月 15 日所公告的原住民族語言書寫系統,

將建和卑南族語的書寫系統整理如下,以下將根據元音以及輔音作為區分方式,

分別如表2-1 及表 2-2 所示:

表2-1

建和卑南族語元音及書寫文字

元音 書寫文字

前高元音 i

央中元音 e

央低元音 a

後高元音 u

後中元音 o

資料來源:研究者自行整理

表2-2

建和卑南族語輔音及書寫文字 發音部位

發音方式 雙唇 唇齒 牙齒 舌尖 硬顎 捲舌 舌根 喉音

塞音 清 p t c k

鼻音 m n ng

擦音 清 s h

濁 v d z ’

邊音 l lr

顫音 r

滑音 w y

資料來源:研究者自行整理

(24)

12

第二節 卑南族語相關學習系統

由於原住民委員會建立之多個族語學習系統,根據研究需求,本節將探討現 有族語學習系統之介面與功能、問題與改進,透過此方式了解本研究可努力且改 善之方向。分別加以論述如下:

一、原住民族語言線上辭典

(一) 介面與功能

原住民委員會建立之原住民語言線上辭典中涵蓋 16 族的族語辭典查詢功能,

在搜尋頁面有虛擬鍵盤可以讓使用者用點選的方式輸入族語單字,也可以使用中 文查詢族語意思,有族翻中、中翻族的功能,查詢結果會顯示相關例句,讓學習者 在搜尋單字時能夠學習到更多字詞。此外,詞項列表功能會列出該字母開頭的所有 單字,有助於學習者可以同時檢視該字母開頭的單字。

(二) 問題與改進

以查詢卑南族語來看,雖然此網頁有查詢建和卑南族語的選項,但實際操作後 發現此系統沒有建和卑南語的資料,當查詢 maca(眼睛)時會顯示目前查無符合 條件之資料,用中文查詢時的結果都會是別的方言別的資料,如查詢眼睛時的搜尋 結果會是matra,並非建和卑南族語的書寫方式 maca。

二、族語E 樂園

(一) 介面與功能

原住民委員會建立之族語 E 樂園中提供 16 族 42 語別的紙本教材、多媒體教 材、互動式教材教具、線上遊戲以及族語幫手等多種功能,其中又以紙本教材、單 詞查詢與九階教材最常被族語教師運用在課堂上。此外,此網頁有提供 API 可供 開發者使用,其參數可分為語別、字串及類型等多個參數可以設定,以便開發者開 發族語相關系統。

(25)

13

(二) 問題與改進

在語音播放系統上,有部分語音資料與頁面呈現的資料不符,偶爾會造成學習 者在學習上的困擾。在族語語音檔案上,由於都是由真人錄製,因此有許多單字或 句子因沒有錄製,導致學習者無法聽到發音。

三、原住民族語言能力測驗

(一) 介面與功能

原住民委員會建立之原住民族語言能力測驗網站中提供初級以及中級的線上 學習以及線上測驗功能,讓準備考試的學生能夠透過此網頁快速的複習考試範圍。

此外,網頁上也提供初級、中級、高級以及優級的範例試卷下載,同時也能夠透過 線上功能閱讀考試題型。

(二) 問題與改進

此網站的考試題型初級、中級、中高級、高級以及優級全部都沒有建和語別,

僅有南王語別的資料。下載的範例考卷並未最新的中高級認證考題並未更新至檔 案內。

四、小結

經由探討發現以上三種族語相關學習系統並未結合通訊軟體,部分平臺也未 含建和卑南族語的學習內容,使建和語別的學習者缺少學習資源。由於族語 E 樂 園為最新的族語學習網站,所以此網站功能整合是最完善的,在族語 E 樂園和原 住民族語言能力測驗上有許多語音都是早年所錄製的,後續還有很多族語單字並 未錄製,人力、經費都是考量,若是系統可以自動合成語音,將可以不需經過真人 錄製每一個單字。

(26)

14

第三節 教育與聊天機器人之研究探討

本節共分為三個部份:第一部分將探討聊天機器人之發展與應用,其中會依 序分別探討說明聊天機器人的發展、分類及應用,第二部分將探討聊天機器人於 教育上的應用,分別是少數語言的學習以及輔助學習,第三部分將探討目前聊天 機器人的發展與困境,內容將列出聊天機器人的主要優勢及缺點,分別加以論述 如下:

一、聊天機器人之發展與應用

(一) 聊天機器人的發展

在聊天機器人發展的路上,不得不提到Joseph Weizenbaum 在 1966 年於 MIT(Massachusetts Institute of Technology)實驗室推出的第一個聊天機器人 ELIZA(Weizenbaum, 1966),在研究報告中可以看到 ELIZA 會使用輔導技巧 中的重述,讓使用者更願意談論有關自己的更多敘述。在技術上,ELIZA 並未 了解使用者的語意,因此也無法透過邏輯推理上下文之間的關聯與意思,其實現 的方法是透過提取並識別使用者所輸入的關鍵字,再將結果回饋給使用者,若產 生的結果有多個選項,則會隨機挑選一個結果回饋給使用者,因此,ELIZA 並 未擁有真正的智慧。

在ELIZA 推出後的 29 年後,Richard S. Wallace 於 1995 年推出了一款聊天 機器人A.L.I.C.E(Wallace, 2009),雖然 A.L.I.C.E 背後的運作原理一樣是使用 詞語類型配對的方式,但A.L.I.C.E 使用了人工智慧標記語言(Artificial

Intelligence Markup Language),因此,A.L.I.C.E 更像是加強版的 ELIZA,透過更 大的語料庫和更強的比對技術,使得A.L.I.C.E 的回應比 ELIZA 更符合人與人之 間交流時的語句。

在2010 年之前聊天機器人都是處於文字對文字的狀態,一直到蘋果公司推 出的人工智慧助理Siri 開始有了和語音相關的聊天機器人,與其他的聊天機器 人,裝載在iOS 系統上的 Siri 能夠識別使用者的語音,並且做出相對應的服務,

(27)

15

如:設定鬧鐘、查詢天氣、設定行事曆等,同時Siri 在給予使用者文字回饋的同 時,也會播放該段文字的語音,因此視障者也能夠透過語音的判讀以及回饋使用 Siri。在 Siri 推出後,有許多大公司接著陸續推出自己的聊天機器人,如:微軟 小冰、Amazon Alexa、Google Assistant 等。

(二) 聊天機器人的分類

在聊天機器人的分類上可以有多種形式,如用途、技術、領域、平台等多種 方式,若根據其對話能力則可分為開放領域及封閉領域,根據其回覆方式則可分 為檢索型及生成型:

1. 開放領域(Open Domain):處於開放領域的聊天機器人可以不需 要上下文的對話,可以立即根據使用者給的問題做回應,而使用者 所提的問題可以是任何方面的問題。

2. 封閉領域(Closed Domain):在眾多的聊天機器人中,大部分的聊 天機器人都屬於封閉領域的聊天機器人,可以在一定範圍內回答某 領域或特定主題的問題,相比開放領域,封閉領域較容易實現。

3. 檢索型(Retrieval Base):基於檢索所建立的聊天機器人可以透過 邏輯判別使用者輸入的問題,並且在分析後從既有的語料庫之中取 得相對應的資料回應給使用者,而這種方式並不會產生新的資料。

4. 生成型(Generative Base):生成型的回覆方式不需要預先建立語 料庫,而是在接收到資料後自動產生相對應的回應資料,跟檢索型 相比,生成型不需要先建立大量的語料庫,但相對的生成型也是較 困難的一種。

(28)

16

根據前述的兩個分類方式組合成圖,分別將對話能力放置於Y 軸以及將回覆 方式放置於X 軸,可轉為下方的圖 2-1 聊天機器人對話框架圖。

對 話 能 力

開 放 領 域

不可能

通用型人工智慧

(最難)

封 閉 領 域

基於規則

(最簡單)

智慧型機器

(難)

檢索型 生成型

回覆方式 圖2-1 聊天機器人對話框架圖

資料來源:Mark, C. (2016)

根據圖2-1 聊天機器人對話框架圖可以看到總共有四種聊天機器人的類型與 開發難易度,分別為:

1. 開放領域 – 檢索型:開放領域沒有針對特定的主題或是專業服 務,因此不太可能有開發使用於開放領域的檢索型聊天機器人。

2. 開放領域 – 生成型:此種類型是最難實現的聊天機器人,要能夠 於開放領域且能夠生成相對應的回應給使用者,在現今的所用有的 開發技術上尚未足夠支持,因此,此類型在現階段還無法實現。

(29)

17

3. 封閉領域 – 檢索型:於封閉領域使用檢索型的聊天機器人是目前 最普遍的一種類型,由於其技術門檻不高,且開發廣度非常之廣,

雖然其功能有限,但依目前的開發數量來說還是最多的類型。

4. 封閉領域 – 生成型:在封閉領域中使用生成型的聊天機器人,由 於生成型並非使用預先建立的語料庫,因此可以在特定領域針對一 些未定義的例外做回應。

(三) 聊天機器人的應用

聊天機器人目前在生活上有多種應用,根據其應用領域可分為:

1. 個人助理:此種聊天機器人可以根據使用者所發出的指令自動完成 該辦事項,如:告訴使用者有什麼行程,或是幫使用者設定鬧鐘等 設定。

2. 線上客服:隨者電子商務的發展,使用線上購買與詢問的人數不斷 上升,因此有許多電子商務的公司提供聊天機器人協助顧客購買商 品及退換貨等相關事宜。

3. 娛樂:部分聊天機器人背後是有趣的語料庫,使用者可以跟該聊天 機器人談話,其回覆內容皆是有趣的回應,可以娛樂使用者。

4. 交通:聊天機器人在交通的領域中可以協助使用者訂購機票或叫車 等多種用於交通的服務應用。

5. 金融與保險:聊天機器人在金融與保險上的應用受個大銀行及保險 公司運用,此種可以幫使用者估算理財金額及建議理財方式,也能 夠提供保單試算及保單疑問等多種服務。

6. 教育:聊天機器人在教育上有許多應用,如語文的學習、歷史的學 習、聽力及發音的學習,在功能上會輔助使用者在該學習領域的知 識。

(30)

18

二、聊天機器人在教育上的應用

聊天機器人目前運用在多種行業與服務上,本段將針對聊天機器人在教育上 的運用做文獻探討,以了解聊天機器人在教育上的運用以及使用成效,下列將逐 步針對各研究論述。

(一) 瀕危語言的語音合成聊天機器人技術:愛爾蘭語言平台的動機、發 展和評估

此研究中製作的聊天機器人是針對愛爾蘭語教育所開發的,由於愛爾蘭語為 瀕臨滅絕的少數語言,要學習愛爾蘭語也並非容易的事,因此,如何提供具有吸 引力的學習方式成為了關鍵。此研究重點在於合成愛爾蘭語音,透過語音的合 成,讓學習者能夠根據合成後的愛爾蘭語音學習發音,而這些發音不受限使用者 輸入的字詞,只要輸入愛爾蘭語皆能夠合成語音並且播放,在語言學習上是非常 有幫助的,總體來說,此研究所製作的聊天機器人對於學習愛爾蘭語有相當的幫 助。

(二) 實現 LINE BOT 用於自動化峇里語辭典

此研究中所製作的聊天機器人是針對峇里語教育所開發的,在研究中提及峇 里語可能不是第二語言,但一定不會是第一語言,由此可看出學習峇里語有一定 的難度在。研究中的聊天機器人是基於LINE 所開發的 LineBot,透過建立峇里 語辭典並使用LineBot 作為溝通介面,使用者可以透過該聊天機器人查詢峇里語 詞的意思,進而學習峇里語,總體來說對於峇里語學習者在學習上有正向幫助。

(三) 使用 LINE BOT API 為外國學生設計的互動式電子化生涯歷程檔案 模組

在指導的過程中,教師會設定學習目標並請學生根據目標繳交作業,在作業 中學生僅記錄教師的上課內容,在教與學的過程中少了有意義且有深度的對話。

此外,在繁多的作業中學生覺得繳交電子作業很煩麻,且教師給的回饋沒有太大 的重要性,教師方也覺得直接的對話更能提供學生更深層次的指導,透過作業繳 交並不能完全掌握學生的學習狀態。

(31)

19

因此,此研究是為了改善指導老師與留學生的教學回饋所生成的,由於需要 對話指導,此研究採用LineBot 作為設計基礎,系統可以分析使用者的語句並根 據資料庫中的資料回饋給使用者,透過設計好的對話內容與方向,可以引導學生 進行思考,由於系統是使用LineBot 作為設計基礎,留學生也能夠隨時使用,最 後將學生所傳送的資料及問題收集後給指導教師,做進一步的指導。

(四) 聊天機器人:針對學生的教育支援系統

在此研究中,開發了一款能夠針對計算機科學和計算機網絡基礎課程所使用 之聊天機器人,其透過NLP(Natural Language Processing)等技術所支持建立,

透過關鍵字以及推斷使用者的意圖,聊天機器人可以自動識別學生的需求,學生 可以針對特定主題發問,而聊天機器人會根據收到的問題給出詳細的說明答覆學 生。

在開發完成後,研究團隊將此聊天機器人放置於學校的電子學習平臺上實 施,讓修課學生能夠透過此機器人去學習,但由於機器人處於開發中,因此在測 試完畢後發現有時機器人未能給出學生所期望的答案,亦或是關鍵字抓取不清,

導致給出正確答案但卻不是使用者所需之方向。研究中可看到在透過問卷調查後 發現,聊天機器人提供訊息的正確率達到71%、正確但不合適達 16%、錯誤訊 息達12%。在實施後也確實證實了透過聊天機器人進行教學的方式有良好的前 景。

(五) 小結

在少數語言教育上,因使用人數少以及教師不足等多種原因一直未能有很好 的教育基礎,因此如何找出適當且能夠幫助少數語言教育的方法也成為一種研究 方向,如上述所提及的瀕危語言的語音合成聊天機器人技術:愛爾蘭語言平台的 動機、發展和評估以及實現LINE BOT 用於自動化峇里語辭典,這兩個研究所 製作之對話機器人皆是為了少數語言教育所製作的,根據其語言設計合適的聊天 機器人,並且於製作完成後實際給予使用者操作,上述與少數語言教育相關研究 所開發的聊天機器人在使用後均得到對於學習該語言有正向幫助的研究結果。因

(32)

20

此,若能將上述與少數語言教育研究中所研發的方向,如:合成語音、建立辭典 以及查詢辭典功能作為本研究系統研發重點,將有機會展現更佳的研究成果。

此外,透過使用LINE BOT API 為外國學生設計的互動式電子化生涯歷程檔 案模組以及聊天機器人:針對學生的教育支援系統的研究探討後可以發現,聊天 機器人在教育上有其需要的空間,同時也真的能夠提供教師與學生適當的幫助。

很多時候不論是教師方面還是學生方面,都會因為時間的問題而不能好好地進行 教學對話或是課後講解及加強。為了解決這些問題使教育更有效率,上述所探討 的教育用途之聊天機器人,研究出能夠讓學生隨時對課程內容提問並且獲得解 答,並且還能能夠減緩教師的工作量負擔,在教育上,這些特點都明顯有正向的 幫助。

三、目前聊天機器人的發展與困境

在大數據以及人工智慧的迅速發展下,聊天機器人得到了快速的發展,在技 術上的結合包含了機器學習、深度學習、自然語言處理、資料庫、聲音技術、圖 像識別等多種技術,這些技術皆可以和聊天機器人結合並且發展出相對應的應 用,聊天機器人在這發展的過程中也產生了其優勢及缺點,本段將敘述聊天機器 人的主要優勢及缺點:

(33)

21

(一) 聊天機器人的優勢:

1. 更快的服務

聊天機器人能夠提供24 小時隨時在線的服務,相較於人工服務,聊天 機器人更能即時處理使用者的問題。

2. 一對多服務

在服務上,人工有服務人數的限制,但聊天機器人並沒有此限制,它可 以一次處理所有使用者的問題。

3. 用途廣泛

不論是教育、行銷、金融等多種領域,聊天機器人皆可結合各領域的技 術,設計成該領域可提供的服務。

(二) 聊天機器人的缺點:

1. 回應有限

由於目前所開發的聊天機器人多屬於封閉領域 – 檢索型的類型,聊天 機器人的回應僅能在自身的語料庫中搜尋適合的回應給使用者,若沒有 找到適合的回應,聊天機器人可能會因此在原地打轉,讓使用者失去耐 心。

2. 按照規定的方式操作

在聊天機器人的問答上,若沒有依照規定操作,聊天機器人可能無法做 出正確的回應或是故障,儘管聊天機器人可以同時回應多個使用者的問 題,但若出現意外的訊息時,將無法提供該有的回應。

3. 不夠聰明

因技術限制,通用型人工智慧與智慧機器不易開發,因此目前開發的多 是封閉領域 – 檢索型的類型,比起人工,此類型的聊天機器人不能保 持每次的回應都非常準確。

(34)

22

聊天機器人主要有上述的優點和缺點,以目前來說需要努力和進步的空間還 很大,若能夠持續發展技術其潛力應該非常大。以技術來說,聊天機器人可以是 多個技術整合的應用,因此,聊天機器人應著重於服務的發展與定位,與APP 的不同,聊天機器人更像是一種網頁應用,因為它不需要下載與安裝,同時需要 透過網路做連接,取得使用者的請求與回應,也因如此,能夠提供使用者需要的 服務才是重點,一個沒人使用的聊天機器人,做得再好也是徒勞的。

在族語學習上有諸多因素的影響使學習者未能順利學習族語,如場地、教 師、時間、書寫符號等多種因素,若在提供族語學習者學習材料上更加的多元以 及彈性,想必能夠產生更佳的學習效果。因此,在族語學習的需求上可能有以下 幾點,如更方便的學習方式,可以很大程度的解決場地、教師及時間的因素,而 此部分可以從系統平台來著手,如使用手機操作更為方便的平台,通訊軟體。再 來是書寫符號的問題,由於族語初學者對於書寫符號的陌生,造成在學習族語的 過程中有很大的阻礙,如族語單字音節的拆解、單字的發音等都需要有個方法來 解決,因此,若能夠給予更容易閱讀的方式以及提供發音方式,能給予初學者在 學習上很大的助力,減少學習的無力感。

(35)

23

第三章 研究設計與實施歷程

本章共分為五小節。第一節為研究設計與工具,第二節為研究架構與步驟,

第三節為研究場域與研究對象,第四節為資料信實度,第五節為研究倫理。以下 針對其內容做詳細說明,分述如下:

第一節

研究設計與工具

本論文為質性取向,是依據軟體工程系統發展的歷程來進行研究,並透過聊 天機器人之技術來建立卑南族語學習系統,將此學習系統給予建和卑南族語教師 使用及回饋,透過回饋與修正來保證系統的完整性。本研究主要針對建立族語辭 典與資料庫、自動化拆解音節、族語語音合成以及族語教材閱讀等四項功能作為 系統主要功能,本節將分述四項功能的實現方式以及所需研究工具。

一、系統分析

(一) 系統架構

本研究之族語學習系統下主要分為四項功能,分別為族語辭典、自動化拆解 音節、族語語音合成、族語教材閱讀,根據不同的功能下又細分為不同的子功 能,如族語辭典下有查詢族語單字之功能,其中包含中文意思、族語例句、中文 例句、字根等內容,族語教材閱讀下則包含選擇階層、選擇課文以及閱讀課文,

其他如自動化拆解音節及族語語音合成下則為拆解音節及合成語音的功能。將上 述敘述繪製成圖後如圖3-1 系統架構圖所示。

(36)

24

圖3-1 系統架構圖 族語學習系統

族語辭典

查詢族語單字

中文意思

族語例句

中文例句

字根

自動化拆解音節

拆解音節

族語語音合成

合成語音

族語教材閱讀

選擇階層

選擇課文

閱讀課文

(37)

25

(二) 系統流程

本研究所製作之系統是基於通訊LINE 上所開發的聊天機器人,因此使用者 是透過LINE 來操作,在系統溝通上,是由 API 來串接 LINE 與族語學習系統之 間的資料傳遞,因此系統在接受到API 的資料時,會判別需要進入到何種功能,

並將系統功能運作後產生的資料再透過API 回傳給使用者,則使用者即可在通訊 軟體LINE 上直接看到結果,如圖 3-2 系統流程圖所示。

圖3-2 系統流程圖 使用者

LINE

API

族 語 學 習 系 統

族語辭典 自動化拆解音節 自動化合成語音

資料庫搜尋 資料處理 自動化拆解音節

閱讀族語教材

選擇階層

選擇課文

呈現課文 建立聲音檔案

(38)

26

二、系統設計

(一) 族語辭典與資料庫

本研究欲透過原住民族委員會所編輯的16 族 42 語別的千詞表中的建和卑南 族語千詞表當作基本單字資料來源,在建和卑南族千詞表中的資料有分類、序 號、族語、中文、級別、備註等六種資料,本研究將會取出級別為初級的254 個 單字作為族語辭典之單字來源,千詞表中的資料也只留下族語、中文、級別三種 資料,此外,本研究將會加上新的資料,如:中文例句、族語例句、字根等。根 據前述方式建立完254 個初級單字後,會將檔案儲存成 csv 檔,並將資料放入資 料庫中,以便後續的資料讀取。此外,此部分的功能畫面設計將會使用Line Bot Designer 作為設計方式,並將設計完產生的 JSON(JavaScript Object Notation)資 料修改後放入程式碼中,即可實現畫面的呈現。

(二) 自動化拆解音節

自動化拆解音節是本研究極為重要的部分,必須先實現自動化拆解音節的部 分才能夠接續完成族語語音合成的內容,然而自動化拆解音節的實現方式需要分 析族語音節規則才能夠設計出正常運作的程式碼,因此,本研究會先分析族語音 節規則,透過瞭解族語音節的組成,在撰寫程式時才能夠順利設計出符合的邏 輯。在系統操作上會讓使用者輸入一個族語單字,當系統接收到訊息後,將會透 過邏輯的判斷將該單字拆分成正確的發音音節。

(三) 族語語音合成

本研究欲製作之語音合成方式為使用軟體Audacity 錄製各種音節發音,並且 將發音儲存並命名為該發音,透過前項所製作的自動化拆解音節所拆解的結果去 搜尋與音節發音相同的檔名,最後使用系統指令CAT 將檔案合併為新檔案並播 放。如:錄製i、nu、pa、na、yan 等五個音節發音,即可以組合成 inu(你)、

nana(痛)、i iyan(哪裡)、ina(媽媽)、inupanayan(生日)等多種單字發 音。

(39)

27

(四) 族語教材閱讀

在教材閱讀上將分為兩部分,第一部分為教材選用,本研究欲使用原住民族 委員會所製作的九階教材作為提供的內容,本研究將會把教材內容的圖片擷取下 來並將檔案透過系統化的編排方式儲存於伺服器中。第二部分為系統操作方式,

本研究欲透過按鈕以及ImageMap 的方式讓使用者操作,按鈕的按壓可以選擇閱 讀的內容,ImageMap 則可以實現翻頁功能。

三、研究工具

本研究以質性研究探討如何運用聊天機器人之技術於通訊軟體LINE 上建立 族語學習系統。本研究所需要的研究工具如下:

(一) Messaging API

Messaging API 讓 Data 可於 Bot Server 及 LINE Platform 之間傳遞,於 HTTPS 上傳送的 Request 將為 JSON 格式。其發送訊息有文字、圖片、語音及 影片等等多種類型的格式,透過傳送不同的訊息類型來達到訊息的傳遞,讓使用 者能夠有較佳的閱讀體驗。

(二) PHP

PHP 的全名為 Hypertext Preprocessor ,其為一種程式語言,被廣泛運用於 網頁的程式開發上。本研究將使用PHP 編寫本研究之族語學習系統程式,透過通 訊軟體LINE 的平臺實現建立於通訊軟體上的族語學習系統。

(三) WebServer

WebServer 中文名為網頁伺服器,透過網路接受 HTTP 的請求,提供 HTTP 回覆給請求者。由於LINE BOT API 需要使用 HTTPS,本研究將使用支援多種程 式語言且提供一定使用時數內免費使用的雲端運算平台Heroku 作為伺服器。

(四) Database

Database 中文名為資料庫,又稱為資料管理系統,其使用一定的方式將大量 的資料儲存在一起,一般具有儲存、擷取、安全保障、備份等基本功能。在資料 庫的選用上,本研究將使用Heroku 上所提供的 Heroku Postgres 做為資料庫,而 Heroku Postgres 屬於 PostgreSQL,是一種關聯式資料庫。

(40)

28

(五) SQL

SQL 的全名為 Structured Query Language,其用於管理關連式資料庫管理系 統,並且可在資料庫中查詢的程式設計語言,其功能可以存取資料,如:新增、

刪除、查詢、修改等功能。

(六) Line Bot Designer

Line Bot Designer 是由 LINE 所提供之軟體,其功能可讓設計者快速設計聊天 機器人原型,在Line Bot Designer 上所產生的 JSON 程式碼也能應用於未來的聊 天機器人開發。

(七) Audacity

Audacity 是一款免費軟體,此軟體也能在多種作業系統上執行,可用於聲音 錄製、裁減、貼上、接合等多種關於聲音編輯的功能,並且能夠儲存為多種聲音 檔案。

(八) 訪談大綱

本研究之訪談主要談論系統提供的內容以及其優缺點,探討此系統是否有助 於學習族語以及需要改善的部分,訪談大綱如附錄一。

(41)

29

第二節 研究架構與步驟

一、研究架構

本研究架構是依照研究背景與動機及研究目的所擬定,是基於族語復振的原 因使用通訊軟體來交談與學習族語,根據此原因來設計適合用於通訊軟體上的族 語學習系統,其內容包含族語辭典、拆解音節、合成發音、教材閱讀等四項功 能,並在系統設計與製作完成後給予族語教師使用,並根據族語教師的回饋來分 析是否有助於學習族語以及系統的實用性及便利性,整理過後如圖3-3。

圖3-3 研究架構 族語復振

通訊軟體傳族語訊息

族語學習系統

學習族語

族語辭典 拆解音節 合成發音 教材閱讀

實用性與便利性 是否助於學習族語

(42)

30

二、研究流程

將本研究流程分為五大階段,分別是準備階段、行動階段、資料分析、撰寫 論文,分別說明如下:

(一) 準備階段:確定研究目的及研究問題後,首先進行文獻探討及分 析,再來決定研究方法,選定訪談對象,設計系統架構,最後與指導教授討論後 修正。

(二) 行動階段:先進行系統分析與設計,設計完後開始撰寫系統的程 式,在開發完成後做系統的測試與修正,推出正式版本後給予訪談對象使用。

(三) 資料蒐集階段:通知研究對象安排測試系統及受訪時間,訪談的同 時填寫觀察記錄,並依照實際情況調整訪問順序及內容。

(四) 資料分析:在正式訪談過後,先將訪談內容編輯成逐字稿,再將資 料整理編碼並分類,最後統整成完整的資料。

(五) 撰寫論文:資料分析後進行論文撰寫,完成此研究的結果並修正即 完稿。將以上的研究流程轉換成詳細的流程表,如圖3-4 所表示。

圖3-4 研究流程 系

統 分 析 與 設 計 設

計 系 統 架 構

決 定 訪 談 對 象 決

定 研 究 主 題

進 行 文 獻 探 討

系 統 發 展

系 統 測 試 與 回 饋

完 成 論 文

歸 納 研 究 結 果

(43)

31

三、系統建置流程

在系統建置流程上,由於辭典需要時間收集資料,因此第一部分會先透過建 立族語辭典並匯入到資料庫中做使用,接著再設計系統畫面及功能。第二部分為 自動化拆解音節會先分析族語音節規則,此部分為最重要的階段,因為自動化拆 解音節的功能會是自動化合成族語語音的基礎。第三部分為設計自動化合成族語 語音的功能,族語語音合成會先錄製以及測試播放語音,最後再設計自動化合成 族語語音功能。第四部分會會先選定教材內容,再設計操作畫面,最後才是設計 教材閱讀功能。第五部分則是將前四個部分所製作的功能整合並且測試,並於測 試完成後進行系統的修正。前述說明如圖3-5 系統建置流程圖所示。

圖3-5 系統建置流程圖

建立族語辭典與資料庫 設計查詢畫面與功能

分析族語音節規則

選定教材內容

功能整併及測試

設計操作畫面與閱讀功能 設計自動化合成族語功能

設計族語音節拆解功能

錄製及測試語音

系統修正

(44)

32

第三節 研究場域與研究對象

本節分為兩個部分,首先針對研究個案之場域描述,第二部分說明選擇訪談 對象的理由。

一、研究場域

建和部落為卑南族十個部落的其中一個部落,其位置為較靠近臺東市南端,

在語言別上屬於建和語別,其人口組成有卑南族、客家人以及漢人所組成,居民 在日常溝通上多使用中文與臺語交雜,少數卑南族人在遇到族人時會使用族語對 話,但時常會講到一半就使用中文對話,年輕的族人在部落也幾乎都使用中文對 話,族語能力並不佳,由此可見,建和卑南語在部落中的使用率有待提升。

二、研究對象

本研究抽樣方式為立意抽樣,根據研究者個人主觀判斷而選取最適合研究目 的的樣本。由於本研究之系統提供內容為卑南族語學習內容,為保證本研究製作 之系統內容的正確性以及實用性,本研究訪談對象為通過優級族語認證之建和卑 南族語教師,經由各方面搜索後發現建和卑南族語認證級別為優級的族語教師僅 有二位,根據時間、距離、地域等因素綜合評估後,本研究訪談對象決定擴大為 通過優級認證以及高級認證之族語教師。表3-1 為訪談對象資料表:

表3-1

研究對象資料表

代號 族群 語別 認證級別 教學年資 目前工作

T01 卑南族 建和 優級 20 年 全職傳承師

T02 卑南族 建和 優級 20 年 族語教師

T03 卑南族 建和 高級 19 年 族語教師

T04 卑南族 建和 高級 7 年 族語教師

T05 卑南族 建和 高級 3 年 族語教師

資料來源:研究者自行整理

(45)

33

第四節 資料信實度

對於個案研究來說,研究者本身需要具有相當程度的能力,要能將大筆訪談資 料進行編碼分析,即便如此,仍存在著研究者偏誤的問題,為求增加質性研究的信 實度,本研究預計以下列方式建立信實度:

一、以錄音筆蒐集訪談資料,並於訪談後立即進行錄音檔資料謄寫,將內容轉化 為逐字稿,再次對照錄音資料與文字稿,兩兩是否符合,最後與受訪者進行 口頭確認回答內容是否有誤,或者有疏漏之錯誤。

二、將訪談蒐集的資料與逐字稿相互對應,會讓受訪者再確認一次,最終修正後 確定為訪談稿。

三、邀請教授審視修正本研究訪談大綱。

四、以多種方法蒐集資料,例如:報紙、書籍、文章、網站報導及文獻資料,適 時輔以導師給予的資料作為佐證。

五、研究者本身的訪談能力要增強。

第五節 研究倫理

質性研究以人為研究對象,因此牽涉到觀察人的行為及特質,需要格外小心,

所以在進行前,必須與受訪者建立基本信賴關係,尊重其意願為首要考量,但更 重要的是研究倫理的問題,要避免此情形發生以免研究對象受到傷害。

質性研究者要注意的倫理問題有幾個要點:被研究者身分要保密,避免被利 用或受傷害;資料的呈現上須採匿名方式進行,以免個人隱私外流,尊重研究對 象,建立良好信任關係以能順利獲取所蒐集的資料內容;撰寫文字稿時應忠於資 料,不隨意增添字句以扭曲事實。

(46)

34

為了獲取研究對象的信賴感,研究者會秉持研究倫理,負起責任。於訪談前 將問題讓研究對象看過,確認其合作意願後再展開訪談。為了不讓研究違反社工 作的倫理與精神,在研究的過程中須格外小心,研究可能涉及的倫理議題如下:

一、告知同意(Informed Consent)

研究開始前,需將研究目的與內容先行解說以徵得研究對象的同意才得以開 始進行。若在不情願的情況下,受訪者可以拒絕受訪,一定要在當事者同意的情形 下才得以開始進行研究,獲得當事者同意後,才得以進行研究。本研究為質性取向 研究,在進行訪談前須告知有錄音情形,明白說明只用在學術研究用途,讓受訪者 知情。

二、匿名(Anonymity)

若以問卷填寫來說,會以不具名方式填答,保障個人隱私,同時間也讓受訪 者以較無壓力的情況下作答,以降低亂答題的機率;以本研究來說,撰寫的文字 稿內容若提即受訪對象呈現要用代號呈現,不得以全名呈現,以維護當事人隱 私。

三、保密(Confidentiality)

研究者知道受訪對象的身份及回應的答案,但保證不對外透露這些資料,在口 頭說明上,都先向受訪者解說保密原則的道理,本研究的錄音檔在撰寫為逐字 稿確認後隨即會銷毀,研究者也會謹守此原則,不透露訪談過程,以維護受訪 者的權益。

(47)

35

第四章 系統建置與評估

本章節共分為四節,第一節為系統設計,其中包含系統建置的方式及過程,

分別為建立族語辭典、自動化拆解音節、族語語音合成以及族語教材閱讀等。第 二節為程式設計,內容主要在呈現本系統各功能運作的主要程式碼。第三節為系 統功能整併及測試,在本節會呈現系統操作畫面以及修正過程。第四節為系統實 施階段,在本節將會把系統實際給予族語教師使用,並將族語教師之回饋紀錄做 分析。

第一節

系統設計

本節共分為四個段落,分別為建立族語辭典與資料庫、自動化拆解音節、族 語語音合成以及族語教材閱讀等,內容將依序說明設計與製作方法。此外,本節 所製作之流程圖將依照表4-1 流程圖圖形說明表內說明之圖形進行流程設計。

表4-1

流程圖圖形說明表

功能 圖形

開始或結束 資料輸入 資料處理 決策判斷

迴圈 連接 資料庫 資料來源:研究者自行整理

(48)

36

一、建立族語辭典與資料庫

族語辭典為辭典查詢的基礎,透過族語辭典的建立能夠便於後續系統的開發 以及延伸,因此,本節將探討有哪些訊息內容需放置於族語辭典內,並將建立後 的辭典放置於資料庫內,最後由系統讀取回饋給使用者。

在族語教學與學習上本研究認為應提五種內容,分別是族語、中文、族語例 句、中文例句以及字根,在這五種內容中屬字根最為重要,在卑南族語中會有前 綴以及後綴,學習者可以透過去除前綴以及後綴的方式去找出字根,並且從字根 與綴詞的組合猜測其可能的意思,如:在建和卑南族語中kaseveran 為春天,透 過去除前綴ka 以及後綴 an 後會剩下字根 sever,前綴 ka 有真正的意思,後綴 an 有指定範圍的意思,sever 則為生長,將前後綴以及字根串接在一起時可以得到 ka-sever-an,真正-生長-指定範圍,即可推導春天的意思。

在辭典的部分,本研究將透過族語辭典範例表中的方式進行資料整理,內容 包含族語、中文、族語例句、中文例句、字根、級別,為了初期的資料收集以及 管理,本研究將根據此方式先行整理,隨後儲存為csv 檔匯入到資料庫中,待後 續系統讀取做使用。

表4-2

建和卑南族語千詞表

分類 序號 族語:

建和卑南語 中文 級別 備註/

說明 初級 中級 中高級 高級

07 動物 1 ikur 尾巴 ✓ 07 動物 2 lriyung 豬 ✓

07 動物 3 suwan 狗 ✓ 07 動物 4 takulris 羊 ✓ 07 動物 5 ngiyaw 貓 ✓

資料來源:原住民族委員會(無日期)

(49)

37

根據建和卑南族語千詞表為基礎,本研究保留資料中級別為初級的單字,並 留下中文、族語、級別三種資料,再加上中文例句、族語例句、字根三種資料,

呈現方式如族語辭典資料表,在資料完整的彙整後,總共有254 個初級單字,本 研究依序整理並加上新編輯的資料後放置附錄二。

表4-3

族語辭典資料表

中文 族語 中文例句 族語例句 字根 級別

豬 lriyung 我的豬喜歡吃地瓜 nanku lriyung sahar mekan

da vurasi. lriyung 初級 狗 suwan 他的工寮有四隻狗 nantu taluan ulra papata a

suwan. suwan 初級 羊 takulris 山上有五隻黑色的羊 i henan mu ulra lruwaca

a ’ude’udem na takulris. takulris 初級 貓 ngiyaw 我的貓喜歡吃魚 nanku ngiyaw sahar mekan

na vulraw. ngiyaw 初級 資料來源:研究者自行整理

(50)

38

(一) 畫面設計

由於LINE 上可呈現的畫面有多種形式與型態,本研究將透過 LINE Bot Designer 先行設計資料呈現畫面,再透過 LINE Bot Designer 所產生的 JSON 資料 修改為實際呈現畫面,如圖4-1LINE Bot Designer 設計畫面圖所示。

圖4-1 LINE Bot Designer 設計畫面圖

(51)

39

(二) 設計查詢單字功能流程圖

圖4-2 查詢功能流程圖 開始

輸入 族語單字

變數Temp 加入 符號「'」AND 族語單字AND

符號「'」

產生SQL 語法 使用SELECT 查詢

變數Temp

將資料儲存在 變數Data

A 資料庫連接

取得資料

(52)

40

圖4-3 續查詢功能流程圖 將族語、中文、

族語例句、中文例句 以及字根取出 並分別儲存在變數中

A

將資料放置在 設計好的JSON 資料中

結束 關閉資料庫 變數Data 中的資

料尚未讀取完畢

是 否

(53)

41

二、自動化拆解音節

本段落實作之功能為此次研究最重要的部分,必須先實現族語單字音節拆解 之功能,才能夠接續族語語音合成的內容,因此,在本段落將會先分析族語音節 規則,透過了解族語音節的組成,在進入撰寫音節拆解的程式時才能夠順利設計 出符合的邏輯。

(一) 分析族語音節規則

根據族語單字書寫方式可以分析出下列族語單字組成方式,以下將分別透過 幾個族語單字舉例並且分析其組成方式:

1. 子音 + 母音

(1) yawa 根據音節拆解後可書寫為 ya-wa,其結構為子音 + 母音 - 子音 + 母音。

(2) vuyu 根據音節拆解後可書寫為 vu-yu,其結構為子音 + 母音 - 子音 + 母音。

(3) suku 根據音節拆解後可書寫為 suku,其結構為子音 + 母音 - 子音 + 母音。

2. 子音 + 母音 + 子音

(1) niwas 根據音節拆解後可書寫為 ni-was,其結構為子音 + 母音 - 子音 + 母音 + 子音。

(2) ruvic 根據音節拆解後可書寫為 ru-vic,其結構為子音 + 母音 - 子音 + 母音 + 子音。

(3) sinsi 根據音節拆解後可書寫為 sin-si,其結構為子音 + 母音 + 子音 - 子音 + 母音。

(4) nanta 根據音節拆解後可書寫為 nan-ta,其結構為子音 + 母音 + 子音 - 子音 + 母音。

(5) dingwa 根據音節拆解後可書寫為 ding-wa,其結構為子音 + 母 音 + 子音 - 子音 + 母音。

數據

圖 4-1 LINE Bot Designer 設計畫面圖
圖 4-17 建和卑南族語第一階第一課之課名圖例
圖 4-19 建和卑南族語第一階第一課之生詞圖例
圖 4-24 選擇第幾課功能流程圖 開始
+7

參考文獻

相關文件

45 機器人 2 張皓鈞 苗栗縣私立君毅高級中學 / 勞動部勞動力發展署桃竹苗分署, 瑞明系統 科技有限公司. 45 機器人 2 林義峰

45 機器人 2 張皓鈞 苗栗縣私立君毅高級中學 / 勞動部勞動力發展署桃竹苗分署, 瑞明系統 科技有限公司. 45 機器人 2 林義峰

本法中華民國一百零二年六月二十七日修正之條文施行前,因行為不檢有損師道,經有關機

二專 工業機械 二技 工業電子科技(高級技術員) 二專 汽車製造維修 二技 無塵室設備(高級技術員) 二專 紡織機械 二技 自動化科技電子(高級技術 二專 機電整合 二技

一、

丙級)

參、技術士技能檢定建築物室內設計乙級術 科試題.

家長 聯絡網 親子活動 A教學管理 B學務管理 C輔導管理 D環境管理 E行政管理