系統設計

第四章系統建置與評估

第一節系統設計

本節共分為四個段落，分別為建立族語辭典與資料庫、自動化拆解音節、族語語音合成以及族語教材閱讀等，內容將依序說明設計與製作方法。此外，本節所製作之流程圖將依照表4-1 流程圖圖形說明表內說明之圖形進行流程設計。

表4-1

流程圖圖形說明表

功能圖形

開始或結束資料輸入資料處理決策判斷

迴圈連接資料庫資料來源：研究者自行整理

根據建和卑南族語千詞表為基礎，本研究保留資料中級別為初級的單字，並留下中文、族語、級別三種資料，再加上中文例句、族語例句、字根三種資料，

呈現方式如族語辭典資料表，在資料完整的彙整後，總共有254 個初級單字，本研究依序整理並加上新編輯的資料後放置附錄二。

表4-3

族語辭典資料表

中文族語中文例句族語例句字根級別

豬 lriyung 我的豬喜歡吃地瓜 nanku lriyung sahar mekan

da vurasi. lriyung 初級狗 suwan 他的工寮有四隻狗 nantu taluan ulra papata a

suwan. suwan 初級羊 takulris 山上有五隻黑色的羊 i henan mu ulra lruwaca

a ’ude’udem na takulris. takulris 初級貓 ngiyaw 我的貓喜歡吃魚 nanku ngiyaw sahar mekan

na vulraw. ngiyaw 初級資料來源：研究者自行整理

（一）畫面設計

由於LINE 上可呈現的畫面有多種形式與型態，本研究將透過 LINE Bot Designer 先行設計資料呈現畫面，再透過 LINE Bot Designer 所產生的 JSON 資料修改為實際呈現畫面，如圖4-1LINE Bot Designer 設計畫面圖所示。

圖4-1 LINE Bot Designer 設計畫面圖

（二）設計查詢單字功能流程圖

圖4-2 查詢功能流程圖開始

輸入族語單字

變數Temp 加入符號「'」AND 族語單字AND

符號「'」

產生SQL 語法使用SELECT 查詢

變數Temp

將資料儲存在變數Data

A 資料庫連接

取得資料

圖4-3 續查詢功能流程圖將族語、中文、

族語例句、中文例句以及字根取出並分別儲存在變數中

將資料放置在設計好的JSON 資料中

結束關閉資料庫變數Data 中的資

料尚未讀取完畢

是否

二、自動化拆解音節

本段落實作之功能為此次研究最重要的部分，必須先實現族語單字音節拆解之功能，才能夠接續族語語音合成的內容，因此，在本段落將會先分析族語音節規則，透過了解族語音節的組成，在進入撰寫音節拆解的程式時才能夠順利設計出符合的邏輯。

（一）分析族語音節規則

根據族語單字書寫方式可以分析出下列族語單字組成方式，以下將分別透過幾個族語單字舉例並且分析其組成方式：

1. 子音 + 母音

(1) yawa 根據音節拆解後可書寫為 ya-wa，其結構為子音 + 母音 - 子音 + 母音。

(2) vuyu 根據音節拆解後可書寫為 vu-yu，其結構為子音 + 母音 - 子音 + 母音。

(3) suku 根據音節拆解後可書寫為 suku，其結構為子音 + 母音 - 子音 + 母音。

2. 子音 + 母音 + 子音

(1) niwas 根據音節拆解後可書寫為 ni-was，其結構為子音 + 母音 - 子音 + 母音 + 子音。

(2) ruvic 根據音節拆解後可書寫為 ru-vic，其結構為子音 + 母音 - 子音 + 母音 + 子音。

(3) sinsi 根據音節拆解後可書寫為 sin-si，其結構為子音 + 母音 + 子音 - 子音 + 母音。

(4) nanta 根據音節拆解後可書寫為 nan-ta，其結構為子音 + 母音 + 子音 - 子音 + 母音。

(5) dingwa 根據音節拆解後可書寫為 ding-wa，其結構為子音 + 母音 + 子音 - 子音 + 母音。

(8) 如果 ng 為最後一個符號，則直接併入前項，否則在 kivangavang 拆解時會出現va-ng 的情形，正確應為 ki-va-nga-vang。

（三）設計自動化拆解音節功能流程圖

圖4-4 自動化拆解音節流程圖開始

輸入族語

字串為符號

「-」開頭離開

移除符號「-」

For I = 0 to <字串長度

第I 個字為母音

否

是

將字串拆解儲存在陣列

否

是 1

圖4-5 續自動化拆解音節流程圖 A

2 否

第I 個字為 l 且下個字是 r

否

是

第I 個字為 l 且下個字是 h

否

第I 個字為 n 且下個字是 g

否

第I 個字為符號「'」

否

是 3

是 4

是 5

圖4-6 續自動化拆解音節流程圖 否

是否暫存在字串Temp 中

第I+1 個字

為母音是 6

字串Temp 第一個字是符號「-」

刪除字串 Temp 的第一個符號「-」

結束

圖4-7 續自動化拆解音節流程圖

字串Temp 加入第I 個字 AND

第I+1 個字並讓迴圈Break

將第I 個字儲存在字串Temp

第 I+1 個字為母音

字串Temp 加入第I 個字 AND 符號「-」AND

第I+1 個字並讓變數I+1

否

是 1

是否

I 第 I+1 個字

為字串中倒數第二個字

離開

圖4-11 續自動化拆解音節流程圖字串Temp 加入

第I 個字第 I 個字為符號「'」

字串Temp 加入符號「-」 AND 第I 個字 AND

第I+1 個字並讓變數I+1 是

否

圖4-12 續自動化拆解音節流程圖字串Temp 加入

第I 個字 AND 符號「-」

字串Temp 加入第I 個字第 I+1 個字

為母音

字串Temp 加入符號「-」AND

第I 個字

否

是 6

是否

I 第 I-1 個字

為母音

在語音錄製上，會先根據表4-4 族語符號發音表上的發音分別錄製語音，錄製方式為一個子音配上五個母音，如圖4-13 子音 p 發音錄製圖就是先錄製 pa、

pi、pu、po、pe，並在錄製完成後裁減編輯為一個音一個檔案，如圖 4-14 族語發音pa 裁切圖所示，檔案名稱儲存為該發音之書寫方式，如：pa.mp3、pi.mp3、

pu.mp3、po.mp3、pe.mp3。

圖4-13 子音 p 發音錄製圖

圖4-14 族語發音 pa 裁切圖

根據上述方式錄製完90 個族語發音後，可將聲音放置於 Audacity 內組合，

透過組合單字發音，測試聲音是否能夠正常播放，本研究使用六個族語單字進行組合，分別是musavak、sinsi、ruma’、semuhesuh、’apuc 及 seru’，在語音組合播放後發現下列三個問題：

1. 子音 + 母音 + 子音結構發音不正確

子音 + 母音 + 子音結構的問題，如第一個詞 musavak 在拆解完後的音節為mu-sa-vak，但在上述 90 個族語發音中並沒有 vak 的組合，其發音會變成mu-sa-va-k，如第二個詞 sinsi 及第四個詞 semuhesuh 也有此情況發生，正確拆解完後應唸sin-si 及 se-mu-he-suh，但透過 90 個族語發音僅能組合成si-n-si 及 se-mu-he-su-h。

2. 喉塞音組合不正確

第三個詞ruma’在拆解過後應唸 ru-ma’，但透過 90 個族語發音後僅能組合成ru-m-’a，第六個詞 seru’在拆解後也會出現不能正確發音的問題，但此情況在第五個詞’apuc 並未發生此問題。

3. 組合後發聲不自然

由於族語發音是由pa、pi、pu、po、pe 此種方式錄製，在錄製並裁切後組合，其發音會非常的死板且不自然。

（二）解決族語語音組合問題

在經由初步的族語發音錄製以及測試後發現有幾點問題，經研究後發現這幾點問題均可以解決，下列將敘述如何解決：

1. 解決子音 + 母音 + 子音結構發音不正確之問題

在經由多個詞的拆解後，本研究發現此情況會發生於子音 + 母音+

子音相接發音時，因此本研究將會找出所有子音 + 母音 + 子音結構的發音，並且錄製下來。

2. 解決喉塞音組合不正確之問題

本研究發現喉塞音組合有兩種，第一種是喉塞音 + 母音，

如：’a、’i、’u、’o、’e，另一種是搭配子音發聲，且組合方式為子音 + 母音 + 喉塞音，如：ma’、ru’、ve’等發音組合，因此，只要找出子音 + 母音 + 喉塞音的組合方式即可解決此問題。

3. 解決組合後發聲不自然之問題

為解決組合後發聲不自然之問題，本研究將透過不同的錄製方式進行錄製，原本的錄製方式是由表4-4 族語符號發音表推至單字組合發音，

為改善此問題，錄製方式轉為由單字推至族語符號發音，此方法不僅能改善發音不自然，也能同時解決前兩項之問題。其錄製方式如：錄製 kasavakan，並將 ka、sa、va、kan 四個音節裁減、儲存並紀錄下來，透過錄製下列72 個族語單字即可組合族語千詞表中大部分的族語發音，如表 4-5 所示，且很大程度地解決發音不自然之問題。

表4-5

族語單字錄音表

kasavakan ngulringulr ruma’ maakan kungkuwan yawa musavak ma’inay lralrak ising cau sinsi likudan vala’ ruvic timir visvis vira’

seru’ puran ’apuc tutur tutus mukecep kinsas ngayngay vangsaran kakiyas vuyu harang dindin dingwa tuktuk sadalran impic kucu dinanuman melaw tavu’ pangasip hinoki ’uras

tarawiri cima’ kociyo walru dawum ’emapiyar sayhuwan mipela’ ’ilrayi tokiso paduk ngiyaw

su’ang dogu niwas wu kinaveras kaduwan sadeku lataw liveng tutuluwa leman temenun veneliyas mureve’ ’alrecu ’ilrus semuhesuh kemucekuc 資料來源：研究者自行整理

（三）設計自動化合成族語語音功能

此階段錄製的語音檔皆會放置於伺服器中，在程式設計方面會先由自動化拆解音節的功能拆解單字音節，再輸入拆解後的訊息去找尋該檔案，並且在伺服器上直接合併生成新檔案，檔案名稱將會使用該單字命名，設計自動化合成族語語音功能流程圖如圖4-15 及圖 4-16 所示：

圖4-15 自動化合成語音流程圖開始

輸入已拆解族語音節

將字串用符號「-」拆解

拆解

For I = 0 to < 變數 num

變數Cat 加入資料夾位置AND

第I 個字 AND .mp3

變數num 紀錄拆解幾個音節

變數FileName 加入第I 個字

圖4-16 續自動化合成語音流程圖變數Cat 加入

第I 個字 AND 資料夾位置AND 變數FileName AND

.mp3 A

執行CAT 指令

結束

四、自動化拆解音節

本段落將分為三個部分，第一部分會說明族語教材內容的挑選以及提供的內容範圍，第二部分以及第三部分將會設計與撰寫提供教材閱讀的功能。

（一）選定教材內容

原住名族委員會所製作的九階教材內涵九個階段，且每個階段又分別有十課，其課文以各族的書寫符號為編寫內容，以卑南族語為例，教材分別以南王語別、知本語別、建和語別以及西群語別等四大語言別作為區分，因此卑南族在教材上共有四個版本，由於本研究以建和卑南族為例，本研究之學習系統在教材提供及呈現上僅以建和語別為主。

九階教材的內容以課名、課文、生詞以及看圖說說看三大部分組成，本研究將取第一階至第九階的課名、課文以及生字的部分作為教材提供範圍，而教材呈現方式以圖片為主，因此本研究將收集第一階至第九階教材之pdf 檔，將其轉為 jpg 檔，並將檔名以階-課-內容為命名規則，以第一階第一課的課名為例，檔案將命名為1-1-1.jpg，第五階第六課的課文則命名 5-6-2.jpg，以便後續系統製作與發展，以第一階第一課為例，將取出內容如下列圖4-17、圖 4-18、圖 4-19 所示，

在文檔中透過聊天機器人技術建立 (頁 47-85)

第四章 系統建置與評估

第一節 系統設計

第四章系統建置與評估

第一節系統設計