第三章 研究方法
第四節 發展國字結構評量系統
主要內涵為將以形態為基本評量元素,研究合體結構的中國文字,分析學童 書寫結果形態,然後筆畫間的結構關係,如筆畫長度、字素中心差距、位置偏移、
字體概形等特徵點,為字體結構優美程度的基本特徵值,利用模糊積分來計算字 體結構的記分。其研發模式步驟如圖3-7:
圖3-7 國字結構評量系統研究步驟流程圖
對於國字架構優美程度的電腦判別,首先需訂出國字筆畫與筆畫架構特徵,
及國字形態特徵,依各特徵情況給定記分權重值。再來是設計受試者書寫介面,
並設計如何讓電腦自動比對國字形態與架構的演算法,再依受試者書寫資料取得 訂定國字結構的特徵點
開發結構分析書寫介面
取得專家評量數據
模糊積分樣本學習
利用學習結果建立寫字評量系統 訂定標楷體結構計分標準
設計電腦比對程式
五位教師評量數據,最後利用模糊積分樣本學習計算計分權值,最後利用學習結
受 測 字 筆 畫 次 序 , 學 生 所 書 寫 的 各 筆 畫 的 長 短 以 b 集 合 來 表 示 , 如
群組,分別是「王」的筆畫群組為
S S S S 重心為1, , ,2 3 4
G 、「白」的筆畫群組為1
S S S S S 重心為5, , , ,6 7 8 9
G 、「石」的筆畫群組為2
S S S S S10, 11, 12, 13, 14
重心為G ,3 因此「碧」的重心集合為G碧
G G G1, 2, 3
。參、覆蓋範圍比對
對於書寫結果的布局特徵,採覆蓋範圍大小來取特徵值,覆蓋範圍的取法先 將九宮格的長寬各切成N 段,於是在書寫範圍即切割成 N N 個區塊,再取字體 W 所有筆畫的最大y 座標定為Ymax與最小y 座標定為Ymin,九宮格由上而下依序 掃描至Ymax時,再取其x 軸座標最左最右的座標點設定為覆蓋區域,一直取到Ymin 為止,而在取左右範圍的方法是以取最左x 座標,定為Xmin,與最右的x 座標,
定為Xmax,若Xmin Xi Xmax表示Xi在該字覆蓋的範圍之內。
在 N N 個區塊中如果被該字所覆蓋的區塊設定為 1,未被覆蓋的區塊 設定為0,於是得到覆蓋區域方陣ANN,如圖3-10。在此先取樣本字的覆蓋區域 矩陣,以A 來表示,再取受試者所書寫的字在覆蓋區域矩陣,以s Au來表示,比對 樣本字的A 與書寫的字的s Au在N N 的小區塊異差,就是覆蓋範圍差異值,以C3 來表示,C3=AsAu。為XOR 運算,若該字整體字型與樣本字差異很大,C3 的值相對的也就變大,反之變小。 以10 10 的小區塊來呈現「公」字的覆蓋範圍,
如下圖3-8,圖 3-9:
圖3-8 楷書字「公」及其覆蓋範圍
圖3-9 學生書寫字「公」及其覆蓋範圍
,而其覆蓋區域矩陣為如下圖3-10,兩矩陣以 XOR 運算為 9。
圖3-10 楷書字(左)與學生書寫字(右)「公」覆蓋區域矩陣
肆、模糊積分簡單迴歸
系統延續筆順施測採用筆順的24 個樣本字,讓 35 位四年級學生在平板電腦 逐一書寫,老師並在受測學生旁邊,監看書寫過程以必免連畫或筆順錯誤情況發 生。再利用電腦分析比對樣本字與學生所寫字,並得到長短差異總和C1,區塊中 心差異值C2 ,覆蓋範圍差異值C3,這三個值為電腦所產生的客觀數據,再由五 位語文相關領域的資深教師,依電腦硬筆書寫評定量表,在用筆、結構、布局三 個項度各5 分的原則下,在網路上評分,其用筆分數以T1表示、結構分數以T2 表 示、布局分數以T3 表示。在取得用筆、結構、布局三個項度的分數後,依一定比
例權值求得每個教師所評的分數,再將五位老師的分數平均並標準化,以T 表
而C1、C2 、 C3值分別代表排序後分別為h x ,
1 h x ,
2 h x ,基本測度
3integral regression model)。再以 5 Fold CV 的方式求其相關係數與 MSE。在