第四章 結果與討論
根據不同的系統我們做了許多的測試,測試的結果我們分成如下來討論:
4.1 人類頭部追蹤系統 4.1.1 PC based
使用頭部追蹤演算法幾乎都能正確定位頭部位置,在極複雜的背景 之中運動、光線特別亮處或其他類似橢圓形的物體會對系統造成些 許牽引。
在 PC 上運算速度極快,每秒鐘可處理 10 張影像,運算速度為 103ms/
張。
程式的執行檔僅 165Kbyte。
4.1.2 DSP based
使用 DSP 來架構頭部追蹤演算法,將來可移植至智慧型機器人系 統,使其具備頭部追蹤與定位功能。
DSP 上的頭部追蹤演算法的運算速度可達 272ms/張。
加入影像的輸出輸入,每一個運算的 cycle 為 1.33s/張。
完整程式耗費之記憶體約 70.8Kbyte。
4.2 人臉辨識系統
4.2.1 人臉特徵抽取系統
自行開發的人臉特徵抽取演算法,在特定的環境下,對於人臉有【大 小】、【人臉小角度旋轉】都能達到 95%以上的辨識率。
經過演算法的改善及改變程式的寫法,在 DSP 上進行特徵抽取系 統所需花費的時間平均僅需 3 秒,而紀錄一個人的特徵參數僅需 8 個 bytes 的記憶體大小。
8
9
4.4 語者辨識系統 4.4.1 語者識別
分成 20 人、100 人、200 人來做實驗,每一個測試 30 句每一句 5 秒左右,辨識率皆在 9 成以上。
在 DSP 上進行特徵抽取系統所需花費的時間平均僅需 0.9 秒左右。
4.4.2 語者確認
設定系統內有 20 位語者,另外再找不是系統的語者十位,每人十 句。實驗分成全部的人一個閥值、男女各一個閥值與每一位語者一 個閥值。最後發現每一位語者一個閥值的拒絕與接受率最低。所以 認定每一位語者一個閥值效能還是最佳的。
4.5 關鍵詞辨識系統
以 200 句新聞標題與 50 個關鍵詞作測試,共十位測試者(五個男生五 個女生),每位測試者需錄製 200 句新聞標題各一次,與 50 個關鍵詞各 兩次。
關鍵詞搜尋系統正確檢索語句出現在搜尋結果前 20 句之正確率為 90.4
%,正確檢索語句出現在搜尋結果前 10 句之正確率為 86.6%,正確檢 索語句出現在搜尋結果前 5 句之正確率為 88.9%。
關鍵詞辨識系統之最佳辨識率為 81.56%,含非關鍵詞拒絕能力之關鍵 詞辨識系統之總正確率為 77.1%。
非關鍵詞拒絕能力之關鍵詞辨識系統可根據使用者不同需求調整非關 鍵詞拒絕的臨界值大小,辨識上採包含靜音段與關鍵詞直接作比對,以 符合不同環境與狀況之需要。關鍵詞萃取技術也將使語音辨識系統更加 人性化與實用。
10
DSP Base 上執行結果,一段 3 秒鐘的語音訊號進行關鍵詞萃取執行時 間為 1.26 秒。
11
參考文獻
[1] R.L. Hsu, ”Face detection in color images,” IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol.24, pp.696-706, 2002.
[2] M.J. Er, S. Wu, j. Lu, and H. Lye, “Face Recognition with Radial Basis Function (RBF) Neural Networks,” IEEE Transactions on Neural Networks, Vol. 13, No. 3, pp.697-710, 2002.
[3] Christophe Garcia,Manolis Delakis “A neural architecture for fast and robust face
detection “,Pattern Recognition, 2002. Proceedings. 16th International Conference on ,Volume: 2 , 11-15 , pp. 44-47 ,Aug. 2002
[4] ”ADSP-21161 DSP Hardware Reference”, Analog Devices Corp., 2002.
[5] ”ADSP-21161N EZ-KIT LITE Evaluation System Manual”, Analog Devices Corp., 2002.
[6]
Berlin Chen ,” Speech Information Retrieval for Mandarin Chinese -
Syllable-Based Indexing Features, Statistical Retrieval Models and Improved Approaches”, National Taiwan University Department of Computer Science and information Engineering Dissertation of Master, 2000.[7] Cheng Han Min, “A Study On The Keyword Spotting System”, National Tsing Hua University Department of Electrical Engineering
Dissertation of Master, 1995.
[8] C. Myers and L.R. Rabiner, “Performance Tradeoffs in Dynamic Time Warping Algorithms for Isolated Word Recognition,” IEEE Trans on ASSP, Vol.28, No.6, pp 623-635, Dec. 1980.
[9] F. Jelinek, “Continuous speech recognition by statistical methods,”
Proc. IEEE, vol. 64, pp 532-536, Apr. 1976.
12