結果 - 應用：從新聞中切出氣象播報片段 - 以叢集為基礎的支撐向量機學習及其應用於語者辨識

第五章應用：從新聞中切出氣象播報片段

5.3 結果

我們蒐集了5/11 ~ 7/5 共 56 天的華視午間及晚間新聞，除了沒有專屬氣象主播的新聞及錄製失敗的新聞(6/14 華視午間新聞)之外，共 95 則的新聞。因為我們設定的最小辨識單位長度為3 秒鐘，所以最後的結果會有 ±3 秒的誤差。我們認為在這 ±3 秒的誤差都屬允許的範圍內，其實驗的結果如表5-1。實驗的結果的正確率為95.8 %，在 95 則新聞中總共有 4 則新聞不正確，其中有兩則新聞是因為開始或結束時間的誤差超過了我們設定的範圍而被判斷成錯誤的狀況，

分別為5/19 的午間新聞和 6/6 的晚間新聞。5/19 的午間新聞是因為判定的氣象播報結束時間比實際的時間多了8 秒，而 6/6 的晚間新聞則是判定的開始時間比實際的時間提早了21 秒，但是整段氣象播報的片段還是有在判定的片段中。所以整體來看我們的方法對於偵測氣象播報有相當好的效果，也驗證了 SVM 的

強大功能。此外，我們將這個方法實際的放進實驗室的新聞系統中，有興趣的人可以參觀 http://140.113.216.64/NewsQuery/main.asp 這個網址，我們以標題"華視氣象"代表偵測到的氣象播報片段。

第六章結論與未來工作

我們提出了一個以叢集為基礎( cluster-based )的方法，對於大資料量的訓練過程的整體訓練時間可以達到有效的節省。我們挑選叢集的外圍資料以及其中心點來當作我們的訓練資料，藉由資料量的縮減來加速SVM 的訓練。我們所設定的cluster 數量不需要很多，因而可以達到快速的分群，且挑選出來的資料所訓練得到的SVM models 對於辨識的準確度也和不經由資料的篩選所得到的 SVM models 相當。此外，我們提出的方法對於支撐向量的個數也達到了減少的作用，進而節省了辨識所需花費的時間。

我們也成功的將其應用到實際的新聞節目中，藉由訓練好的SVM models 我們能夠準確的偵測出新聞中氣象播報的片段。除了利用SVM models 之外，我們的2-pass 方法也確實的幫我們避免掉門檻值選取的困難，而不錯過氣象播報的片段。

由於目前只由實驗驗證了我們的方法的可行性，尚未經由數學上的推導來加以證明，因此未來我們希望可以給出一個合理的數學式子以及有辦法經由一些算式之後給出一個明確而有依據的參數設定值。此外，希望能夠探討加速辨識速度上的問題，因為SVM 在作辨識時，需要使用到支撐向量，如果能夠在支撐

向量的總數上達到有效率的縮減，或者降低特徵空間的維度，而降低SVM 所找到的最佳切割平面的複雜度，達到加快辨識速度的效果。

參考文獻

1. D. A. Reynolds, R. C. Rose, ”Robust Text-Independent Speaker Identifica-tion using Gaussian Mixture Speaker Models”, IEEE TransacIdentifica-tions on Speech and Audio Processing, Vol. 3, No. 1, January 1995.

2. Xin Dong, Wu Zhaohui, “Speaker Recognition Using Continuous Density Support Vector Machines”, ELECTRONICS LETTERS, 16^th, August 2001.

3. Vladimir N. Vapnik, Statistical Learning Theory, John Wiley and Sons, Inc., New York, 1998.

4. Christopher J.C. Burges, “A Tutorial on Support Vector Machines for Pat-tern Recognition”, Data Mining and Knowledge Discovery, 1998.

5. T. M. Cover, “Geometrical and Statistical Properties of Systems of Linear Inequalities with Applications in Pattern Recognition”, IEEE Transaction on Electronic Computers, Vol. 14, pp. 326-334, 1965

6. B. E. Boser, I. M. Guyon, V. N. Vapnik, ”A Training Algorithm for Opti-mal Margin Classifiers”, In Proc. 5th ACM Workshop on Computational Learning Theory, pp. 144-152, 1992.

7. Edgar Osuna, Robert Freund, Federico Girosi, “An Improved Training Algorithm for Support Vector Machines”, In Proc. of the 1997 IEEE Workshop on Neural Network for Signal Processing, pp. 276-285, 1997.

8. John C. Platt, ”Fast Training of Support Vector Machines Using Sequential Minimal Optimization”, In Advances in Kernel Methods: Support Vector Learning, MIT Press 1998.

9. Michael Schmidt, Herbert Gish, ”Speaker Identification via Support Vec-tor Classifiers” IEEE ICASSP, 1996.

10. Marcelo Barros de Almeida, Antônio de Pádua Braga, João Pedro Braga,

“SVM-KM: speeding SVMs learning with a priori cluster selection and

k-means”, IEEE 6 th Brazilian Symposium on Neural Networks, pp.162-167, 2000.

11. Dmitry Pavlov, Jianchang Mao, “Scaling-up Support Vector Machines Using Boosting Algorithm”, International Conference of Pattern Recogni-tion, Vol. 2, September, 2000.

12. Mokhtar S. Bazaraa, Hanif D. Sherali and C. M. Shetty, Nonlinear Pro-gramming: Theory and Algorithm, John Wiley and Sons, Inc., New York, 1993.

13. A.K. Jain, M.N. Murty, “Data Clustering: A Review”, ACM Computing Surveys, vol. 31, no. 3, pp. 264-323, 1999.

14. K. Alsabti, S. Ranka, V. Singh, “An Efficient k-means Clustering Algo-rithm”, Proc. First Workshop High Performance Data Mining, Mar. 1998.

15. Kohonen, T., “The self-organizing map”, Proceedings of the IEEE ,Volume: 78 , Issue: 9 , pp. 1464-1480 , Sept. 1990.

16. J. L. Bentley, “Multidimensional Binary Search Trees Used for Associa-tive Searching”, Communications of the ACM, vol. 18, issue 9, pp.

509-517, September, 1975.

17. Chih-Wei Hsu and Chih-Jen Lin, “A Comparison of Methods for Multi-class Support Vector Machines”, IEEE Transactions on Neural Networks, vol 13, pp. 415-425, 2002.

18. TCC-300 speech database.. Association for Computational Linguistics and Chinese Language Processing, Institute of Information Science, Academia Sinica, Nangkang, Taipei, ROC. [Online]. Available:

http://rocling.iis.sinica.edu.tw/ROCLING/MAT/TCC-300brief.htm

19. Hsiao-Chuan Wang, “Speech Corpora and ASR Assessment in Taiwan”, In Proc. of Oriental COCOSDA Workshop, Beijing, China, Oct. 16, 2000.

20. Chih-Chung Chang and Chih-Jen Lin, “LIBSVM : a library for support vector machines”, Software available at

http://www.csie.ntu.edu.tw/~cjlin/libsvm

21 C. L. Blake, C. J. Merz, ”Repository of machine learning databases”, Uni-versity of California, Irvine, Dept. of Information and Computer Sciences, 1998.

URL: http://www.ics.uci.edu/~mlearn/MLRepository.html

在文檔中以叢集為基礎的支撐向量機學習及其應用於語者辨識 (頁 50-56)

結果

第五章 應用：從新聞中切出氣象播報片段

5.3 結果

第五章應用：從新聞中切出氣象播報片段