結論及未來展望 - 基於立體視覺環境下即時人機互動介面之實作

6.1 結論

在本論文中，我們發展並實踐了一套基於立體視覺空間中的即時人機互動系統，並且將研究的重心放在（1）系統介面的友善度、（2）是否能有效偵測使用者行為、（3）系統的可擴充性、以及（4）系統的穩定性這四個方面。在追蹤指向物方面，我們利用指向物的色彩、形體以及運動等特性來從影像中分析指向物，並且利用主成分分析法將像素資訊轉換成方向向量，在本篇論文中，我們基於已知的空間資訊，利用投影轉將指向物方向向量從影像平面轉換到世界座標平面中，並將其與攝影機中心建立一平面，當此平面建立後，我們可以利用兩台攝影機的重建平面與投影平面三面共點的特性，重建出指向軌跡點在真實世界中的位置。接著我們利用類神經網路分析軌跡樣式，並且建立一套控制模組，以使得使用者可以藉由輸入特定軌跡來對電腦下特定指令來達成人機互動的目的。

在研究重心的發展上，我們藉由導入類神經網路的概念來使得使用者可以輕易地與電腦溝通，達成人機介面程式中友善性的要求，並且發展出基於指向物形體特性的追蹤與重建方式有效地偵測了使用者的行為，接著我們設計了一套基於可更換動作模組的控制元件來達成系統的高擴充性，最後，我們利用有限狀態機受規範的行為模式來達成系統的穩定性。

6.2 未來展望

一個理想中的人機互動應用是自然且沒有使用者人數限制的，在未來的發展中，我們希望能夠發展出可以接受更多種指向物種類的系統，並且利用各指向物獨特的外觀特性（例如不同的形體，不同的色彩）來達成基於立體視覺下的多人

互動系統。此外，一個優秀豐富的人機互動介面有賴於更多種應用程式的支援，

在可見的未來，必定會有更多相關的研究著眼於人機互動介面的應用性，這也是我們未來研究的重點之一。

參考文獻

[1] C. Kirstein and H. Müller, “Interaction with a Projection Screen Using a Camera-Tracked Laser Pointer,”

Proc. of International Conference on Multimedia Modeling, IEEE Computer Society Press, pp. 191-192, 1998.

[2] R. Sukthankar, R. Stockton, and M. Mullin, “Smarter Presentations:

Exploiting Homography in Camera-Projector Systems,” Proc. of

International Conference on Computer Vision, pp. 247-253, 2001.

[3] X. Chen and J. Davis, “LumiPoint: Multi-user Laser-Based Interaction on Large Tiled Displays,”

Stanford CS Technical Report TR-2000-04, 2000.

[4] Y.-P. Hung, Y.-S. Yang, Y.-S. Chen, I.-B. Hsieh, and C.-S. Fuh, “Free-Hand Pointer by Use of an Active Stereo Vision System,” Proceedings of 14th

International Conference on Pattern Recognition, pp. 1244-1246,

1998.

[5] C. Leubner, C. Brockmann, and H. Müller, “Computer-vision-based Human-Computer Interaction with a Back Projection Wall Using Arm Gestures,”

Proc.s of 27th Euromicro Conference, Warsaw, IEEE Press, pp.

308-314, 2001.

[6] G.V. Paul, G.J. Beach, and C.J. Cohen, “A Realtime Object Tracking System Using a Color Camera,” Applied Imagery Pattern Recognition Workshop, pp. 137-142, 2001.

[7] Y. Wu and T.-S. Huang, “Nonstationary Color Tracking for Vision-based Human-Computer Interaction,”

IEEE Trans. Neural Networks, Vol. 13,

Issue 4, pp. 948 - 960, July 2002.

[8] H. Mei, A. Sethi, H. Wei, and G. Yihong, “A Detection-based Multiple Object Tracking Method,”

International Conference on Image Processing,

pp. 864-871, 2004

[9] S.K. Pal and S. Mitra, “Multilayer Perceptron, Fuzzy Sets, and

Classification,”

IEEE Trans. Neural Networks, Vol 3, Issue 5, pp. 683-697,

September 1992.

[10] C. Hummels and P.J. Stappers, “Meaningful Gestures for Human Computer Interaction: Beyond Hand Postures,”

Proc. of 3

^rd

IEEE International

Conference on Automatic Face and Gesture Recognition, pp.591-596, 1998

[11] R.B. Stone, “Designing Screen-based Interfaces for Advanced Multimedia Functionality,” Proc. of 6^th

International Conference on Information Visualisation, pp. 611-616, 2002.

[12] J. Segen and S. Kumar, “Human-Computer Interaction Using Gesture Recognition and 3D Hand Tracking,” Proc. of International Conference

on Image Processing, 1998

[13] C. Stary, T. Riesenecker-Caba, and J. Flecker, “User Interface Evaluation: a Comparison of 18 Techniques When Implementing the EU-Directive on Human-Computer Interaction,”

Proc. of 6

^th

Australian Conference on Computer-Human Interaction, pp 184-193, 1996

[14] H.C. Longuet-Higgins, “A Computer Algorithm for Reconstructing a Scene from Two Projections,”

Nature, vol. 293, pp. 133-135, 1981.

[15] R. Hartley and A. Zisserman, Multiview Geometry In Computer Vision.

Cambridfe University Press, 2001.

[16] O. Faugeras and Q.-T. Luong, The Geometry of Multiple Images. The MIT Press, 2001.

在文檔中基於立體視覺環境下即時人機互動介面之實作 (頁 56-59)