3D立體影像呈現之自動視差調整技術

(1)

行政院國家科學委員會專題研究計畫期末報告

3D 立體影像呈現之自動視差調整技術

計畫類別：個別型

計畫編號： NSC 100-2218-E-011-028-

執行期間： 100 年 11 月 01 日至 101 年 10 月 31 日執行單位：國立臺灣科技大學色彩與照明科技研究所

計畫主持人：林宗翰

計畫參與人員：碩士班研究生-兼任助理人員：胡尚仁碩士班研究生-兼任助理人員：張顥騰

報告附件：出席國際會議研究心得報告及發表論文

公開資訊：本計畫涉及專利或其他智慧財產權，1 年後可公開查詢

中華民國 101 年 12 月 15 日

(2)

中文摘要：最近幾年 3D 顯示技術已經發展的非常迅速，然而雖然立體顯示器已漸漸成為市場的潮流，但觀看 3D 立體影像所造成的視覺舒適度還是不甚理想，讓人無法長期凝視，因此 3D 立體影像呈現變成了一門重要的課題。本研究注重於發展虛擬相機自動調節機制，具體作法為利用 OpenGL 實作立體呈現瀏覽 3D 模件的環境，而調整主要在探討不同的 3D 虛擬相機擺設方式、相機角度、主體變動方位、視差分佈等變數所產生的立體影像，使絕大部份的視差都落在安全範圍內，讓使用者瀏覽 3D 畫面時，可確保影像可融合，並且瀏覽過程中不會有太多的不舒服的感覺。

中文關鍵詞：視覺舒適度，視差分佈，立體影像品質，立體顯示技術英文摘要： In recent years, the development of stereo display

technologies progress fast. Although stereo display has become a leader in markets, it＇s still not

perfect due to the discomfort viewing experience. The stereo image becomes an important issue. In this study, we focus on the developing an algorithm for automatically adjusting virtual stereo cameras. We use OpenGL open source to implement the render interface. Control parallax distribution in safe range by adjusting virtual camera position, virtual camera convergence angle, object positions. When users watch the stereo image, they will not feel discomfort.

英文關鍵詞： Visual comfort, Parallax distribution, 3D image quality, 3D display technology.

(3)

行政院國家科學委員會補助專題研究計畫 □期中進度報告

期末報告

3D 立體影像呈現之自動視差調整技術

計畫類別：  個別型計畫 □ ^{整合型計畫}

計畫編號：NSC100－2218－E－011－028－

執行期間：100 年 11 月 01 日至 101 年 10 月 31 日

執行機構及系所：國立台灣科技大學色彩與照明科技研究所

計畫主持人：林宗翰共同主持人：NA

計畫參與人員：胡尚仁、張顥騰

本計畫除繳交成果報告外，另須繳交以下出國報告：

□ 赴國外移地研究心得報告

□ 赴大陸地區移地研究心得報告

 出席國際學術會議心得報告及發表之論文

□ 國際合作研究計畫國外研究報告

附件一

(4)

摘要

最近幾年 3D 顯示技術已經發展的非常迅速，然而雖然立體顯示器已漸漸成為市場的潮流，但觀看 3D 立體影像所造成的視覺舒適度還是不甚理想，讓人無法長期凝視，因此 3D 立體影像呈現變成了一門重要的課題。本研究注重於發展虛擬相機自動調節機制，具體作法為利用 OpenGL 實作立體呈現瀏覽 3D 模件的環境，而調整主要在探討不同的 3D 虛擬相機擺設方式、相機角度、

主體變動方位、視差分佈等變數所產生的立體影像，使絕大部份的視差都落在安全範圍內，讓使用者瀏覽 3D 畫面時，可確保影像可融合，並且瀏覽過程中不會有太多的不舒服的感覺。

關鍵字：視覺舒適度，視差分佈，立體影像品質，立體顯示技術

Abstract

In recent years, the development of stereo display technologies progress fast. Although stereo display has become a leader in markets, it’s still not perfect due to the discomfort viewing experience. The stereo image becomes an important issue. In this study, we focus on the developing an algorithm for automatically adjusting virtual stereo cameras. We use OpenGL open source to implement the render interface. Control parallax distribution in safe range by adjusting virtual camera position, virtual camera convergence angle, object positions. When users watch the stereo image, they will not feel discomfort.

Keyword: Visual comfort, Parallax distribution, 3D image quality, 3D display technology.

(5)

內容

一、前言 ... 4

二、立體影像建模 ... 4

三、視差分佈分析處理 ... 6

四、基於影像自動調整 parallax 技術 ... 8

(1) 基於 Z 值(深度方向)壓縮 ... 8

(2) 基於立體相機視差分布(parallax distribution)改動兩相機的水平間距(baseline) ... 9

(3) 立體影像融合之舒適區間界定 ... 10

(4) 心理視覺驗證實驗 ... 12

五、結論 ... 14

六、參考文獻 ... 14

(6)

一、前言

早期於 1990 年代，3D 立體影像(Stereoscopic Display)已成為娛樂用途[1]，至近期 2009 年代多部的 3D 電影從好萊塢上映，無不結合 3D 立體影像，創造了令人驚奇的感官。然而現今的 3D 顯示技術已逐漸的成熟，其中包含了顯示器解析度以及畫面更新頻率的提升，種種跡象顯示著未來 3D 顯示器極有可能取代 2D 顯示器，雖然 3D 顯示器影像品質逐漸提升，但 3D 影像延伸出諸多人因觀看問題，這是推動 3D 影像科技最主要的阻力。近期已有諸多的研究專注在立體影像觀看的舒適問題，影響舒適問題主要為鬼影(Crosstalk)、閃爍(Flicker)、色偏、Shear distortion、keystone distortion、模糊(Blur)、Moire 現象等[2]。然而這些問題都可藉由軟體呈現技術去做改善[3]，使得觀賞螢幕中的 3D 模型時可保有 3D 深度效果而不至於無法融合而導致不舒適的感官。

由文獻的探討可得知過大的視差產生觀看的不適[4]，傳統的改善方法是將左右影像對依照特徵點匹配運算[5]，求出拍攝時左右兩相機的世界座標，再依據相機位置求取相關深度資訊，

並將左右兩影像依照深度資訊重建立體影像對，但這不僅需要龐大的運算更有可能造成極大的變形與影像品質的降低，因此分析影像的視差直方圖(Disparity Histogram)分布是主要課題之一，透過成像前的 3D 影像演算技術，不僅可以省去成像後再做校正的龐大計算及誤差，更可自動調整雙眼視覺的像差，進而達到較佳的 3D 立體影像呈現效果。

二、立體影像建模

三維建模有諸多的方法，然而傳統以人力去畫製的模型大多需要具備專業的繪圖技術，以及購置高階的繪圖設備，所以要快速的建立起擬真的立體模型，莫過於藉由多視角的影像拍攝並利用空間關係去得到想要的物件的輪廓以及方位[6]。因此本研究藉由實際測試 Strata Foto 3D 建造立體模型，此軟體的優點為[7] (1)可將鏡頭變形因素(lens distortion)修正，如此一來可以確保真實度的品質 (2)特殊的編碼板(calibration mat)主要的作用為定位模型的位置如圖 1 (3)對於影像去背功能也引入了 Adobe Photoshop，方便使用者分離三維建模的影像背景與模型主體 (4)生成 3D 模型網格後，可即時的瀏覽模型細節的介面。

圖 1：Strata Foto 3D calibration mat 圖 2：Strata Foto 3D 範例圖

依照 Strata Foto 3D 的快速教學的五步驟，step 1-Print the calibration mat，step 2-Take photos 如圖 2，step 3-Mask the photographs，step 4-Build a 3D wire frame model，step 5-Build the Texture，

發現所建的模型失真度過大，故在此分享拍攝經驗以及拍攝時所遇到的問題；三維建模有幾個特

(7)

均勻可能造成後續修圖的困擾。拍攝角度設定為三種角度如圖 3，物件依照單一方向旋轉，且在定位板每隔三條碼後拍攝一張，所以一共會拍攝 15 張影像 (d)竟量避免會折射物體，如玻璃瓶，

眼鏡，時鐘的凸面鏡等等，原因是會折射物體在運算時會產生極大的誤差，導致影像變形。

拍攝場景如圖 5：一盞拍攝模型的閃光棚燈，一盞打牆閃光棚燈，去背攝影台，一盞去背燈泡球，如此拍出的照片可以減少去背錯誤率，但仍要注意是否閃光棚燈造成物件全反射，若有有強烈光點在模型上，會導致後續貼圖將強烈光點也包含在模型影像中；由此方法依照 Strata Foto 3D 所建出的模型如圖 4。

圖 3：拍攝角度示意圖

圖 4：依 Strata Foto 3D 所建出的模型

圖 5：攝影場景

(8)

三、視差分佈分析處理

視差(Disparity)是分析立體影像舒適度的一大指標，然而理想的做法是先判斷模型的每個三角網格是否於投影面上而不被遮蔽[8]，再由立體模型依照相機位置與相機參數將每個組成立體模型的三角網格逐一投影至螢幕中，再藉由投影至螢幕的左右三角網格求取重心的視差 (Disparity)，依照模型三角網格的面積去取投影面積所占螢幕的面積權重。然而理想方法可以求出精準的視差圖分佈，但所要花費的運算成本太高導致運算效率降低，與其將每個模型中的三角網格都運算過，不如取出已投影過後的深度資訊去評估舒適問題。

投影後的深度資訊假設是可以代替龐大運算的視差圖分佈，其中我們也採用人臉的立體模型來評估此項假設，以人臉的立體模型來做評估主要因素是遮蔽面的演算不高，人臉立體模型的組成點為 4249 個點，8270 個面，評估實測如下圖 6 與圖 7，不同的對焦點(Focus point)所產生不同的立體視覺影像，圖 6 主要為一張對焦在平面的立體影像，近乎零平面的影像產生視差約-13~11 個像素大小，由此影像可看出幾乎沒有深度感，圖 7 則是將對焦點向前移動產生有深度的影像，

視差約在 13~38 個像素。

圖 6：立體螢幕所呈現人臉影像(對焦點於

【0,0,0】)

圖 7：立體螢幕所呈現人臉影像(對焦點於

【0,0,500】)

Left camera position (50,0,2500) Right camera position (-50,0,2500) Near clipping plane z=1 Far clipping plane z=10000

Field of view = 45 degree Object Size (720×1000×520) Screen Size (1920×1080) Object locate (0,0,0)

Focaus on (0,0,0) and (0,0,500) 表 1：OpenGL 內部調變參數

由圖 8 與圖 9 顯示著深度資訊轉視差分佈，圖 10 與圖 11 則顯示網格投影後的面積視差分佈 (Ground Truth)。交叉對照圖 8 與圖 10 可得知極值兩端(Lower bound)與(Upper bound)近似相同，

只有權重值略有不同，主要原因如圖 12 至圖 14，在圖 12 如前述標準作法，然而 OpenGL 取出的深度資訊(Depth buffer)如圖 13，深度資訊取決於解析度大小，如本計畫採用的是 Full HD 3D 螢幕，故深度資訊為解析度(1920×1080)個資料，誤差量不大的結果使我們可以採用 OpenGL 的深度資訊去估計視差分佈，如此一來可改善運算成本龐大的問題。

(9)

圖 8：深度資訊轉視差分佈(對焦點於【0,0,0】) 圖 9：深度資訊轉視差分佈(對焦點於

【0,0,500】)

圖 10：網格投影後的面積視差分佈(對焦點於

【0,0,0】)

圖 11：網格投影後的面積視差分佈(對焦點於

【0,0,500】)

圖 12：三角網格投影運算結果圖

圖 13：深度資訊(Depth buffer) 取出值

圖 14：誤差位置

(10)

四、基於影像自動調整 parallax 技術

(1) 基於 Z 值(深度方向)壓縮

一般在 3D 立體螢幕所觀看到的立體影像，大多都由一組雙相機去仿照人眼機制(Binocular distance = 65mm，50mm 鏡頭)所拍攝的影像如圖 15 右[9]，然而觀看 3D 立體影像時，人眼的 Accommodation 位置落於螢幕上，而這個原因導致 3D 螢幕具有一定限度的舒適區間(圖 15 左)，

為了達到物件落在舒適觀看範圍(Comfortable viewing range)，在製作 3D Content 時往往會由深度方向等比例壓縮，使得 3D content 在畫面中是舒適的，伴隨而來的問題則是 3D 物件不真實，比原始物體還來的扁(圖 16)[10]。然而正常人眼觀看到(圖 15 左)的影像時，對焦點後面的景物會模糊，但由於 3D 顯示對焦永遠在螢幕上，卻未落於舒適區間內，因此往往會成現背景非模糊但又無法融合的不舒適影像。

圖 15：人眼觀看 3D 螢幕時的 Geometry depth perception 必須盡量落在舒適區間(左)，若要看到相同尺寸比例的 3D 內容，則須仿造配置類似人眼參數之相機(右)

圖 16：成像時為了遷就 3D 螢幕，將物體的深度值線性壓縮

(11)

(2) 基於立體相機視差分布(parallax distribution)改動兩相機的水平間距(baseline)

對大多數人來說，觀看 3D 內容所能容忍的視差角度變化大約在 60~70 arc-min[11](Parallax 計算方式如圖 17 所示，定義為眼睛注視螢幕時的視線夾角與注視物體時視線的夾角差，通常正值表示看較遠處)；Converge 配置的雙眼相機所考慮到虛擬相機包含三個自由度：兩相機距離 (baseline)、兩相機夾角(Rotate)與 Field of view(Zoom)如圖 18；除了 Viewing frustum 所構成的限制外，物體與虛擬相機間的距離以及成像後影像間的平移距離是另外兩個自由度，除此之外的變數如觀賞距離(Viewing distance)在此是制定三倍螢幕高度約 100cm，眼睛距離(binocular distance) 制定 6.5cm，螢幕大小長為 59.7cm、寬為 33.7cm，螢幕解析度為(1920×1080)。

圖 17：雙眼融合影像與 Parallax 計算

圖 18：Converge 配置的雙眼相機

本計畫中所開發出來的 Converger 配置相機所呈現的結果圖如圖 19 與圖 20，利用前述的 3D 建模軟體建出立體模型，搭配 OpenGL 函數庫即時的更動立體相機所有參數，顯示於 Acer HR274H 偏光顯示器(polarizer monitor)，藉由硬體解析方式將並排(side by side)影像先拉伸再水平交錯(如圖 21 示意圖)，顯示原理是由偏光眼鏡輪流偏振奇數與偶數線條的方向，左右眼所接收

(12)

圖 19：自建 3D 手模型並排介面圖 20：Parallax 分佈圖

圖 21：硬體解析拉伸影像示意圖，左圖為 side by side 立體影像，右圖為延伸後水平交錯立體影像

圖 22：相位延遲薄膜(Passive Pattern Retarder) 所偏振的方向，依左、右眼的環狀偏光鏡偏振的方向不同

(3) 立體影像融合之舒適區間界定

Lang 於 SIGGRAPH2010 發表了 Non-linear Disparity Remapping 技術[13]，其技術可將 3D 效果不良的影片重新分配原有的 Disparity，使得 3D 效果可以限定在特定範圍內，讓人觀看起 3D 立體影片的不舒服感降低，其技術可以應用於後製處理，大幅降低影片重新製作或重新拍攝的成本，作者亦宣稱該技術可以接近 real-time 並應用於 3D 傳播(3D broadcasting)，然而本計畫與前述文獻有著異曲同工之妙，經由文獻[14]可得知視差分布(parallax distribution)與人因的觀看舒適度有著相關的影響，在 90 英吋大小的顯示器上舒適區間範圍約在-30 至 65 個像素區間內，也就是說-0.54 至 1.16 的視差(parallax)。

本次計畫選用 27 吋偏光型 3D 螢幕和文獻提到的設備與觀看的景物是不同的，故對此做了一部分前置人因實測，主要測試在此款螢幕下的舒適融合區間，而測試的內容(如圖 23)中影像視差分布近似高斯曲線的立體模型(如圖 24)，當雙眼虛擬相機觀看著模型中心點時，近似高斯曲線的視差分布有著分析容易以及觀看自然的優點，也就是說此模型視差大多居於零視差，並且負視差和正視差呈現對稱遞減。

(13)

圖 23：前置測試木偶 3D 影像圖 24：近似高斯分布的視差圖(parallax range -0.12~0.05)

表 2：受測者評估測試的環境測試影像平移操作的 3D 木偶

受測者 12 位成人受測者

顯示設備 3D 偏光式螢幕

螢幕大小 27 吋

觀看距離約 3 倍高(100cm) Brightness(Max) 250 cd/m2

評估方法由使用者調整模型位

置至舒適臨界點並評

估當前影像圖 25：實驗設置

圖 26：立體影像朝人眼移動圖 27：立體影像遠離人眼移動

實驗測試流程主要由使用者先觀看近乎零視差的立體模型(如圖 23)並填寫評價問卷，之後隨意更改模型位置調整至舒適臨界值並填寫當前影像之問卷；受測者調整的影像可能會產生兩種臨界值(如圖 26、圖 27)，分別為影像靠近與影像遠離的兩種影像，藉由此方法可去評估舒適區間

(14)

顯示器幾乎都是採用雙眼視差產生立體效果，換句話說即是左右眼各自看到不同位置的影像，而若觀測者左眼看到右眼或者是右眼看到左眼的影像，即會產生立體影像融合衝突也就是鬼影 (Crosstalk)，所以才會導致舒適度明顯的降低。

圖 28：立體影像的視差與舒適程度關係圖 (4) 心理視覺驗證實驗

本研究基於上節所界定的視差區間範圍(約-0.79 至 0.92 度)，並且藉由上節所安排的實驗設置做如下視差分布改善，改善方法如 (1)基於 Z 值(深度方向)壓縮與 (2)基於立體相機視差分布 (parallax distribution)改動兩相機的水平間距(baseline)；而本次改善影像採用分布廣且非集中的視差分布區間如圖 29、圖 31，由視差圖已得知若此影像去評估舒適度必定產生舒適度不高的評價 (20%已超出視差區間範圍)，因此變動視差分布去改善不舒適仍是我們的重點。(1) 基於深度方向壓縮針對 Z 值做單一調變，而由視差分佈圖如圖 32 可看出分布漸漸集中，集中至舒適視差範圍內，如此可由實驗結果如圖 30 看出舒適程度大幅提升，而效果的優點為改善舒適度，但伴隨而來的則是立體感沒有明顯的增加。(2)基於相機方位做調變，可由視差分布圖可看出分佈形狀不變但整體視差值向右平移，而實驗結果如圖 30 看出舒適度與立體感有些許提升，但由於視差分佈很廣的結果，造成正視差超出範圍，因而降低了些許舒適度。

(15)

圖 29：分佈廣且非集中立體影像

圖 30：實驗結果(視覺舒適度)

處理方法 視差分布

1.未處理

圖 31：未處理時視差分布(Parallax 20%約-1.18、80%約 0.47)

2.Z 值壓縮

圖 32：Z 值壓縮改善不舒適感(Parallax 20%約-0.69、80%約 0.39)

3.變動 baseline

(16)

五、結論

本研究探討了視差分佈(Parallax distribution)與舒適度的相關技術。具體做法是依照視差分佈圖變動虛擬相機的調變參數，此種技術可以有效的改善視覺不適的問題。觀測前調整相較於觀測後調整有較佳的運算效率，雖說在現今搭配 3D 顯示設備都不算太差，但在未來或許可以搭配當前觀測者的感官反應做即時的內部參數更動，將是一種解決視覺不適的好方法。而由心理視覺實驗得知，將舒適程度不高的影像作深度壓縮或相機參數調變，確實可以提高 3D 視覺舒適度。對於未來將再進一步的探討多年齡層的視差分布與舒適程度的關係，進一步求出舒適程度的集中趨勢，並將這份趨勢資料編寫成可以即時修改的觀看介面。對於未來的 3D 立體醫療或者是 3D 遊戲娛樂，都將有很好的幫助。

六、參考文獻

1. E. Criado, “Original and creative stereoscopic film making,” in Proceedings of SPIE, 2008, vol.

6803, pp. 1-10.

2. A. Boev, D. Hollosi, and A. Gotchev, “Classification of stereoscopic artefacts,” in Technical Report Mobile 3DTV, 2008, pp. 1-52.

3. J. Choi, D. Min, B. Ham, and K. Sohn, “Spatial and temporal up-conversion technique for depth video,” in IEEE International Conference on ICIP, 2009, pp. 3525-3528.

4. W. Tam, F. Speranza, and S. Yano, “Stereoscopic 3D-TV: Visual Comfort,” IEEE Transactions on broadcasting, vol. 57, no. 2, pp. 335-346, 2011.

5. E. Angel, “Interactive computer graphics : A top-down approach using OpenGL 5^th Edition,”, pp.

244-280

6. X. Zabulis and K. Daniilidis, “Multi-camera reconstruction based on surface normal estimation and best viewpoint selection,” in Int. Symp. 3D Data Processing, Visualization and Transmission, 2004, pp.733-740.

7. STRATA FOTO 3D CX 2, http://www.strata.com/

8. B. Cyganek and J. P. Siebert, “An Introduction to 3D Computer Vision Techniques and Algorithms,” Wiley, 2009, pp. 193-322

9. G. Sun and N. Holliman, “Evaluating methods for controlling depth perception in stereoscopic cinematography,” in Proceedings of SPIE, 2009, vol. 7237, pp. 1-12.

10. G. R. Jones, “Controlling perceived depth in stereoscopic images,” Proceedings of SPIE, vol. 4297, pp. 42-53, 2001.

11. F. Speranza, “Effect of disparity and motion on visual comfort of stereoscopic images,” in Proceeding of SPIE, 2006, vol. 6055, pp.1-10

12. Visualization and Interactive Media Laboratory of NCHC,

http://viml.nchc.org.tw/blog/paper_info.php?CLASS_ID=1&SUB_ID=1&PAPER_ID=146

13. M. Lang, A. Hornung, O. Wang, S. Poulakos, A. Smolic, and M. Gross, “Nonlinear disparity mapping for stereoscopic 3D,” in ACM SIGGRAPH 2010, 2010, vol. 1, no. 212, pp. 1–10.

14. Y. Nojiri, “Measurement of parallax distribution and its application to the analysis of visual comfort for stereoscopic HDTV,” in Proceedings of SPIE, 2003, vol. 5006, pp. 195-205.

(17)

國科會補助國科會補助國科會補助

國科會補助專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議心得心得心得心得報告報告報告報告

日期：101 年 11 月 08 日

計畫編號 NSC100－2218－E－011－028－

計畫名稱 3D 立體影像呈現之自動視差調整技術出國人員

姓名林宗翰服務機構

及職稱國立台灣科技大學 / 助理教授會議時間 101 年10 月24 日至

101 年10 月26 日會議地點 San Francisco, USA (美國舊金山)

會議名稱

(中文)

(英文) World Congress on Engineering and Computer Science 2012 (WCECS2012)

發表論文題目

(中文)

(英文) Controlling Depth Perception of Stereoscopic images under Given Constraints

附件四

(18)

一、參加會議經過

本次出國會議參加 World Congress on Engineering and Computer Science 2012 (WCECS 2012)並進行論文發表，期初計畫預計參加 CVPR2012 會議，但由於本研究計畫屬於新人計畫的隨到隨審機制，CVPR2012 會議截稿之時(2011 年 11 月)尚未獲知計畫申請結果，故未來得及準備投稿，因此轉而投稿至 ACM SIGGRAPH 2012 (2012 年 2 月截稿)，由於競爭激烈，我的文章並未被 SIGGRAPH 2012 接受，因此我根據 reviewer 的意見，再將文章內容強化，並且補充更嚴謹的資料，經過三的多月的努力將文章轉投稿至 WCECS 2012，最後獲得接受。

WCECS 2012 於美國舊金山地區舉辦，會議地點在加州柏克萊大學(University of California, Berkeley)的 Clark Kerr Campus 校區(如圖 1)，該校區位於 UC Berkeley 大學城的東南邊(圖 2)。會議場地為該校的 Conference Center，會場距離舊金山國際機場(SFO)約 29 英里。WCECS 2012 由 the International Association of Engineers (IAENG) 機構所主辦，IAENG 是一個工程與電腦資訊科學的國際性非營利組織。該組織著重先進技術之理論與應用主題進行論文審查，每年皆有超過 30 個國家一千多人參與該會議。IAENG 有 60 個技術委員會分佈於 20 多個國家的大學與研究機構。

圖 1 會議地點與 U. C. Berkeley 校區地圖(取自 google map)

由於 WCECS 2012 擁有各個技術委員會，並涵蓋多個領域，故該會議又區分成 15 個子會議包含：

ICCB(International Conference on Computational Biology 2012) ICCE(International Conference on Chemical Engineering 2012) ICCS(International Conference on Circuits and Systems 2012)

ICCSA(International Conference on Computer Science and Applications 2012)

(19)

ICIAR(International Conference on Intelligent Automation and Robotics 2012) ICIMT(International Conference on Internet and Multimedia Technologies 2012) ICMHA(International Conference in Modeling Health Advances 2012)

ICMLDA(International Conference on Machine Learning and Data Analysis 2012) ICMSC(International Conference on Modeling, Simulation and Control 2012) ICSCA(International Conference on Soft Computing and Applications 2012)

ICSEEM(International Conference on Systems Engineering and Engineering Management 2012)

ICSPIE(International Conference on Signal Processing and Imaging Engineering 2012) 於三天內，總共發表 400 多篇口頭報告文章，並且展開 4 場 Keynote speech，以及 12 場左右的 invited speech。我所發表的文章歸屬於 ICSPEI Section (ICSPEI-IV)，議程安排在第一天與第二天(圖 3)。

圖 2 會議地點 Clark Kerr Campus 校區位置(取自 google earth)與校區入口處會議地址：Clark Kerr Campus, University of California, Berkeley, 2601 Warring Street, Berkeley, CA 94720-2272, USA。

從桃園機場起飛抵達舊金山，直飛約費時 11 個多小時，從機場有 BART 系統可直

接抵達 UC Berkeley 站，步行前往 Clark Kerr Campus 約 30~40 分鐘。本次會議全程

涵蓋 3.5 天，從 10 月 24 日至 10 月 26 日為會議日，10 月 23 日下午為 reception tea

時段(圖 4)，讓參加者可提早到會場準備，當時也已經開放現場報名與領取註冊資

料。我於 22 日上午即前往會場，瞭解附近交通以免會議當天以免錯失 Keynote

speech，而 23 日下午亦前往領取註冊資料。該校區內主要功能為會議中心，以及部

(20)

圖 3 Day1-Day2 的議程

圖 4 會議場地建築外觀與入口處

圖 5 會議場地與校區平面配置圖

會議接待人員為主要來自 UC Berkeley 的博士生(圖 6)，同時在大會會場擺置了 20 多項論文出版品，這些出版品主要由 IAENG 以及 Springer 所發行，涵蓋電子、電機、

資訊等工程領域，提供給參與者閱讀與購買。三天的會議皆有自助式午餐，使用場

地為 UC Berkeley 的教職員招待所(圖 7 與圖 8)，第二天晚上備有晚宴供參加的學者

一同交流。

(21)

圖 6 會議接待與茶點刊物取用區

圖 7 Springer 出版品與招待所午餐 Buffet

圖 8 會議場地外休憩區

與會過程，我遇到自台灣雲林的楊教授，他目前在德州達拉斯 UNT(University of

North Texas)擔任助理教授(圖 9)，主專長為人工智慧，他在美國擔任教職超過十年，

(22)

圖 9 與他學者合影

圖 10 會議場地周遭

我的論文會議場次在第二天下午，題目為： Controlling Depth Perception of Stereoscopic images under Given Constraints，是該場次的第一位上台報告的人，其他的論文發表者還包含各大學教授(圖 11)。論文發表時間約 15 分鐘，並接受提問，我使用 25 頁投影片講述論文內容(圖 12 與圖 13)，並以 4 分鐘的影片展示製作結果，

以比較直覺的方式呈現結果(圖 14)，因此獲得相當好的回應。我攜帶自己慣用的電

腦前往，亦準備好可展示的程式，但大會所提供的投影機解析度無法滿足我的程式

輸出規格(註：根據計畫內容，我的開發程式是針對 HD 畫質的顯示器開發)，此外也

因為報告的時間有限，多方考慮之下，我以影片取代實際程式執行，但於會後仍有

幾位學者可以直接透過我的筆記型電腦觀看即時運算的結果。

(23)

圖 12 口頭發表所用投影片縮圖-1

圖 13 口頭發表所用投影片縮圖-2

圖 14 口頭發表所用動態影片截圖(共四分鐘)

大會於會議論文發表相當重視，每一位註冊者可獲得註冊收據證明，針對每一位

(24)

圖 15 註冊收據與完成口頭發表後核發的證明書(影本) 二、與會心得

本次出國參加國際會議是我到學校擔任助理教授工作後第一次辦理，因此在事前校內公文核定流程比較生疏，由於學校行助理與政人員不厭其煩協助我逐步完成各項必要程序，以及出國注意事項等。

此次會議在與外國學者交流過程中，個人的觀察與感想如下：韓國與中國大陸影

響力持續增加。參與的過程中可發現有不少來自韓國的學生發表，其次則是來自中

國大陸的學者，這些來自韓國與大陸的學生與學者大多受到政府財團的鼓勵與支持

前往發表，藉以拓展國際能見度與影響力，這個現象在近十年以來越來越明顯。例

如在舊金山市區隨處可看見韓國三星所投入的廣告宣傳，機場等人來人往的公共空

間亦是如此。我也另外感受到美國經濟低迷，與參加學者意見交流過程中發現，美

國雖然是世界強國，但由於近幾年來的經濟衰退，國家財政緊縮，新進大學教授普

遍不容易爭取到國家經費，而剛起步的技術亦少有廠商願意投入經費，在無法取得

預算補助的情況下，導致參加國際性會議的意願有降低的趨勢，未來也可能是一種

惡性循環。

(25)

系統，或透過機器人改善智慧生活。

此外感謝國科會提供經費補助，使我得以順利完成論文發表，並獲取寶貴的學習機會，對於視野的開拓與人脈的培養皆有相當正面的幫助。

三、考察參觀活動(無事項活動者略) 無考察參觀行程。

四、建議

本次會議於 San Francisco 舉辦，涵蓋各工程領域專長，是一項跨領域的國際會議，

美中不足是地點距離交通要衝稍遠，若非提早出門很難趕上一早的 Keynote speech，

而舊金山當時也正好處於封閉彎曲大橋的交通管制狀態，導致交通通勤時間更混亂。此外舊金山的消費與住宿費用也偏高，因此為了節省旅費以及避開治安不佳的區域，我選擇了距離會場約 40 分鐘距離的飯店，但因已經提早前往熟悉會議地點，

才讓我在交通通勤與論文發表準備方面比較充裕。

五、攜回資料名稱及內容

1. 會議光碟 DVD 一片：WCECS2012 論文集電子檔。

2. 會議論文(紙本)一冊：WCECS2012 論文集紙本。

六、其他

(26)

國科會補助計畫衍生研發成果推廣資料表

日期:2012/12/15

國科會補助計畫

計畫名稱: 3D立體影像呈現之自動視差調整技術計畫主持人: 林宗翰

計畫編號: 100-2218-E-011-028- 學門領域: 視訊與影像分析

無研發成果推廣資料

(27)

100 年度專題研究計畫研究成果彙整表

計畫主持人：林宗翰計畫編號：100-2218-E-011-028-

計畫名稱：3D 立體影像呈現之自動視差調整技術

量化

成果項目 ^{實際已達成}

數（被接受或已發表）

預期總達成數(含實際已

達成數)

本計畫實際貢獻百

分比

單位

備註（質化說明：如數個計畫共同成果、成果列為該期刊之封面故事 ...等）

期刊論文 0 0 100%

研究報告/技術報告 0 0 100%

研討會論文 0 0 100%

論文著作篇

專書 0 0 100%

申請中件數 0 0 100%

專利已獲得件數 0 0 100% 件

件數 0 0 100% 件

技術移轉

權利金 0 0 100% 千元

碩士生 0 2 100%

博士生 0 0 100%

博士後研究員 0 0 100%

國內

參與計畫人力

（本國籍）

專任助理 0 0 100%

人次

期刊論文 0 0 100%

研究報告/技術報告 0 0 100%

研討會論文 0 1 100%

篇

T. H.

Lin, ＇Controlling Depth Perception of Stereoscopic

images under Given Constraints,＇

World Congress on Engineering and Computer Science 2012 (WCECS2012), Oct. 24-26, 2012, San Francisco, USA.(Award)

論文著作

專書 0 0 100% 章/本

國外

(28)

專任助理 0 0 100%

其他成果

(

無法以量化表達之成果如辦理學術活動、獲得獎項、重要國際合作、研究成果國際影響力及其他協助產業技術發展之具體效益事項等，請以文字敘述填列。)

1. 參加國際會議研討會，獲得獎項：Certificate of Merit for International Conference on Signal Processing and Imaging Engineering 2012。

2. 研究成果用於教學。

成果項目量化 名稱或內容性質簡述

測驗工具(含質性與量性) 0

課程/模組 0

電腦及網路系統或工具 0

教材 0

舉辦之活動/競賽 0

研討會/工作坊 0

電子報、網站 0

科教處計畫加填項

目計畫成果推廣之參與（閱聽）人數 0

(29)

國科會補助專題研究計畫成果報告自評表

請就研究內容與原計畫相符程度、達成預期目標情況、研究成果之學術或應用價值（簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性）、是否適合在學術期刊發表或申請專利、主要發現或其他有關價值等，作一綜合評估。

1. 請就研究內容與原計畫相符程度、達成預期目標情況作一綜合評估

■達成目標

□未達成目標（請說明，以 100 字為限）

□實驗失敗

□因故實驗中斷

□其他原因說明：

2. 研究成果在學術期刊發表或申請專利等情形：

論文：■已發表 □未發表之文稿 □撰寫中 □無專利：□已獲得 □申請中 ■無

技轉：□已技轉 □洽談中 ■無其他：（以 100 字為限）

3. 請依學術成就、技術創新、社會影響等方面，評估研究成果之學術或應用價值（簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性）（以 500 字為限）

3D 立體資料呈現技術目前已逐漸使用在醫療領與，用來協助醫師診斷醫學影像資料。本技術探討呈現立體影像資料時所產生的種種問題，並有效控制立體視差，可確保觀看的舒適性，未來預計將此技術開發在 3D 瀏覽軟體中呈為主流的 3D 觀看介面。

3D立體影像呈現之自動視差調整技術

行政院國家科學委員會專題研究計畫 期末報告

3D 立體影像呈現之自動視差調整技術

中 華 民 國 101 年 12 月 15 日

行政院國家科學委員會補助專題研究計畫 □期中進度報告

期末報告

3D 立體影像呈現之自動視差調整技術

計畫類別：  個別型計畫 □ 整合型計畫

計畫編號：NSC100－2218－E－011－028－

執行期間：100 年 11 月 01 日至 101 年 10 月 31 日

執行機構及系所：國立台灣科技大學 色彩與照明科技研究所

計畫主持人：林宗翰 共同主持人：NA

計畫參與人員：胡尚仁、張顥騰

本計畫除繳交成果報告外，另須繳交以下出國報告：

□ 赴國外移地研究心得報告

□ 赴大陸地區移地研究心得報告

 出席國際學術會議心得報告及發表之論文

□ 國際合作研究計畫國外研究報告

一、前言

二、立體影像建模

三、視差分佈分析處理

四、基於影像自動調整 parallax 技術

五、結論

六、參考文獻

國科會補助 國科會補助 國科會補助

國科會補助專題研究計畫項下出席國際學術會議 專題研究計畫項下出席國際學術會議 專題研究計畫項下出席國際學術會議 專題研究計畫項下出席國際學術會議心得 心得 心得 心得報告 報告 報告 報告

計畫編號 NSC100－2218－E－011－028－

計畫名稱 3D 立體影像呈現之自動視差調整技術 出國人員

姓名 林宗翰 服務機構

及職稱 國立台灣科技大學 / 助理教授 會議時間 101 年10 月24 日至

101 年10 月26 日 會議地點 San Francisco, USA (美國舊金山)

會議名稱

(中文)

(英文) World Congress on Engineering and Computer Science 2012 (WCECS2012)

發表論文 題目

(中文)

(英文) Controlling Depth Perception of Stereoscopic images under Given Constraints

一、參加會議經過

圖 1 會議地點與 U. C. Berkeley 校區地圖(取自 google map)

由於 WCECS 2012 擁有各個技術委員會，並涵蓋多個領域，故該會議又區分成 15 個子會議包含：

ICCB(International Conference on Computational Biology 2012) ICCE(International Conference on Chemical Engineering 2012) ICCS(International Conference on Circuits and Systems 2012)

ICCSA(International Conference on Computer Science and Applications 2012)

ICIAR(International Conference on Intelligent Automation and Robotics 2012) ICIMT(International Conference on Internet and Multimedia Technologies 2012) ICMHA(International Conference in Modeling Health Advances 2012)

ICMLDA(International Conference on Machine Learning and Data Analysis 2012) ICMSC(International Conference on Modeling, Simulation and Control 2012) ICSCA(International Conference on Soft Computing and Applications 2012)

ICSEEM(International Conference on Systems Engineering and Engineering Management 2012)

圖 2 會議地點 Clark Kerr Campus 校區位置(取自 google earth)與校區入口處 會議地址：Clark Kerr Campus, University of California, Berkeley, 2601 Warring Street, Berkeley, CA 94720-2272, USA。

從桃園機場起飛抵達舊金山，直飛約費時 11 個多小時，從機場有 BART 系統可直

接抵達 UC Berkeley 站，步行前往 Clark Kerr Campus 約 30~40 分鐘。本次會議全程

涵蓋 3.5 天，從 10 月 24 日至 10 月 26 日為會議日，10 月 23 日下午為 reception tea

時段(圖 4)，讓參加者可提早到會場準備，當時也已經開放現場報名與領取註冊資

料。我於 22 日上午即前往會場，瞭解附近交通以免會議當天以免錯失 Keynote

speech，而 23 日下午亦前往領取註冊資料。該校區內主要功能為會議中心，以及部

圖 3 Day1-Day2 的議程

圖 4 會議場地建築外觀與入口處

圖 5 會議場地與校區平面配置圖

會議接待人員為主要來自 UC Berkeley 的博士生(圖 6)，同時在大會會場擺置了 20 多項論文出版品，這些出版品主要由 IAENG 以及 Springer 所發行，涵蓋電子、電機、

資訊等工程領域，提供給參與者閱讀與購買。三天的會議皆有自助式午餐，使用場

地為 UC Berkeley 的教職員招待所(圖 7 與圖 8)，第二天晚上備有晚宴供參加的學者

一同交流。

圖 6 會議接待與茶點刊物取用區

圖 7 Springer 出版品與招待所午餐 Buffet

圖 8 會議場地外休憩區

與會過程，我遇到自台灣雲林的楊教授，他目前在德州達拉斯 UNT(University of

North Texas)擔任助理教授(圖 9)，主專長為人工智慧，他在美國擔任教職超過十年，

圖 9 與他學者合影

圖 10 會議場地周遭

以比較直覺的方式呈現結果(圖 14)，因此獲得相當好的回應。我攜帶自己慣用的電

腦前往，亦準備好可展示的程式，但大會所提供的投影機解析度無法滿足我的程式

輸出規格(註：根據計畫內容，我的開發程式是針對 HD 畫質的顯示器開發)，此外也

因為報告的時間有限，多方考慮之下，我以影片取代實際程式執行，但於會後仍有

幾位學者可以直接透過我的筆記型電腦觀看即時運算的結果。

圖 12 口頭發表所用投影片縮圖-1

圖 13 口頭發表所用投影片縮圖-2

圖 14 口頭發表所用動態影片截圖(共四分鐘)

大會於會議論文發表相當重視，每一位註冊者可獲得註冊收據證明，針對每一位

圖 15 註冊收據與完成口頭發表後核發的證明書(影本) 二、與會心得

本次出國參加國際會議是我到學校擔任助理教授工作後第一次辦理，因此在事前 校內公文核定流程比較生疏，由於學校行助理與政人員不厭其煩協助我逐步完成各 項必要程序，以及出國注意事項等。

此次會議在與外國學者交流過程中，個人的觀察與感想如下：韓國與中國大陸影

響力持續增加。參與的過程中可發現有不少來自韓國的學生發表，其次則是來自中

國大陸的學者，這些來自韓國與大陸的學生與學者大多受到政府財團的鼓勵與支持

行政院國家科學委員會專題研究計畫期末報告

中華民國 101 年 12 月 15 日

計畫類別：  個別型計畫 □ ^{整合型計畫}

執行機構及系所：國立台灣科技大學色彩與照明科技研究所

計畫主持人：林宗翰共同主持人：NA

國科會補助國科會補助國科會補助

國科會補助專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議專題研究計畫項下出席國際學術會議心得心得心得心得報告報告報告報告

計畫名稱 3D 立體影像呈現之自動視差調整技術出國人員

姓名林宗翰服務機構

及職稱國立台灣科技大學 / 助理教授會議時間 101 年10 月24 日至

101 年10 月26 日會議地點 San Francisco, USA (美國舊金山)

發表論文題目

圖 2 會議地點 Clark Kerr Campus 校區位置(取自 google earth)與校區入口處會議地址：Clark Kerr Campus, University of California, Berkeley, 2601 Warring Street, Berkeley, CA 94720-2272, USA。

本次出國參加國際會議是我到學校擔任助理教授工作後第一次辦理，因此在事前校內公文核定流程比較生疏，由於學校行助理與政人員不厭其煩協助我逐步完成各項必要程序，以及出國注意事項等。

此外感謝國科會提供經費補助，使我得以順利完成論文發表，並獲取寶貴的學習機會，對於視野的開拓與人脈的培養皆有相當正面的幫助。

□其他原因說明：

論文：■已發表 □未發表之文稿 □撰寫中 □無專利：□已獲得 □申請中 ■無

技轉：□已技轉 □洽談中 ■無其他：（以 100 字為限）

3. 請依學術成就、技術創新、社會影響等方面，評估研究成果之學術或應用價值（簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性）（以 500 字為限）