• 沒有找到結果。

3D臉部形變的殺手級特效? 計算保角幾何與 3D 動畫

N/A
N/A
Protected

Academic year: 2021

Share "3D臉部形變的殺手級特效? 計算保角幾何與 3D 動畫"

Copied!
11
0
0

加載中.... (立即查看全文)

全文

(1)

的數值計算方法,其應用範圍包含3D 動畫、表情 分析、人臉辨識、古物保存、工業檢測、醫學影像 等。本文將對於保角映射在曲面形變的應用做進一 步的介紹。 3D 影像的擷取 以電影《阿凡達》為例,其拍攝過程使用了特殊 的攝影機,結合3D 影像的後製技術,將虛擬的材 質與擷取的影像合成,其合成的視覺品質取決於投 資人力的多寡,以及影像的後製技術,其核心問題 在於影像的對應。有了正確的對應關係,才能將材 質紋理貼到正確的位置,以達到理想的視覺效果。 然而,相較於平面影像的對應問題,3D 影像的對 應要來得困難許多。畢竟3D 影像比平面影像多了 一個維度,也就是多了一個自由度,其幾何資訊也 比平面影像豐富許多。在本文中,我們將會介紹如 何透過幾何的手法來簡化3D 影像的對應問題。 在硬體方面,現階段我們可以藉由3D 影像掃描 儀(3D 照相機)來擷取 3D 影像。圖 1 為交通大 像 形 變(morphing)是由一張影像流暢的 變化成另一張影像的漸變過程。1991 年,流行音 樂 之 王 麥 可. 傑 克 森(Michael Jackson)在歌曲 Black or White的 音 樂 影 片 結 尾 就 使 用 了 這 種 特 效,接連將不同種族的人臉,從一張連續的變化成 另一張,視覺感受令人驚豔。隨後許多廣告影片也 紛紛開始模仿運用影像形變的特效。隨著電腦技術 的快速發展,2D 影像形變特效的技術已近乎成熟, 被廣泛應用於影片的製作中。然而,處理3D 影像 的形變特效仍有許多困難之處。隨著3D 列印科技 日漸進步,3D 影像影像處理的技術也隨之漸漸受 到重視。 近年來,中央研究院丘成桐院士致力於推動應用 數學的發展,特別是運用拓樸與幾何的想法,將實 際的問題化繁為簡,以達到更高效率解決問題的目 的。他率先將二維曲面保角幾何的理論與數值演 算法有系統地結合,並寫成了《計算保角幾何》 (Computational Conformal Geometry) 一 書。 他 於2002 年提出了保角映射(conformal mapping)

作者:林文偉.樂美亨 作者簡介:林文偉是德國畢勒費大學應用數學博士,現為交通大學應用數學系講座教授及丘成桐中心執行長。主要研究領域有數值分 析、矩陣理論及計算、動態系統、最佳控制、計算保角幾何。 樂美亨是交通大學應用數學系博士生,現為哈佛大學訪問博士生。 21 世紀物理學

3D

臉部形變的

殺手級特效?

數學與應用

計算保角幾何與 3D 動畫

(2)

透過結構光的反 射 得 到 的, 對 於 不 反 光 的 地 方, 如 眼 珠 及 頭 髮, 會 被3D 照 相 機 判 定 為 破 洞。 因 此, 在 實 際 應 用 之 前, 需 要 透 過 適當的剪裁與修補。另一方面,由 GV3 拍攝得到 的材質資訊是黑白的。對於人臉的照片,我們可以 透過改變色譜(color map)將不同深度的灰色換 成深度不同的膚色來得到比較美觀的色彩(圖3)。 3D 影像的顯示 在顯示器的部分,3D 立體顯像設備可分為濾鏡 式與裸眼式 [8]。當今的 3D 立體電影放映設備即 是屬於濾鏡式顯像,其特徵為觀眾必須配戴特製 的眼鏡來觀賞3D 影片,以達到立體的視覺效果。 濾鏡式顯像設備又可分為偏光濾鏡式(polarizing filter)和紅藍濾鏡式(anaglyph)。偏光濾鏡式的 顯像設備為兩台可以投射出偏振光的投影機,需配 戴偏光眼鏡觀看,其鏡片呈淡灰色,左右眼的鏡片 不同,左眼為 45 度偏振光鏡片,右眼為 135 度偏 振光鏡片,因此,兩眼看到的影像不同,讓影片中 的物體看起來是立體的。缺點是當頭部傾斜時,偏 光鏡片無法完全濾掉另一個方向的光線,讓眼睛看 到另一眼的畫面。紅藍濾鏡式顯像設備即一般的投 影機,需配戴紅藍眼鏡觀看影片, 顧名思義,其鏡片左眼是紅色,右 眼是藍色,因此,讓兩眼看到不同 顏色濾鏡的影像,產生立體的視覺 效果。缺點是影片的畫面會因為紅 藍濾鏡而只剩下單一色調。 另 一 方 面, 裸 眼 式 的3D 立 體 顯 像 設 備 大 致 可 分 為 全 息 影 像 學丘成桐中心的3D 影像掃描儀 GV3,其尺寸接 近一台家用微波爐的大小,正面左邊的是投影機鏡 頭,右邊的是照相機鏡頭,透過投影機鏡頭投射出 的結構光(structured-light),照射到物體後,從 反射的光線可探測出物體的幾何,並由照相機鏡頭 以三角網格的形式記錄立體影像。其背面需連接電 源線與三條訊號線,透過訊號線,將擷取的影像輸 入電腦儲存。 3D 照相機是如何得到 3D 影像呢?它得到的是 一大堆的點。將這些點用三角網格連接在一起,就 成了一個離散的曲面,也就是所謂的幾何資訊。每 一個點上都有它的顏色,稱為材質資訊。以 GV3 為 例,所拍攝的每張3D 照片,包含了黑白的材質資 訊以及幾何資訊,分別以 bmp 點陣圖檔及 obj 格 式檔案記錄。其中,obj 格式檔案包含歐氏空間 R3 中的三維座標點集,以及將點連接起來的三角網 格。換句話說,所擷取的每張照片都是一個空間中 的離散曲面,即嵌入 R3 中的三角網格(見圖 2)。 在圖2 中,我們可以看到中圖的網格中有許多破 洞,網格的邊界也不平整。由於這些點的位置是 圖1 3D 影像掃描儀 GV3(3D Scanner GV3)。 圖2 透過 3D 影像掃描儀 GV3 所擷取的原始資料。 圖3 不同色譜的效果。

(3)

關鍵的數學理論─保角映射 保角映射又稱為共形映射。透過保角映射,我們 可以將三維的影像攤平,成為一個二維的影像,簡 化了3D 影像編輯的操作。此外,保角映射是一個 保持角度的變換。也就是說,曲面(或平面)上的 90 度角,透過保角映射到另一個曲面(或平面) 上,其角度仍然保持90 度。這對 3D 影像的材質 貼圖很重要,它能夠保證材質的圖樣不會因為貼到 複雜的曲面上而產生扭曲。 根 據 數 學 上 的 龐 卡 赫 單 值 化 定 理(Poincaré uniformization theorem),我們知道僅有單一邊界 的單連通(simply connected)黎曼曲面保角等價 於(conformally equivalent)平面上的單位圓盤。 換言之,透過保角映射,我們可以將空間中的曲面 映到平面上的單位圓盤。這樣的保角映射稱為黎曼 保角映射(Riemann conformal mapping)。 以下, 我們依序介紹球面保角映射(spherical conformal mapping)的計算,以及如何透過球面保角映射, 實現黎曼保角映射的計算(見圖4)。 球面的保角映射演算法,首先由丘成桐與紐約州 立大學石溪分校資訊科學系的顧險峰於 2002 年提 出 [6]。其想法是基於曲面 M 映射到球面 S2 上的 調 和 映 射(harmonic mapping)是保角的事實。 調和映射' 是曲面之間的光滑映射,可以透過求

解 非 線性 的熱 擴散 方 程(nonlinear heat diffusion equation)得到: 1 d' dt = ' (holography)和 2D 多工式(multiplexed 2D)。 目前市面上所見到的裸視3D 顯示器都屬於後者, 當今流行的任天堂3DS 掌上型主機就是一個例子。 其概念近似於偏光濾鏡的顯像原理。不同的是,觀 眾無需配戴偏光眼鏡,且沒有視角的限制。透過螢 幕表面的特殊光柵,利用兩隻眼睛的距離約六公分 的差異,讓左右兩眼看到不同的畫面,達到立體的 視覺效果。 全息影像是利用紅、藍、綠三種顏色的雷射光 源,透過多面鏡將立體影像呈現出來。能讓觀眾在 360 度都能夠觀賞影片是其優點之一。值得一提的 是,以上所描述的3D 立體顯像設備之中,只有全 息影像需要真實的3D 影像資料,其他顯像方式僅 需要3D 影像的兩個投影面即可達到立體的視覺效 果。然而,在立體電影錄製的過程中,許多原始資 料仍是三維的,因此需要三維數據的處理技術。 影像的編輯與後製 在 軟 體 方 面, 對 於 平 面 影 像, 當 今 已 有 許 多 成 熟 的 軟 體 可 以 有 效 處 理 傳 統 的 平 面 照 片, 如 PhotoScape、Photoshop。然而,對於 3D 影像的 處理仍有許多困難的地方。核心問題在於3D 影像 多了一個維度,但我們的螢幕是平面的,一次只能 看到3D 影像的其中一個投影面。在操作上,自然 也就沒有像處理平面影像時自如。當今常見的 3D 繪圖軟體有 AutoCAD、3ds Max、SketchUp 等, 對於3D 建模的功能已很齊全。然而,這些軟體在 處理點數上萬的網格時,效率仍很有限。以3D 影 像掃描儀 GV3 來說,所擷取到的幾何資訊網格點 數約為12 萬到 13 萬點。對於點數如此龐大的三角 網格,其處理技術尚在研發階段。接下來,我們將 介紹如何運用黎曼保角映射(Riemann conformal mapping),將 3D 影像的處理簡化成平面影像的 處理。 圖4 利用保角映射將獅子的表面映到球面。

(4)

將半球沿著赤道剪下,並對這個半球做球極投影 (stereographic projection)到單位圓盤上,即得 到離散曲面 M 映到單位圓盤的保角映射,這就是 所求的黎曼保角映射。 以下頁圖6 中的八個臉部表情為例,其相對應的 黎曼保角映射如圖 7,詳細資訊如表 1。從表中可 看出,對於一張六萬點的照片,計算黎曼保角映射 僅需花費不到六秒的時間。至於如何看出這些映射 確實是保角的,可以利用保角映射的性質─將直 角映到直角─來檢視。具體而言,要檢驗其保角 的性質,可以透過在單位圓盤上貼棋盤格貼圖,並 映回空間中的離散曲面,檢驗棋盤格貼圖的每個方 格是否保持直角(圖 8)。從圖中可看出,棋盤格 貼圖的每個方格大致上都保持直角,這意味著透過 數值實現的保角映射,其保角性十分良好。 更值得一提的是,黎曼保角映射是可逆的。也就 是說,離散曲面 M 透過保角映射 ' 映到單位圓'(M) 之後,可透過逆映射 ' 1 將該單位圓盤 還原為曲面 M。因此,透過黎曼保角映射,我們 可以將空間中的曲面對應問題,簡化成平面單位圓 盤之間的對應問題。接下來,我們將介紹如何運用 由於 ' 是映射到球面,在迭代求解非線性方程 1 的過程中,我們僅考慮水平的分量(即切平面上 的投影),以保持 '(M, t) 為球面。在限制條件 '(M, t) 2 S2 之下,非線性方程 1 可改寫成 2 d' dt = ( ') k 其中( '(v))k 代表 ' 在切方向的投影(水平 分量),也就是將垂直的分量扣掉。即 3 ( '(v))k= '(v) ( '(v))? 式中( '(v))?代表 ' 在法向量 n('(v)) 上的 投影(垂直分量),即 ( '(v))? =h '(v), n('(v))in('(v)) 這裡的 v 是離散曲面 M 上的點。在數值方法 上, 可 以 採 取 較 有 效 率 的 準 隱 式 歐 拉 法( quasi-implicit Euler method)[5],其迭代式為

h I + δt(m)(K D(m))i'(m+1)= '(m) 其中,K是拉普拉斯矩陣(Laplacian matrix), D(m) 是對角矩陣,定義為 h D(m)i ii = D K'(m)(vi), '(m)(vi) E 迭代的初始值'(0) 可由高斯映射(Gauss map) 得到。高斯映射是把曲面 M 上的點 v 對應到該點 單位法向量的映射,其值域為單位球面,滿足上述 之限制條件。當迭代至收斂後,所得到的映射就是 曲面 M 對應到球面 S2 的調和映射,即球面保角 映射。接下來,我們將介紹如何透過球面保角映射 來實現黎曼保角映射。 黎曼保角映射的計算 黎曼保角映射的計算方法[7],如圖 5 所示,對 於一個單連通的離散曲面 M,可以透過將之複 製一次,並將兩者的邊界黏接起來,成為一個封 閉的曲面 M。接著,仿照前例,透過非線性的 熱擴散方程,計算 M 的球面保角映射。最後, 圖5 黎曼保角映射的計算方法是意圖。

(5)

這樣的構想來建構三維臉部表情之間的對應函數。 建立臉部函數的對應 曲面的對應在 3D 動畫拍攝的後製中扮演著重要 的角色,錯誤的對應會造成不自然的形變,甚至疊 影。對於離散曲面對應的問題,顧險峰等人利用腦 部曲面的特徵點,找到兩個人臉曲面的球面保角映 射之間的最佳莫比烏斯變換(Möbius Transform) [6],讓兩人臉曲面之間的對應函數為保角變換。 在考慮臉部表情之間的對應時,我們允許肌肉的扭 動。然而,扭動的行為本身不是保角的。因此, 我們藉由基底函數 r2log r 來描述肌肉扭動的行為 [2]。 在衡量臉部表情動畫的串接效果時,觀眾最容易 注意到五官特徵變化的瑕疵。因此在建構對應函數 時,在五官特徵的附近,如眉毛、眼睛、鼻子以及 嘴巴,其對應勢必要求精確。其他部位,如臉頰與 額頭,其幾何特徵與材質特徵都比較不明顯,對於 精確度的容忍相對較大。基於這個考量,我們採取 以特徵點為基準的全局對應函數(landmark-based global matching)。此外,為了確保對應函數能夠 把邊界映到邊界,我們也在單位圓盤的邊界均勻地 選取16 個點 cosk⇡8 , sink⇡8  作為特徵點,其中, k = 0, . . . , 15。 具體而言,我們不妨假設分別在兩張人臉 Sa 及 圖7 八個表情對應的黎曼保角映射成像。 圖8 八個表情相對應的棋盤格貼圖。

表1 計算黎曼保角映射所需的時間 。(Laptop: Intel Core-i7 2.9GHz with 12GB ram)

表情 點數 面數 矩陣大小 迭代步數 時間(秒) 面無表情 62,240 123,487 123,489 9 6.11 微笑 58,432 115,908 115,910 8 4.95 難過 56,799 112,653 112,655 9 5.30 嘟嘴 57,547 114,143 114,145 7 4.54 苦笑 58,836 116,713 116,715 7 4.48 痛苦 60,914 120,837 120,839 10 5.99 鬼臉 61,811 122,626 122,628 10 5.97 生氣 60,323 119,660 119,662 9 5.67 圖6 3D 攝影的八個人臉表情。

(6)

Sb 上選取了 m 個特徵點,分別記為 n p(i)⌘ (p(i)1 , p (i) 2 , p (i) 3 ) om i=1⇢ Sa 以及 n q(i)⌘ (q1(i), q (i) 2 , q (i) 3 ) om i=1 ⇢ Sb 我 們 的 目 標 是 建 構 一 個 對 應 函 數 f :Sa! Sb (圖 9),使得 f (p(i))⇡ q(i),其中 i = 1, . . . , m 首 先, 利 用 黎 曼 保 角 映 射 'a :Sa! D 以 及 'b:Sb ! D 將 兩 個 離 散 曲 面 分 別 映 到 單 位 圓 盤 D。我們分別將這 m 個映到單位圓盤上的點 'a(p(i)) 與 'b(q(i)) 記為

p(i)D ⌘ (p(i)D,1, p(i)D,2) 以及 qD(i)⌘ (qD,1(i), q(i)D,2)

其中i = 1, . . . , m。 接著,透過基底函數r2log r,在單位圓盤上構造 對應函數 fD(x1, x2) = ⇣ fD(1)(x1, x2) , fD(2)(x1, x2) ⌘ 如下式: fD(k)(x1, x2) =Pn 2 j=1↵(k)j r2 x,jlog rx,j, k = 1, 2 在上式中,rx,j = x c(j) 2 為點 x 到點 c(j) 的 距 離,x = (x1, x2) 為單位圓盤上的點,另外 c(j) = (c(j) 1 , c(j)2 ) 為佈於正方形 [−1, 1] ⇥ [−1, 1]n⇥ n 棋盤格點,j(k) 是待定的係數,其中 j = 1, . . . , n2。我們透過求解以下最小平方法問題 來得到這些未知的係數: argmin(k) S↵(k) qD,k 2, k = 1, 2 其中,矩陣S = [Sij] 定義為 Sij = r2

i,jlog ri,j, i = 1, . . . , m, j = 1, . . . , n2

ri,j =kp(i)D − c(j)k2 為點p(i)D 到點 c(j) 的距離,

↵(k)qD,k 分別代表 ↵(k)=h↵(k)1 , . . . , ↵(k)n2 i>qD,k=hq(1)D,k, . . . , qD,k(m)i>n2 m 時,由於未知數的個數小於限制條件 的數量,這個最小平方問題可以很容易地透過QR 方法[4] 來解決。反之,當 n2> m 時,未知數的 個數會大於限制條件的數量,因而造成(k) 有無 窮多組解。為了確保解的唯一性,我們利用吉洪諾 夫正則化(Tikhonov regularization)[3] 來處理這 個問題。具體而言,我們要解線性系統  "I + S>S↵(k)= S>qD,k 其中,微小量" 可取值 0.001。當係數 (k) 被決 定之後,單位圓盤之間的對應函數fD 也就被唯一 地決定了。 圖10 呈現了函數 fD 的對應, 從圖中可看出紅點 fD('a(p(i)))⇡ 'b(q(i)),其中,i = 1, . . . , m。換 圖9 建構曲面對應函數的示意圖。利用黎曼保角映射(垂直部分 的映射)與fD,得到上方的人臉(曲面)間的映射。 圖10 利用特徵點建立對應函數fD,比較右圖與將左圖變換得到 的中圖,會發現紅色特徵點的位置相近,臉部表情特徵也類似。

(7)

來描述。至於平滑函數的選取,可以採用三次樣條 插值函數(cubic spline interpolation)。它是讓泛 函F (x) =RT 0 |x00(t)|2dt 達到最小值的函數,而 這個泛函F 則是對全曲率(total curvature)的一 個近似。 一 般 來 說, 我 們 僅 需 考 慮 曲 面 上 的 一 個 點 x(t)2 S(t),其餘的點可以用相同的手法來決定。 同樣地,對於這個點 x(t) = (x(t), y(t), z(t))>, 我們僅需考慮x(t)x 軸上的投影 x(t) 即可,在 另外兩個軸上的投影y(t)z(t) 可以用相同的手 法來決定。接下來,我們回顧三次樣條插值函數是 如何建構的[1]。 三次樣條插值是根據一些給定的點(tj, x(tj)), 其 中,j = 0, . . . , n, 構 造 平 滑 函 數x(t)的 經 典 方法[1]。它是由n段三次多項式拼接而成。也就 是 說, 當t 落 在 區 間 [tj, tj+1] 時,x(t) = xj(t) 是定義在區間[tj, tj+1] 的三次的多項式,其中, j = 0, . . . , n 1。由於函數x 會通過點 (tj, x(tj)) ,其中,j = 0, . . . , n,也就是說,每一段三次多 項式xj 會滿足 (i)xj(tj) = x(tj),其中 j = 0, . . . , n。根據函數 x 連續的假設,三次多 項式xj 會滿足 (ii)xj(tj+1) = xj+1(tj+1) 其中,j = 0, . . . , n 2。 另外,根據函數平滑的假設,x 的一次導數是連 續的。也就是說,三次多項式 xj 會滿足 (iii)x0 j(tj+1) = x0j+1(tj+1) 其中,j = 0, . . . , n 2。 同樣地,根據函數平滑的假設,x的二次導數 也是連續的。也就是說,三次多項式 xj 會滿足 (iv)x00 j(tj+1) = x00j+1(tj+1) 其中,j = 0, . . . , n 2。 由於每個三次多項式都需要四個條件才能完全 確定曲線的形狀,而我們總共有 n 個三次多項 句話說,將圓盤fD 'a(Sa) 與 'b(Sb) 重疊在一 起,臉部的特徵點(圖 10 中的紅點)將會約略重 合。有了兩個單位圓盤之間的對應函數fD,兩離散 曲面SaSb 之間的對應函數 f = 'b1 fD 'a 可透過保角映射的可逆性質得到。有了兩個離散曲 面的對應關係,我們可以透過以下步驟,將兩個離 散曲面的網格結構統一: 1. 在單位圓盤上統一取點,並建構網格; 2. 將這些點透過保角映射的逆映射,映回空間中 的離散曲面。 對應函數的作用在於讓統一後的網格能夠保持特 徵點的對應。因此,透過統一後的網格,我們可以 做到臉部表情合成的特效。接著,我們將介紹樣條 插值(spline interpolation)的計算,以及如何透 過樣條插值來描述表情的連續變化,將不同的臉部 表情串接在一起,就可以製作成動畫,進而發展相 關的應用。 表情變化的描述─樣條插值 人們的肢體動作是一個連續且大致平滑的過程, 臉部表情的變化亦是如此。因此,用平滑函數來 描述臉部表情的變化是很自然的想法。我們不妨 將臉部的曲面看成一個定義在時間區段[0, T ] 的函 數 S(t)。如圖 11 所示,透過 3D 照相機,我們拍 攝到一系列的曲面 S0,St1, . . . ,Stn 1,ST,也就是 說,當時間 t = 0 時,S(0) = S0,當 t = tk 時, S(tk) =Stk,其中,k = 1, . . . , n 1,當 t = T 時,S(T ) = ST。在其餘的時間t,則用平滑函數 圖11 利用樣條插值法來做表情變換(形變)的示意圖。

(8)

9 x00j(t) = 2cj+ 6dj(t tj) 其中,j = 0, . . . , n 1。根據條件(iv)以及9, 對於j = 0, . . . , n 1,我們得到等式 10 dj = 1 3hj (cj+1 cj) 對於j = 0, . . . , n 1,將式(10)代入式(6), 我們得到等式 aj+1= aj+ bjhj + 1 3(2cj + cj+1)h 2 j 也就是說, 11 bj = 1 hj (aj+1 aj) 1 3(2cj + cj+1)h 2 j 另一方面,對於j = 0, . . . , n 1,將10代入8 , 我們得到等式 12 bj+1= bj+ (cj + cj+1)hj 將12中的足碼減去1,即 13 bj = bj 1+ (cj 1+ cj)hj 1 其中,j = 1, . . . , n。最後,13 中的 bjbj 1 都以關係式11代入,我們得到線性方程組 14 hj 1cj 1+ 2(hj 1+ hj)cj+ hjcj+1 = h3 j(aj+1 aj) 3 hj 1(aj aj 1) 其 中,j = 1, . . . , n 1。 從 5 中, 我 們 知 道 aj = x(tj) 為已知的數值,且 hj = tj+1 tj 也是 已知的,因此,只要能決定係數 cj,三次多項式 xj 的形狀就完全確定了。而係數 cj 可以透過求解 線性方程組 14來得到。為了計算上的方便,我們 把 14 寫成矩陣的形式 Ac = b,其中,A 是一個 (n + 1)⇥ (n + 1) 的矩陣,見下頁圖 12。 這 裡 的 矩 陣 A為 嚴 格 對 角 優 勢(strictly diagonally dominant),即矩陣每一列的對角項之 絕對值大於同一列其他項的絕對值總和。這能夠 保證線性方程組 14 有唯一的解 [1]。因此,對於 j = 0, . . . , n 1,三次多項式 xj 都被唯一決定, 而三次樣條插值函數x 也就隨之被唯一決定了。 式。 因此,需要 4n 個條件來決定。以上 (i)-(iv) 四點,一共有 4n 2 個條件,因此,我們還需要 額外的兩個條件。我們不妨假設初始與結尾的加速 度為零。也就是說, (v)x00(t0) = x00(tn) = 0。 如此一來,這 n 個三次多項式就能被唯一地決 定。滿足以上(i)-(v)的三次樣條函數,稱為自

然三次樣條(natural cubic spline)。接下來,我 們介紹如何計算自然三次樣條插值函數。 自然三次樣條插值的計算 我們不妨把三次多項式 xj 寫成 4 xj(t) = aj+ bj(t tj) + cj(t tj)2 +dj(t tj)3 ajbjcjdj 是未知的係數,j = 0, . . . , n 1。 以下,我們利用上述的條件(i)-(v)來求解這些 未知的係數。 首先,將 t = tj 代入 4 。根據條件(i),我們 得到等式 5 x(tj) = xj(tj) = aj 為了方便起見,我們定義 hj = tj+1 tj。根據 條件(ii),考慮 j + 1 時,我們得到等式 6 aj+1 = xj+1(tj+1) = xj(tj+1) = aj + bjhj+ cjh2j + djh3j 其 中, j = 0, . . . , n 1。 另 一 方 面, 對 於 j = 0, . . . , n 1,我們考慮xj(t) 的一次導數 7 x0j(t) = bj+ 2cj(t tj) + 3dj(t tj)2 根據條件 (iii)以及 7 ,我們得到等式 8 bj+1= bj + 2cjhj + 3djhj 其 中, j = 0, . . . , n 1。 同 樣 地, 對 於 j = 0, . . . , n 1,我們考慮xj(t) 的二次導數

(9)

在失真不大的前提下,有效壓縮3D 影像的幾何資 訊是很值得思索的問題。以下,我們提供一個透過 對應函數與樣條插值,以達到臉部幾何資訊壓縮的 想法與演示。 透過3D 掃描儀 GV3 所拍出的 3D 影片每秒鐘 有30 幀 3D 照片,而每張 3D 照片約占 30Mb 的 應用到 3D 動畫 在處理了離散曲面的網格之後,對於網格上的每 的一個點,我們都計算它的樣條插值函數,即可平 滑地還原3D 照片之間的動作。以還原兩張照片之 間的動作為例,假設在時間 t = 0 時的表情為曲面 Sa,在時間 t = 1 時的表情為曲面 Sb。對於時間 t 介於(0, 1) 區間,我們構造曲面 St= (1 t)Sa+ tSb 其相關的應用如三維幾何形變、3D 影片壓縮、 3D 數位驅動,以下我們依序介紹。 底下我們將呈現幾個兩張3D 照片之間的幾何形 變特效。右邊圖中,最左方的人臉以及最右方的人 臉為真實拍攝的照片,而中間的幾張人臉為透過樣 條插值所生成的影像。圖13 與圖 14 呈現幾何與材 質的形變,圖13 為不同表情之間的變換,圖 14 則 是不同人之間的變臉,先由一位女孩的臉變成男孩 的臉,再繼續變成另一位女孩的臉。圖15 為德國 物理學家普朗克 (Max Planck)臉部與獅頭的幾 何形變。圖16 則呈現女孩的臉變成獅頭的幾何形 變(材質不改變)。 隨著高解析度的影片漸漸普及,影片壓縮的技術 也隨之受到重視。3D 影像資料更是需要龐大的硬 體儲存空間。以電影《阿凡達》為例,一分鐘長的 片段原始資料需佔用17.28GB 的儲存空間。如何 圖13 幾何與材質形變(表情變換)。 圖14 幾何與材質形變(變臉)。先從一個女生形變到男生,再 形變到另一個女生。 圖15 幾何形變。普朗克的臉變成獅子的臉。 圖16 幾何形變。女孩的臉變成獅子的臉。 圖12

(10)

與3D 遊戲的製作。在這個技術中相 當關鍵的是對應函數,有了演員與數 位角色之間的對應關係,在演員動作 時,才能讓數位角色在正確的部位做 出對應的動作。底下,我們透過本文 所介紹的對應函數,將一個咀嚼口香 糖的3D 影片,其咀嚼動作轉移到另 一張3D 照片上。 首 先, 我 們 將 給 定 的 影 片 看 成 一 個 影 像 序 列, 記 為 Mj, 其 中, j = 1, . . . , n。將要驅動的3D 照片記 為 N 。接著,計算 M1 與 N 之間 的對應函數,並統一網格結構。透過 每兩張3D 影像 MjMj+1 網格點座標間的差 異,得到向量場vj,其中 j = 1, . . . , n 1。最後, 將向量場的長寬高比例調整後,施加在照片N 的 網格點上,即可將之驅動。 圖 19 是一段數位驅動演示的截圖,透過女孩嚼 口香糖的動作,分別驅動一張男孩的照片和一張獅 頭的曲面。請參閱文末延伸閱讀的連結, 觀看完 整的演示影片。除了對應函數之外,向量場的比例 控制也是決定數位驅動是否成功的重要因素之一。 硬碟儲存空間。換句話說,3D 影片的訊息量相當 龐大,僅僅一秒鐘的3D 影片就需要 900Mb 的硬 碟儲存空間。在允許些微失真的情況下,我們可以 運用3D 影像的形變來達到影片壓縮的效果。想法 如圖17 所示,在拍攝 3D 影片時,我們僅需儲存 10% 的 3D 照片,即每秒鐘的 3D 影片僅儲存三幀 3D 照片。當影片播放時,再透過影像形變,將不 足的幀數還原,以達到同樣的視覺效果。此外,雖 然原始資料的網格點非常密集,然而在較為平坦的 部位,譬如臉頰與額頭,其實並不需要這麼多網格 點。如圖18,我們可以將網格簡 化,用很少的點數來儲存每一幀 照片。壓縮後的網格點數少於原 始網格點數的六分之一,因此, 總壓縮率小於1.6%。請參閱文末 延伸閱讀的連結,觀看3D 影片 壓縮的演示。 所謂數位驅動(digital driving 或regargeting)指的是透過拍攝 真實演員的動作,讓數位角色做 出與演員相同動作的手法。這樣 的技術已被廣泛應用於3D 動畫 圖17 3D 影片壓縮構想。真正儲存只有幾幀 3D 圖片,其他在放映時靠形變特效來補 足。 圖18 將平坦部位的網格簡化。 圖 19 數位驅動演示的截圖。

(11)

現今,3D 影像數據已被廣泛應用於 3D 動畫的 製作與3D 列印的建模。然而,對於 3D 影像的編 輯與後製,目前尚無法像編輯2D 影像般自如。雖 然3D 照相機與 3D 顯像設備等硬體尚未成熟是主 要原因之一,但如何發展相關的軟體與應用,也是 值得盡早思考的問題。 畢竟科技的發展日新月異,一旦相關的硬體成熟 了,勢必會淘汰許多設備、取代許多技術。唯有不 斷創新,才能走在時代的最前端。期盼在不久的將 來,保角映射的技術能夠應用於3D 照相機等相關 的科技產品。這將是數學與工程應用的完美結合, 是推動尖端科技進步的一大助力。 本 文 參 考 資 料 請 見〈 數 理 人 文 資 料 網 頁 〉http://yaucenter.nctu.edu.tw/ periodical.php 延伸閱讀 ▼本文提到的兩處動畫演示,請見 http://yaucenter.nctu.edu.tw/journal/201507/ch1/main.php 結語 黎曼保角映射是3D 影像處理的核心工具之一, 它將空間中的曲面攤平成平面的影像,簡化了曲面 的對應問題,減少所需的運算量,提高了3D 影像 處理的效率。本文提供了3D 影片壓縮與 3D 數位 驅動應用的初步想法與演示,其中許多細節尚有很 大的改善空間。 好比說,對應函數的特徵點目前是以手動選取, 若能結合當今平面影像的特徵追蹤技術,從攤平的 平面影像來鎖定特徵點的位置,再透過黎曼保角映 射的逆映射來得到曲面上的三維點座標,即可實現 3D 影像特徵點的自動追蹤。 此外,在3D 數位驅動的演示中,向量場的比例 控制是很粗略的。若要達到足以擬真的程度,需要 對向量場做細膩的局部微調。因此,若要發展成實 用的產品,勢必得投入更多的時間與人力。 3D 幾何剪影 利用一維形式所建構之曲面圖形。 (作者:丘成桐、顧險峰)

數據

表 1 計算黎曼保角映射所需的時間 。 (Laptop: Intel Core-i7 2.9GHz with 12GB ram)

參考文獻

相關文件

表 6.3.2 為不同電壓下,驅動整個系統運作所需電流。圖 6.3.2 為 測試情形。其中紅燈代表正常工作。結果證明只要太陽能板能夠提供

如圖,將一張長方形紙張,對摺再對摺,然後剪下一長為 3 公分、寬為 2 公分的長方形,則剪 下的部分展開後的圖形為. 形,且其周長為

„ 移動滑鼠游標到縮圖上, 移動滑鼠游標到縮圖上, ACDSee會自動顯示放大 ACDSee 會自動顯示放大 的縮圖

一個運動場由長方形 PQRS 及兩個半圓組成,如下圖。若長方形 PQRS 的長度 PQ 為 100 m,運動場的周界為 400 m。求長方形 PQRS

扇形紙片的張數 扇形紙片的角度 一張扇形紙片是一個 圓的幾分之幾. (扇形紙片的角度)

將某位學生的座位調整到教室後方,但是該班導師未在第一時間通知家長與家

動畫設計師常需利用電腦來繪製 3D 圖形,當他覺得螢幕上所呈現的影... 大部分的組織及個人都必須經由

Motion 動畫的頭尾影格中只能有一個 Symbol 或是群組物件、文字物件;換 言之,任一動畫須獨佔一個圖層。.. Motion