第三章 研究方法
第三節 研究設計
3.3.2 建立圖像資料庫
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 35 -
3.3.2 建立圖像資料庫
從前期測試中比較圖 3-16 與圖 3-17 後發現:
「如果有一個能夠在拍完照片之後具有協助註記的應用程式,將會提升使用 者註記標籤的意願。並且智慧型手機結合網路與社群的應用程式也會提高使用者 將照片上傳到社群網站上的頻率」。
因此本研究撰寫了一套能夠具有自動註記、半自動協助註記、自訂內容以及 社群共享註記標籤的系統,用來驗證前期測試的發現,以及解決照片檔案註記不 便的問題。
a.實驗設備與平台
在本研究的實驗架構裡,必須撰寫兩套程式,一個是提供使用者拍照與上傳 照片及加註標籤的手機應用程式,另一個是接收來自使用者上傳的照片以及負責 分析與分類標籤的伺服器程式。
在智慧型手機的部分:由於智慧型手機的普及率越來越高,加上智慧型手機 內建了許多的感應器,於是本研究的實驗是藉由智慧型手機內建的 GPS 晶片、
數位指南針以及重力感應器來協助在拍照的同時就會加入地理位置資訊(GPS) 、 照相角度、照相方位…等資訊於 MPEG-7 檔案的標籤內容之中。
在伺服器的部分:本研究是以 PHP 做為撰寫伺服器端程式的語言,以及 Apache Web Server 做為網頁伺服器;PHP 是一套免費、可內嵌於 HTML 的網頁 程式語言,以及對於其他程式語言的 API 的支援相當完整…等優點。於是使用 XML 為基礎的 MPEG-7 檔案能夠透過 PHP 的 XML API 加以開發相關的應用,
並且 Facebook 官方也提供了支援 PHP 的 API 供開發者使用。本系統開發工具項
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 36 -
目如表 3-1 所示。
表 3-1 系統開發工具
Develop Kit Verson
Mobile
Java JDK 1.6
Android SDK API 10
Server
Apache 2.2.8
PHP 5.2.6
MySQL 5.0.51b
Operating system Microsoft Windows 7
以下就「手機端應用程式」與「檔案伺服器」的開發過程作詳細的介紹:
1) 手機端應用程式:
本研究開發的手機端應用程式,與使用數位相機拍攝照片的經驗相同,
在拍攝照片按下快門之前會開啟的相機預覽畫面讓使用者看到相片的取景 結果。
感應器資訊
當拍攝照片的功能被啟動時,手機的 GPS、數位指南針以及重力感應器 已經被啟動,所以在預覽視窗上就已經顯示目前手機在空間中的數值(如圖 3-18 所示),包含面對哪個方向、地理資訊位置以及相機的傾斜角度等數值。
在按下快門拍攝照片的同時,手機的儲存空間內了產生照片檔案也一併產生 了一個 MPEG-7 檔案,並且將 GPS、數位指南針以及重力感應器所讀取到的 資訊自動寫入到 MPEG-7 檔案的標籤內。
照片標題與心情標籤
在按下快門之後,除了感應器的資訊已經自動寫入到 MPEG-7 檔案之 外,還能夠自由寫下文字內容到照片標題裡,以及拍攝照片時的心情。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 37 -
在本研究的心情標籤內容項目的制定,首先藉由心理學研究之六種人類 基本情緒:快樂、驚訝、害怕、悲傷、生氣、和厭惡(Ekman,1992;Ekman
& Friesen,1986)為開端。由於上述六種基本情緒能夠藉由臉部的表情而被 發現,並且透過臉部表情的情緒傳達是全世界共通的(Ekman,1994)。於是 再藉由 Line 即時通訊軟體內建的表情圖片所傳達的情緒訊息,加以定義成 為本研究的心情文字標籤;而情緒的發生也常與行為動機相連結(李茂興&
陳夢怡譯,2000),於是本研究的心情標籤再定義了兩個與動機有關的標籤:
飢餓、口渴。
綜合以上所述,本研究的心情標籤包含了"開心"、 "快樂"、 "大笑"、 "
驚喜"、"驚訝"、"驚嚇"、 "雀躍"、 "喜悅"、 "期待"、"難過"、 "悲傷"、 "
生氣"、 "失落"、 "流淚"、 "擔心"、 "害怕"、 "無奈"、 "沉重"、 "感動"、
"緊張"、"飢餓"、"口渴"、 "滿足"、"溫暖"、"甜蜜"等系統建議的標籤項目,
寫入拍攝時的心情是使用下拉式選單,其心情選單如圖 3-21 所示。當使用 者按下了儲存按鈕之後(如圖 3-20),程式會將照片標題內使用者輸入的文字 以及被使用者點選的心情選項一併加入到 MPEG-7 的標籤之中。
查看拍攝後的照片
而使用者拍攝後的照片,都會儲存在手機記憶空間,由程式所建立的一 個特定的資料夾內,當使用者想要查看所有拍攝過的照片時,手機會以具有 捲動顯示照片縮圖列表的方式呈現(如圖 3-22)。而使用者點選了縮圖列表中 某一張想要觀看的照片時,會以全螢幕的方式顯示該張照片(如圖 3-23)。
如圖 3-24 所示,使用者在觀看照片時觸碰螢幕中任何一個位置時,會開
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 38 -
啟照片的功能選單。在功能選單內點選了「照片資訊」時,會在畫面中疊上 另一個視窗用以顯示該照片的經緯度地理資訊、拍攝方向與拍攝時的角度(如 圖 3-25)。
檔案傳輸
在照片分享與上傳的部分,如果使用者在照片的功能選單點選了「上傳 到 Server」時會出現上傳與取消的按鍵(如圖 3-26),按下「上傳」則會把照 片與所屬的 MPEG-7 檔案都一併上傳到本研究的伺服器當中;如果是使用者 在照片的功能選單點選了「上傳到 FB」時會在頁面的上方出現 Facebook 使 用者的登入狀態,並且能夠為這張照片寫下一段文字做為照片的標題(如圖 3-27)。在上傳到 Facebook 社群網站之後,使用者自行輸入的照片標題文字 也會一併出現在 Facebook 社群網站的照片標題之中,而這段照片標題文字 同時也會寫入到 MPEG-7 檔案裡。讓使用者在 Facebook 上的朋友可以為這 張照片加以註記標籤以及對照片寫下回覆訊息(Comment)來達到群眾註記的 功能。
圖 3-18 相機拍攝預覽 圖 3-19 預覽照片產生中
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 39 -
圖 3-20 儲存照片(照片標題) 圖 3-21 儲存照片(拍照心情)
圖 3-22 照片列表 圖 3-23 照片展示
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 40 -
圖 3-24 照片功能選項 圖 3-25 照片資訊
圖 3-26 上傳到 Server 圖 3-27 上傳到 Facebook
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 41 -
2) 檔案伺服器:
在本研究的系統架構中,必須要有可以用來提供使用者上傳與搜尋照片 檔案的伺服器。如圖 3-28 所示,上傳後的照片與 MPEG-7 檔案,會先存放 在伺服器中一個特定的資料夾裡。
而在使用 Facebook 社群網站相簿的經驗時發現,照片被加註標籤(Tag) 的次數與照片的留言(Comment)次數相差甚多。也就是說照片被其他使用者 看到而留言的次數會比被加上了標籤的次數還多。於是本研究的系統除了照 片會記錄照片上的 Tag 之外,對於使用者在照片寫下留言的文字也會被記錄 下來成為搜尋條件。
於是伺服器除了提供使用者上傳檔案的功能之外,本身還必須比對 MPEG-7 檔案,藉此了解有哪些照片是使用者曾透過本研究所開發的手機軟 體上傳到 Facebook 社群網站的檔案。由於上傳到 Facebook 社群網站時,每 一張照片都會有專屬的 id 編號,經由 id 的比對之後,再加以抓取該照片在 Facebook 上所有被加註了標籤(Tag)與留言(Comment)內容,並寫入到本研究 伺服器中該照片所對應的 MPEG-7 檔案之中,如此便可以取得透過社群網站 群眾註記的方法。
為了增加搜尋的效率,於是本研究伺服器端的程式會依日期、拍照者、
心情、天氣、地點照片的分類歸檔。而本研究的搜尋功能以手機介面為主,
所以不提供伺服器端的查詢頁面(如圖 3-29)給予使用者使用。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 42 -
圖 3-28 檔案伺服器存放照片與 MPEG-7 檔案
圖 3-29 透過網頁查詢檔案伺服器所存放的照片
‧
<?xml version="1.0" encoding="UTF-8"?>
<Mpeg7 xmlns="http://www.mpeg7.org/2001/MPEG-7_Schema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:mpeg7="urn:mpeg:mpeg7:schema:2001"
xsi:schemaLocation="urn:mpeg:mpeg7:schema:2001 Mpeg7-2001.xsd">
<Image>
<Creator>
<CreatorID>1554047611</CreatorID>
<Name>Po-Yu Cheng</Name>
</Creator>
<Photo>
<PhotoID>
<Orientation>
167.0
‧
本研究的 MPEG-7 檔案的標籤共分為「Creator」、「Photo」與「Facebook」
三大區塊,其標籤的定義如表 3-2。
表 3-2 本研究 MPEG-7 標籤定義
標籤名稱 標籤定義
<Creator>:檔案建立者。裡面包含了< CreatorID >與<Name>標籤。
< CreatorID >
<Name>
檔案建立者的 id,以 Facebook 的使用者 id 做為此標籤的內容。
檔案建立者的名字,以 Facebook 的使用者名字做為此標籤的內 容。
<Photo>:描述照片內容的標籤。裡面包含了<PhotoID>、<Title>、<CreationTime>、<Location>、
<Orientation>、<Angle>、<Mood>、<Weather>、<MediaLocator>…等標籤。
<PhotoID>
<Title>
<CreationTime>
照片的 ID,使用 UNIX 時間戳記所製作的維一值。
照片標題,使用者拍完照自行寫入的照片標題。
照片的拍照時間。
<Location> 拍攝地點的地理資訊,裡面包含了<Latitude>與<Longitude>兩 個代表經度與緯度的標籤。
<Orientation> 照片拍攝時所面對的方向。
<Angle> 照片拍攝時的角度。
<MediaUri>/mnt/sdcard/PhotoMe/PhotoMe_2012-10-03_12.05.45.jpg</Me diaUri>
</MediaLocator>
</Photo>
<Facebook>
<Fid>3750822899828</Fid>
<Ftitle>以前他很遠,沒事就想來。現在他很近,一直都沒去。</Ftitle>
</Image>
</Mpeg7>
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
- 45 - 表當時心情的標籤。
<Weather> 拍攝照片時的天氣情形,由系統自行透過天氣 API 得到的資訊。
<MediaLocator> 照片檔案的存放位置。
< Facebook >:照片上傳到 Facebook 社群網站上的相關資訊。裡面包含了< Fid >、< Ftitle >、
< TagName >與< Comment >…等標籤。
< Fid > 照片上傳到 Facebook 上的照片 id
< Ftitle > 照片上傳到 Facebook 上使用者所寫下的照片標題。
< TagName > 照片上傳到 Facebook 上所被標註的 Tag 資訊。
< Comment > 照片上傳到 Facebook 上所被寫下的留言資訊。
b.實驗程序
本研究旨在建立一套能夠隨時透過智慧型手機紀錄個人生活的個人圖像檢 索資料庫,於是在開發的過程當中已經不斷地累積相片與 MPEG-7 檔案,並且 在沒有告知好友正在進行實驗階段的情形之下,上傳本研究的照片到 Facebook 社群網站的個人相簿之中。
由於本研究的照相程式透過 Google 的網路定位與 GPS 衛星定位兩種方式 來取得拍照的地理位置資訊,所以使用本研究的照相程式時要開啟網路與 GPS 定位功能,如此無論是在室內或是室外拍攝照片,都能夠偵測到地理位置的資訊,
促使數據的取得更為完整。而本研究的照相軟體拍照之後可以自行選擇是否將照 片分享於 Facebook 社群網站上,但由於本研究具有探討群眾註記的部分,於是 須上傳本實驗之照相軟體所拍攝的照片到 Facebook 社群網站上,提供社群好友
促使數據的取得更為完整。而本研究的照相軟體拍照之後可以自行選擇是否將照 片分享於 Facebook 社群網站上,但由於本研究具有探討群眾註記的部分,於是 須上傳本實驗之照相軟體所拍攝的照片到 Facebook 社群網站上,提供社群好友