國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第一章 緒論
在這資訊爆炸、網際網路頻寬與速度相繼提昇與蓬勃發展的通信產業年代,結合網 路科技所衍生的網路相簿因應而誕生,同時已儼然成為相片存取的一個空間選擇;在網 路相簿興起的年代,無名小站於 1999 年由一群台灣新竹交大的學生利用當時校內頻寬 架設 BBS 站所創立,在 2003 年更推出網路相簿、網誌、留言板等功能,但由於 Yahoo 收購 Flickr,使得無名小站於 2013 年 12 月 26 日關站;而 Flickr 網站則於 2004 年發表,
以提供免費的網路相簿而漸漸成為主流。社會網路分析(Social Network Analysis;SNA)
是一種研究社會的具體方式及社會結構關係的新觀點,同時也能表現人類關係特徵突出 表現的形式,它可用於分析社會網路的現象,如組織架構、社會關係甚至於國際關係等。
本研究是以社會網路分析為主,並以 Flickr Tags 資料為基礎,希望能透過社會網路分析 的方法延伸於此架構下的應用探討各項指標於此架構下的意義,進而得到更能符合此架 構的網路模型。
1.1 研究背景
日常生活中能夠短期記憶容量相當有限,大量複雜的資訊不斷增加,導致無法有效 的回顧舊有記憶,所以對於過往重要的人、事、物,往往只能用文字或相片來保存這些 記憶。而現今雖然透過網路可取得大量資訊來了解各城市文化,但是要從簡單的 Tag 了 解到攝影者所代表相片的真正含意其實並不容易,而往往真正能深切感動人心,卻常常 只是一張泛黃的舊相片所帶來的回憶。
在 Web 2.0 架構中強調共享及參與精神所產生的個人化(Personalization)內容服務,
越來越多使用者利用 Flickr 網路相簿搜尋、分享及保存相。O’Reilly (2005)提出 Web 2.0 一詞,即指出「Web 作為帄台」的特徵,其特色為「互動」與「分享」,而所強調的
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
是「雙向互動」而非「單向傳播」、「用戶分享」而非「獨斷」、「集體智慧」而非「單一 智慧」,進而產生創新的服務模式與價值鏈。Web 2.0 看作一種用戶體驗、資源分享、集 體智慧、帄台開放、輕量級用戶介面與經營模式的新態度與新思維。Web 2.0 非指某特 定網路技術,而是泛指多種網路軟體開發與應用,演變至今係以使用者參與互動為主要 的概念。O’Reilly et al.(2005)認為 Web 2.0 係以網路作為帄台(Network as Platform),
涵蓋所有相連的裝置,善用該帄台本身的優勢,持續以更新服務的方式在帄台上推出軟 體。從 Web 2.0 所指涉的多樣性可知,欲達成一致定義並非簡易單純之事,但正因其意 涵廣泛與多采多姿的應用,使得無論是企業或政府、群體或個人、組織活動或非組織活 動,均可從其中找到連結點,在實務應用或理論探討上也顯出其多面向性。
目前這類網路相簿分享網站提供使用者標記功能,讓使用者為個人所保存之相片自 由定義 Tag 功能。透過這些 Tag 使用者得以進行關鍵字搜尋;也能間接串連相片相關線 索,進而增加城市與城市間互動性。因此本研究以 Flickr 網路相簿網站中具有指標性城 市為對象,嘗詴分析 Flickr 網路相簿所分享網站使用者之相片 Tag 特性及分享行為。
1.2 研究動機與目的
由於智慧型手機(Smart phone)和行動裝置(Tablet Computer 及 NB 等)應用的快 速發展,使得相片的資料量急遽成長,使用者在出外旅遊所拍攝相片,不再像以前一樣 利用底片沖洗出來保存,因為使用者是將自己喜歡相片透過網路相簿(如 Flickr、Picasa 網路相簿、Pixnet 痞客邦、Xuite 相簿、無名小站相簿等)來分享他們的生活點滴。而多 數人更是喜歡到 Facebook 或者是在部落格(Blog)撰寫文章來介紹自己旅遊的心得。
Flickr 網路相簿除了可以分享與家人、朋友、風景照以及生活照等等互動外,這個服務 有一個重要方面是使用者可以手動標註自己的相片,本文是利用 Flickr 線上相片服務允 許使用者利用 Flickr API 方式的收集 Tag 來觀察相片本身的意義的網站,也就是使用所 謂的標籤(Tag)與敘述(Annotation)來輔助使用者進行註記主要描述相片的內容之外,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
以及提供額外的前、後張相片語義資訊。但要從寫一個圖文並茂的部落格中取得 Tag 其 實並不容易,必頇要花許多時間進行資料蒐集、斷詞分析及語義分析等;因此本文將選 擇具有顯著的 Tag,運用 Flickr 相簿資料庫分析進行研究與實驗。
在本文中,除了探討如何能利用這些 Tag 來取得每個城市的特色,同時從中挑選 41 個城市的相片作為分析對象。在一般情況下,Flickr 上相片搜索取決於相片的註釋,而 相片相關的關鍵字(或標籤),則往往就可代表其相關訊息,同時亦賦予的一種主觀感 受,遠離客觀描述的形象,以達到本研究的貢獻目的。此外將 Flickr 上 Tags 的數量多寡 作為分析項目,並將 Tag 結果的特性,以及透過權重可分析出使用者如何標記相片和 Tags 中包含哪些資訊。基於這種分析、整理與評估,本文提出一套 Tag 方式,可以利用添加 到「相片處理註記」的方式,來分類使用者在相片 Tag 分類情形。
本研究透過分析城市與城市間的互動情況,從而衡量出城市與城市之間的關係程度,
但是用人工標註大量的「相片處理註記」是很相當耗時的工作;因此為了有效降低誤判 率,利用 My SQL 管理資料庫的處理可讓許多同義字(Synonymous)的 Tag 逐漸被整合,
藉此再配合社會網路分析(Social network analysis;SNA)軟體來提升識別的準確度。
1.3 研究資料
本實驗資料是利用 Flickr 原有 Flickr API 作為分析;首先透過 Flickr 網路相簿申請 一組 Flickr API KEY 來建立本實驗所需資料庫。然後將 41 個城市的 Flickr Tags 建立在 My SQL 資料庫後,經過 Porter 及 Lovins Stemming 詞幹處理後,去除 Flickr 多餘雜訊,
再利用 eBizMBA 提供各種網站的相關資訊與排名,選取 5 個旅遊網站所介紹 41 個城市 的文章合計 205 篇作為重要指標,分析其文章內容以 TF-IDF 處理結果當成權重(Weight),
其目的在於將一些排名較後的顯著標籤能提升排名,運用 41 個區域、4 大洲分群的方式 來了解各洲的文化特色。之後針對 Flickr Tags TOP 10 進行 Porter 及 Lovins Stemming,
同時加入 Weight 解析,最後透過 SNA 軟體,探討 41 個城市變化情形及字詞共現指標
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(Tag Co-Occurrence)來轉換成一個主要的共現字詞作為實驗結果。
1.4 研究貢獻
本文主要觀察 Flickr 的 Tags 內容分析及詞性、詞頻等研究。其主要研究貢獻包括:
研究使用者圖像標記動機,以了解各城市特色為主,並間接產生與其他城市之間的互動,
某幾個城市透過特定 Tags 連結,而得到關連性;在 Tags 詞頻率越高,代表 Degree Centrality 也越高,因此利用字詞共現指標(Tag co-occurrence)來計算與該城市的關聯 性及進行標籤結合,以階層式分類 Tags 方式得到結果;Tags 使用語文以英文為主,將 有助於詞頻歸類統一,顯著的 Tag 依其規則性,使用者 Tagging 人、事、時、地、物也 是最常使用的,而重複的 Tags 經過統計為 night 及 street 兩個之熱門標籤為主,可見攝 影者最常拿出相機拍照的動機是有關夜景及街景。透過 Flickr 網站本身 Popular Tags 經 由分析及匯出標籤雲的結果來與本文之實驗結果相對照 85%的吻合度驗證。
1.5 論文架構
本文架構可分為五章其內容如下:
(一)第一章為緒論簡介研究背景、研究動機與目的、研究資料及其貢獻。
(二)第二章為前人研究、文獻探討與相關技術介紹、從社會網路分析演變到社會 網路分析模型、然後是 Flickr Tag 分析及城市選擇分析,最後則是詞頻分析。
(三)第三章將針對本研究的流程,從架構介紹進一步處理資料的步驟,探討研究 工具及資料庫建置內容,TF-IDF 加權結果分析。
(四)第四章為實驗結果與評估,從 Flickr 實驗資料,挑選關鍵相片分析,以區域 分群的方式來觀察各洲的變化情形,同時結合時事去探討排名的變化,接著 是字詞貢獻實驗分析,將相關性質 Tag 整理出合併字詞關連,最後實驗總結。
(五)第五章為結論與未來研究方向,主要探討結論、研究限制及未來方向。