• 沒有找到結果。

第四章 實驗結果與評估

4.3 字詞共現實驗分析

4.3.2 Flickr 所有城市字詞共現分析

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4.3 字詞共現實驗分析

透過實驗以 Social Network Analysis(SNA)的 Gephi 軟體,將所有城市以 SNA 運 用字詞共現指標標註相關的 Tags 做為分析各洲的變化,並依照 Porter Stemming(weight)、 Lovins Stemming(weight)做比較,實現將各洲城市的所有 TAG 連結及探討分析。

4.3.1 建立無向共現網路

針對字詞建立網路建立網路是以無向性的共現網路(undirected co-occurrence network)來分析結果;由於 Tag 本身並無方向性,不像一段文章有前後順序,因此針 對 Flickr Tags 用於此方式時,建立網路取樣的 Tags 進行篩選條件的分析,觀察對於不 同的篩選條件下,所建立的無向性的共現網路與下一節所討論字詞共現指標是否在準 確度上所相關。

4.3.2 Flickr 所有城市字詞共現分析

本文在 2.5.2 章節提到字詞共現指標(Tag co-occurrence)的概念,利用此種方式將 關連的 Tag 做為合併後,更容易了解 41 個城市的輪廓,觀察 2.3.4 章節 Flickr Tag Clusters 分析中 Flickr 分析使用者聯想到的 Tags 與照片的關連性去合併,其中共分為 25 項,分 析每個城市前 100 個 Tag 分類,最後將這些字詞共現的 Tag 做為分類;以下是歸類的整 理(如表 4.4 所有城市各字詞共現的 Tag 與包含合併字詞分析)。

communist 、 conventions 、 democracy、ethnic、event、editorial、

parliament 、 nationalism 、 surreal 、 empire、president、terrorism…

stripe grafitti 、 history 、 museum 、 statue 、 street 、 movie 、 mural 、 museum、statue、music、artwork、

ballet 、 barbie 、 creative 、 exotic 、 band、gallery、texture、theater、style、

favorite 、 tattoo 、 opera 、 stencil 、 modern、poetry、spotted、broadway、

popular、steel、drum、post、spray、

spraypaint 、 School teaching 、 cloudgate、samba… admiralty 、 action 、 adventure 、 accessorize 、 aerial 、 aggressive 、 bomb 、 mobile 、 model 、 fleet 、

market、pond、pool、bank、land、waterscape、red light district、factory、little india、venice、valley、field、great wall 、 champselysees 、 chaophraya 、 reservoir 、 cobblestones、everglades…

costume

cosplay、crossdress、decorat、dress、

shoe 、 mirror 、 boots 、 makeup 、 diamant 、 clothes 、 rouge 、 furry 、 manicured 、 retouch 、 kimono 、 package…

architecture

bridge、church、garden、monument、museum、palace、

park、skyscraper、square、baroque、gothic、pyramid、

brick、fountain、forbidden city、hall、observation deck、

ferris wheel 、 summerpalace 、 university 、 office 、 watercube、tiananmen square、great wall、structure、

aquarium、memorial、fernsehturm

sea

bay 、 beach 、 boat 、 dock 、 ford 、 harbour、island、mariner、seashore、

bund、coast、ferry、sand、crew、

shore、 port、 coastal、 marinelife、

fischmarkt、fishnet、intertidal…

world heritage 、 expo 、 midtown 、 rathaus、suburb、cityscape、planet、

lens 、 perspective 、 shot 、 planar 、 professional 、 shadow、 reflection 、 reflexion 、 retrato 、 retro 、 line abstract、illumination、silhouette…

plants

blossom、flower、fleur、forest、grass、leaf、petal、tree、

wood、orchid、peachtree、tulip、botanical garden、apple、

rose、 australis 、 palm trees 、 palmengarten 、 bloom、

waterlily、coral、coconut grove、vase、stamen、orchard、

hanami…

color blue、brown、gold、gray、green、

nature、orange、pink、red、yellow、 religion buddha、catholism、christian、christmas、church、hindu、

islam、mosque、monk、monster、saints、shrine、temple、

admiralty 、 action 、 adventure 、 accessorize 、 aerial 、 aggressive 、 bomb 、 mobile 、 model 、 fleet 、

poor、bank、red light district、factory、little india、venice、

field、great wall、champselysees、reservoir、cobblestone、

Mid-autumn festival 、 birthday、 festivity 、 firework 、 santa 、 parade 、 parc 、 salone 、 olympics 、 bazaar 、 International Flower Expo、greeting card、daily…

food

dessert 、 delicious 、 cafe 、 cake 、 cocacola 、 grain 、 sweet 、 lamb 、

athletes、hiking、sit、slide、corner、river side bikeway、

jeremy villasis、lifeguard、skate…

travel

其中 landscape、people、emotion、art、traffic、street 及 travel 等具有較高的字詞共 現度,因此聚集的範圍越大代表了每個城市 100 個 Tag 中使用者較容易下的 Tags 類型,

透過實驗數據結果了解世界照片的輪廓,而字詞共現本身也具有關連性;例如:Travel 與 Weather 就是息息相關,天氣好壞攸關旅行的照片數量,當好天氣時,所拍的照片數 量,一定比陰雨天來的多;另外像是街景藝術及建築藝術是經常被聽到,因此將這些 architecture、street 與 art 標示相關聯性,此外就 art、emotion、landscape 及 people 合併 字詞也是相當多,可見 Flickr Tag 是相當多元,當合併字詞後其圓圈中的 Tag 也因為合 併後有所增減,另外利用 NodeXL 計算出 emotion、people 及 art 中 Degree 依序各為 163、

111 及 112 數量,在 Betweenness Centrality 的部份計算出 95462、58898 及 58397 結果,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

藉此即可分析出所有城市的輪廓(如圖 4.21 所有城市字詞共現)。

圖 4.21 所有城市字詞共現

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

透過本文 2.5.2 字詞共現指標中的公式(2.11)可分析出各 Tag 的重要性,以及可 得到分為後之分析結果(如表 4.5 所有城市與 Tag 字詞共現指標分析)。

表 4.5 所有城市與 Tag 字詞共現指標分析

tag tag∩city J(tag,city) tag tag∩city J(tag,city)

animal 29 0.707 people 41 1

architecture 21 0.512 plants 15 0.366

art 40 0.976 religion 8 0.2

beer 12 0.293 street 41 1

color 41 1 sea 15 0.366

costume 5 0.122 scenery 11 0.268

day 9 0.22 travel 41 1

emotion 41 1 traffic 37 0.902

food 17 0.414 view 21 0.512

home 5 0.122 weather 32 0.781 landscape 39 0.951 world 11 0.268 movement 23 0.561 war 21 0.512

例如 animal 交集 41 個 City 後,共交集 29 次,因此字詞共現指標為 0.707,而 travel 交集 41 個 City 後字詞共現指標為 1,運用此方式運算結果如下:

tag∩city={X︱X

tag 且 X

city}交集;

tag∪city={X︱X

tag 或 X

city}聯集;

city tag

city tag

 

city ) J(tag,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4.22 以 travel 及 animal 為例字詞共現指標分析

利用社會網路軟體 Gephi 繪出以 travel 與 amimal 間連結分別為 41 個與 29 個城市 皆有關連,其字詞共現指標就為 0.707(如圖 4.22 以 travel 及 amimal 為例字詞共現指標 分析),另外像是 street 與 landscape 間連結分別為 41 個與 39 個城市關連,因此 street 與 landscape 字詞共現指標為 0.951,數值越高代表其字詞共現度越高。