• 沒有找到結果。

以K-核心分析探索部落格社群之變遷

N/A
N/A
Protected

Academic year: 2021

Share "以K-核心分析探索部落格社群之變遷"

Copied!
15
0
0

加載中.... (立即查看全文)

全文

(1)

以 K-核心分析探索部落格社群之變遷

Applying K-core Analysis to Explore the Changes

in the Blogosphere

盧能彬

長庚大學資訊管理學系助理教授

Neng-Pin Lu

Assistant Professor, Department of Information Management, Chang Gung University (R.O.C.)

E-mail: nplu@mail.cgu.edu.tw

黃士瑋

長庚大學資訊管理學系碩士班研究生

Shih-Wei Huang

Graduate student, Department of Information Management, Chang Gung University (R.O.C.)

E-mail: m9844023@stmail.cgu.edu.tw

李珮琪

長庚大學資訊管理學系碩士班研究生

Pei-Chi Li

Graduate student, Department of Information Management, Chang Gung University (R.O.C.)

E-mail: m9844021@stmail.cgu.edu.tw

關鍵字(Keywords): 部落格(Blog)

;網絡拓撲(Network Topology)

;k-核心分析(k-core

Analysis)

【摘要】

近年來部落格空間成長快速,在人們的數位

生活中愈來愈不可或缺。為了瞭解部落格空間

的社群互動,目前已有許多相關網絡分析的研

究成果發表,不過關於臺灣地區部落格空間的

網絡分析卻仍然缺乏,因此為了探討臺灣地區

部落格空間的社群網絡,本研究從 k-核心分析

著手,以臺灣的「部落格觀察」網站,於 2008

年 10 月 26 日與 2009 年 9 月 6 日的排名資料

為基準,分別選擇排行榜前一百名部落格為研

究樣本。我們先分析這兩個樣本群集的部落格

基本資料,比較它們特性上的差異,然後再蒐

集 2008 年 11 月 1 日與 2009 年 9 月 11 日所

有樣本部落格首頁上的朋友連結名單,據以篩

選 與 繪 製 出 樣 本 部 落 格 之 間 的 朋 友 網 絡 拓

撲。最後,我們利用 k-核心分析比對兩個時點

(2)

的部落格社群變遷。分析結果發現出圖文與資

訊科技兩大主要社群,其中圖文社群呈現出快

速成長的趨勢,至於資訊科技社群則有些許疏

離的現象。再與國外的部落格發展相較,我們

則發現資訊科技社群同樣是熱門的趨勢;但圖

文社群卻是臺灣地區部落格特有的發展。

【Abstract】

In recent years, the blogosphere has been

dramatically blooming and becoming more

and more indispensable in our digital lives.

Nowadays, there have been many published

researches that used network analysis to

investigate the communities in the

blo-gosphere; however, the analysis of Taiwan

blogosphere is still unavailable. Therefore, in

this research, we investigated the social

network of Taiwan blogosphere via k-core

analysis. Based on the rank lists maintained

by the Taiwan website “Blog Look” (look.urs.

tw), we took the top 100 blogs, on 26 October

2008 and 6 September 2009 respectively, as

two clusters of our research sample. First, we

analyzed the basic statistical characteristics

of the two sample clusters, and compared the

differences between them. Then, we

col-lected all the blogrolls of the top 100 blogs on

1 November 2008 and 11 September 2009,

respectively. Then, we sifted and figured out

the network topology from all the blogrolls

within our sampled blogs. Upon the blogroll

network topology, we applied k-core analysis

to explore the changes in the blogosphere.

Via the analysis, we found two major

com-munities of blogs: picture article and

informa-tion technology. And, we found that the

community of picture article was rapidly

ex-panding upwards while the community of

information technology was a little shrinking

downwards. Finally, compared to the

blo-gosphere around the world, we found that the

community of information technology fits the

trend around the world, but the community of

picture article is a special development of

Taiwan blogosphere.

緒論

知名部落格搜尋引擎 Technorati 於 2007 年的「部 落格狀態報告」指出,從 2003 年 3 月到 2007 年 3 月間,每天有 120,000 個部落格誕生,部落格總數 與 2006 年 10 月時相比增加了一倍(Sifry, 2007); 2009 年 10 月 Technorati 的更新報告則發現,部落格 的分佈已橫跨六大洲、六十六個國家以及八十一種 語言,部落格已為現今世界的重要媒體之一(Winn, 2009)。另外,美國市場調查公司 Universal McCann 在 2008 年 3 月公佈的報告「Power to the People – Social Media Tracker Wave 3」中估計,全世界共有 1.84 億個部落格,有 70%的網友每週都會閱讀部落 格,在這篇報告中也提及,臺灣有 70.9%的網友擁 有自己的部落格,比例高居世界第二(Smith, 2008)。

目前在臺灣,許多部落格服務商(Blog Service Provider,以下簡稱 BSP),例如,無名小站(www. wretch.cc)、天空部落(blog.yam.com)、及 Xuite 日 誌(blog.xuite.net)等,都提供了方便的使用者介面 以及相關部落格工具。而除了 BSP 所提供的服務之 外,也有 WordPress(wordpress.org)、Movable Type (www.movabletype.org)、及 F2blog(www.f2blog. com)等這類開放源碼的部落格架站軟體,提供給 不願意被 BSP 限制的專業使用者,根據個人的特殊 需求自行架設部落格網站。不論使用 BSP 的服務或 是運用開放源碼軟體自行架站,部落格使用者除了 透過 RSS(Really Simple Syndication)動態網頁蒐 集工具(Johnson, 2006),訂閱喜愛的部落格,將即 時更新的內容自動彙整之外,並可利用透過部落格 軟體中的朋友連結、文章引用、文章評論等工具, 來表達情感,尋找志同道合的朋友,分享生活上的 各種經驗,進而與其他的部落格串連,形成新興的 線上虛擬社群(Herring et al., 2004; Kumar et al., 2004; Marlow, 2006)。

關於部落格的社群網絡探討,目前已有許多的研 究發表,例如,Herring et al.(2005)分析部落格朋

(3)

友連結(blogroll)所構成的的社群;Ali-Hasan 與 Adamic(2007)探討特定部落格社群內,因朋友連 結、文章評論與引用所產生的社會關係;Chau 與 Xu(2007)則以某個部落格服務網站為研究對象, 擷取各個部落格頁面裡的超連結進行了社會網絡的 中心性分析。然而關於臺灣地區部落格空間的網絡 分析目前卻仍然缺乏。因此為了解臺灣地區部落格 的發展,本研究以「部落格觀察」網站(look.urs.tw) 的排名資料為基準,選取部落格為研究樣本,蒐集 它們之間的朋友連結網絡資料,然後再以社會網絡 分析中的 k-核心分析來探索臺灣地區部落格網絡的 變遷概括樣貌。

研究背景

本節說明本研究的相關背景,包括部落格的介 紹、部落格社群的相關研究、本研究所使用的網絡 圖形定義、以及社會網絡分析方法。

部落格

部落格是 Web 2.0 各種網頁技術的集合體,強調 互動、參與和共用(O’Reilly, 2005),因此它的定義 也眾說紛紜。開發部落格相關 RSS 網頁技術的先進 Dave Winer(2001)認為部落格是「個人出版網絡 社群」,有四個關鍵的特點:個人的(personal)、存 在於網路(on the web)、發佈(published)、社群 (communities)。身為部落格草創時期先鋒的 Rebecca Blood(2002)則簡單地定義部落格是一個線上日誌 (on-line diary),其內容是以反時序方式(reverse chronological order)呈現。至於韋氏字典於 2004 年 十 大 單 字 中 , 則 將 部 落 格 定 義 為 包 含 反 映 (reflections)、回應(comments)及由作者提供超 連結(hyperlinks)的線上個人日誌之網站(Merriam- Webster, 2004)。另外,維基百科(Wikipedia, 2009) 則定義「部落格」(blog)是指網友撰寫於網路空間 上的個人日記,而撰寫部落格的人稱為「部落客」 (blogger),而所有部落格及其相關的網站,則統稱 為「部落格空間」(blogosphere)。 一個部落格的呈現,可分為首頁及文章兩大部份 (Gillmor, 2004)。首頁的部份主要包含:文章彙整 ( archive )、 朋 友 連 結 ( blogroll )、 訂 閱 區

(subscription)、相簿(photo album)、關於我(profile) 等;部落格文章的部份主要包含:內文(content)、 時間戳記(time stamp)與日期標頭(date header)、 永久連結(permanent link)、回應(comment)、引 用(trackback)等。 一個部落格除了一般網頁所包含的文章、圖片、 影音媒體外,還包含各種連結至其他部落格、或網 頁的超連結(hyperlink)所構成。部落格之間的串 連主要可藉由首頁上的朋友連結、文章的回應、與 文章的引用等三個主要功能來達成。因此,在探討 部落格的互動關係時,我們可以蒐集以上三種串連記 錄。雖然部落格的活動以文章為主體,但因其資料量 龐大,不易系統化蒐集與分析它們的回應與引用關 係,因此本研究選擇以部落格首頁上的朋友連結資 料為基礎,初步探索臺灣地區部落格空間的變遷。

部落格社群相關研究

在 眾 多 的 部 落 格 研 究 方 向 中 , Agarwal & Liu (2008)整理出七大議題:部落格空間的模型建立 (modeling blogosphere),部落格的群組分析(blog clustering),部落格的資料探勘(blog mining),部 落格的社群探索與分析(community discovery and factorization),部落格的影響與散播(influence in blogs and propagation),部落格的信任與信譽(trust and reputation),垃圾部落格的過濾(filtering spam blogs)。在眾多的部落格研究中,以下簡要回顧與本 研究相關的部落格社群網絡研究。 首先,Kumar et al.(2004)以某個部落格服務網 站的資料為依據,利用基本統計分析,探索某個部 落格服務網站內社群數目的快速成長;Herring et al. (2005)則以隨機選取的四個部落格出發,跨越單一 部落格服務網站的限制,利用雪球抽樣產生它們的朋 友連結(blogroll)所構成的四度分隔內的部落格網 絡,再以連結的方向性與節點的連出、連入分支度 等社會網絡分析指標探討社群的形成;至於 Marlow (2006)則更使用自動化部落格連結蒐集工具,分 析大範圍的部落格連結結構,並輔以對部份部落格 作者的問卷,探討部落格社群中社會資本的形成。 在 特 定 部 落 格 主 題 方 面 的 研 究 , Ali-Hasan & Adamic(2007)選擇三個特定部落格社群,探討其

(4)

部落格之間因朋友連結、文章評論與引用所產生的 社會關係;Chau & Xu(2007)則以某個部落格服務 網站中仇恨團體的部落格社群為對象,擷取部落格 頁面裡的超連結進行了社會網絡的中心性分析;另 外,Aharony(2009)則以內文分析(content analysis) 探 索 圖 書 館 學 與 資 訊 科 學 相 關 部 落 格 中 標 籤 (tagging)與通俗分類(folksonomy)的使用概況。 除了以上統計分析、內文分析、以及社會網絡分 析外,資料探勘技術也陸續運用到部落格社群網絡 相關研究。例如,Gotz et al.(2009)結合個別部落 格的區域時間樣式(local temporal pattern)與全體 部落格的廣域網絡樣式(global network pattern)建 造一個部落格空間的動態變遷模型;Leskovec et al. (2009)則對部落格的內文進行資料探勘,發掘新 聞與資訊在部落格空間中散播的動態脈絡。 相對於國外許多部落格社群研究的發表,臺灣地 區部落格空間的網絡分析目前仍然相當缺乏。因此 為了解臺灣地區部落格的發展,本研究以社會網絡 分析中的 k-核心分析來探索臺灣地區部落格網絡的 變遷概括樣貌。

社會網絡分析

社會網絡是由節點、關係及連結所組成的一種社 會結構。節點或稱行為者 (通常指的是個人或是組 織)透過各種社會關係(如朋友關係、家庭關係等) 將各個節點連結起來。社會網絡分析則是藉由圖形 理 論 來 抽 象 化 節 點 與 節 點 之 間 連 結 的 社 會 關 係 (Wasserman & Faust, 1994; Otte & Rousseau, 2002; Hanneman & Riddle, 2005; de Nooy et al., 2005)。

在 圖 形 理 論 中 , 一 張 圖 形 ( graph ) 是 由 節 點 (vertex)和連結(edge)所構成,記作 G=(V, E); 圖形的節點所形成的集合稱為節點集(vertex set), 記作 V,節點集的元素個數記作 v;圖形的連結所形 成的集合稱為連結集(edge set),記作 E,連結集的 元素個數記作 e(Sahni, 2001)。圖形又可因連結集的 有無方向性分為有向圖(directed graph)與無向圖 (undirected graph)。而在本研究中,我們將部落格 朋友連結(blogroll)之拓撲定義為一有向圖,其中: 節點:代表朋友連結網絡中的部落格。 連結:代表朋友連結網絡中的朋友關係。當部落 格 A 將部落格 B 列入朋友連結名單,則加入由節點 A 指向節點 B 的連結;若部落格 B 未將部落格 A 列 入朋友連結名單,則不存在由節點 B 指向節點 A 的 連結。

一、拓撲特性

在一有向圖中,一條路徑(path)為起始節點到 目的節點之間所經過的相同方向連結依序構成的一 個串列,而一條路徑的長度則為其串列中連結的個 數。據此,在一有向圖中,有以下兩種不同的連通 定義(Sahni, 2001): (1) 強連通(strongly connected):對於任兩個節點 i, j,節點 i 有路徑可以連通到節點 j,且節點 j 也有路徑可以連通到節點 i,即為強連通。其 中 i→j 與 j→i 的經過的路徑可能不同。 (2) 弱連通(weakly connected):當有向圖形中的 所有連結均視為雙向後,任兩個節點 i, j 兩者 之間有路徑可以連通,即為弱連通。 進行社會網絡分析時,為儘量找到最大的連通成 份,通常先不考慮方向地找出弱連通成份,最後再 回來討論弱連通成份內連結的方向性。因此以下的 拓撲參數定義均不考量連結的方向性,以無向圖為 基準: (1) 分支度:在一個圖形中,單一節點的分支度 (degree)為其相鄰節點的個數,令節點 i 的 分支度為 ki,則此圖形的平均分支度為:

= = v i i v k K 1 (1) 其中 v 為節點總個數。 (2) 路徑長度:一個圖形的路徑長度(path length) 為圖形中所有節點到其他所有節點最短路徑 長度的平均,公式為:

∑ ∑

− = =+ − = 1 1 1 ) , ( ) 1 ( 2 v i v i j j i l v v L (2) 其中 v 為節點總個數,l(i, j)代表節點 i, j 之間的最短 路徑長度(Watts & Strogatz, 1998)。

(5)

(3) 群聚度:節點 i 的群聚度(clustering coefficient) 則為節點 i 所有鄰居節點的實際連結數相對於 最大可能連結數的比例,公式為: ) 1 ( 2 − × = i i i i k k e c (3) 其中,ei代表節點 i 所有鄰居間(不含節點 i)的實 際連結數,ki為與節點 i 鄰居節點的個數,0≦ci≦1。 一個圖形的群聚度則定義為各節點群聚度的平均:

= = v i i n c C 1 (4) 其中 v 為節點總個數(Watts & Strogatz, 1998)。

在一個社會網絡中,以上拓撲參數的意義如下: 平均分支度 K 代表每個節點平均的朋友數;路徑長 度 L 代表節點與節點之間的平均最短距離;平均群 聚度 C 則代表某一節點的所有朋友之間也互相是朋 友的平均機率。 在社會網絡分析中,有各種不同的分析方法,如 Freeman ( 1978/1979 ) 的 中 心 性 分 析 ( centrality analysis)、Borgatti 與 Everett(2000)的核心邊陲分 析(core-periphery analysis)等等。不過它們都較適 用於普查(census)而得的社會網絡(sociodiagram), 否則容易產生偏誤。然而部落格網絡普查工程浩 大,因此本研究採用抽樣(sampling)進行社會網絡 調查。在諸多社會網絡分析方法中,Seidman(1983) 提出的 k-核心分析(k-core analysis)比較適用於抽 樣而得的社會網絡,因為根據 k-核心的定義,縱使 我們的抽樣方法不盡完善,但所找出的 k-核心必然 為實際最大 k-核心的子集合,至少可以看出些許部 落格社群的概括樣貌。

二、K-核心分析

Seidman(1983)的 k-核心分析方法是以節點的分 支度 k 為基準依次篩選,找出網絡的核心結構。給定 一個圖形 G=(V, E):節點所形成的集合為 V,節點 集的元素個數記作 v;連結所形成的集合為 E,連結 集的元素個數記作 e,則 k-核心(k-core)定義如下。 定義 2.1 k-核心:一個由節點子集 C 所產生的最 大子圖形 H=(C, E|C)稱為一個 k-核心,若且為若

∀i∈C: degreeH(i)≧k,其中 degreeH(i)代表節點 i 在 最大子圖形 H 中的分支度。 據此定義,k-核心要求最大子圖形 H 中每一個節 點都必須至少連結到最大子圖形內 k 個節點。當 k =0 時,k-核心即為原本的圖形 G;隨著的 k 的增加, 陸續可篩選出越來越凝聚的 k-核心。k-核心的定義 具有包含性(inclusion):若一個節點屬於 c-核心, 則必然也屬於(c-1)-核心。因此,一個節點的核心性 (coreness)定義如下。 定義 2.2 核心性:一個節點若屬於 c-核心,但不 屬於 (c+1)-核心,則稱此節點的核心性為 c。 據此定義,k-核心分析為尋找聚合次團體(cohesive subgroup)的方法之一(Wasserman & Faust, 1994); 而後 Radicchi et al.(2004)則將 k-核心視為一種社 群。相較於其他複雜的社群分析方法(Newman & Girvan, 2004; Palla et al., 2005),k-核心分析的最大 優點為計算快速,一個擁有 e 個連結的圖形只需 O(e) 時間就可完成。另外,藉其包含特性(inclusion property),k-核心分析更可以清楚比對出不同時點間 社群內的成員變化,因此本研究使用 k-核心分析探 討部落格社群變遷。

研究方法

為探討部落格網絡拓撲變遷,本研究以臺灣地區 目前最大的部落格觀察網站:「部落格觀察」(look. urs.tw)所提供的中文個人部落格排行榜為母體挑選 研究樣本。「部落格觀察」之排行榜以統計個人部落 格為主,必須一人或兩人創作,目前列入排名的限 定為繁體中文或台語文之部落格。本研究進行步驟 如下: 首先,我們以「部落格觀察」網站的統計排名為基 準,選擇 2008 年 10 月 26 日與 2009 年 9 月 6 日兩個 時點,挑選前百大部落格名單為變遷觀察對象。不 過名單中,有部份部落格選擇不公開資訊,所以我 們予以排除。因此本研究挑選出 2008 年 10 月 26 日 97 個部落格與 2009 年 9 月 6 日 96 個部落格為研究 樣本。與 2008 年 10 月 26 日的排名比對,2009 年 9 月 6 日有 27 個部落格新進榜(28 個部落格退出榜), 所以我們的研究樣本共有 97+27=124 個部落格。

(6)

根據兩個時點的研究樣本,我們先分析它們的基 本資料,比較它們特性上的差異。接著,我們根據兩 個時點的前百大部落格名單分別於 2008 年 11 月 1 日 與 2009 年 9 月 11 日蒐集所有樣本部落格首頁的所有 朋友連結[1],並篩選出百大部落格之內的所有朋友連 結,再利用繪圖軟體 NetDraw(Analytic Technologies, 2006)繪製朋友連結的網絡拓撲。最後,使用社會網 絡分析軟體 UCINET(Analytic Technologies, 2010) 進行 k-核心等相關社會網絡分析。

分析結果

根據前述的研究方法,我們首先統計與分析兩個 時點的前百大部落格基本資料,然後繪製出兩個時 點的部落格朋友連結網絡,最後進行 k-核心分析來 探索部落格社群的變遷。

拓撲生成

一個網絡拓撲包含節點與連結。以下小節將分別 說明本研究所蒐集到的部落格節點屬性,以及部落 格之間的連結網絡。

一、節點屬性

我們根據部落格觀察網站中的資料庫和各個部落 格首頁的資料取得以下節點屬性。在使用平台方 面,如表 1 統計,使用 BSP「無名小站」的部落格 在兩個時點的比例皆為最高;在自行架站方面,使用 Wordpress 比例為最高。然而兩個時點比較,可以發 現進入前百大部落格自行架站的比率有下降的趨勢。 為方便網友透過分類找到自己感興趣的部落格訂 閱,部落格觀察網站中提供部落格作者自選部落格 分類,最多可選擇三項。如表 2 統計,2008 年 10 月 26 日前百大部落格的前三名分類依序為資訊科 技、美食與網路應用;而 2009 年 9 月 6 日時,除了 資訊科技、美食與網路應用繼續維持於前三名外, 另外有旅行這個分類的竄出,至於社會評論類的部 落格則退出榜最多。 表 1 部落格平台統計 平台 2008 年 10 月 26 日 Top 100 2009 年 9 月 6 日 Top 100 無名小站 32 27 Yahoo!部落格 0 1 天空部落 3 7 Blogger 10 10 樂多日誌 6 6 xuite 3 2 pixnet 2 6 新浪 3 3 中時部落格 2 3 blogsome 1 5 udn 0 1 ETTODAY 1 0 Jumbo Blog 1 0 Pchome 0 1 bigsound 1 0 憂鬱馬戲團 4 0 Windows live 0 1 使 用 B S P 小計 69 73

(7)

表 1 部落格平台統計(續) WorldPress 19 16 Movable Type 2 0 b2evolution 1 1 F2blog 2 0 Lifetype 1 0 Textcube 1 0 Hi3B 2 1 自行撰寫 0 5 自 行 架 站 小計 28 23 總計 97 96 表 2 部落格內容分類統計 內容分類 2008 年 10 月 26 日 Top 100 2009 年 9 月 6 日 Top 100 資訊科技 19 16 美食 19 17 網路應用 18 16 社會評論 13 5 心情日記 11 8 旅行 11 17 圖文 10 13 休閒嗜好 7 8 影像 6 7 知識學習 6 6 文學創作 5 6 親子家庭 4 3 工作職場 3 4 動漫遊戲 3 2 閱讀文摘 3 3 音樂 3 2 財經投資 2 2 流行消費 3 3 寵物 2 3 運動健康 2 1 星座命理 1 1 藝術設計 1 4 校園活動 0 1 未分類 15 20 總計 167 168

(8)

表 3 為部落格作者的個人資料統計,可以發現多 數部格作者保留個人資訊,但在公開的個人資料 中,性別以男性居多;年齡皆集中在 21 至 30 歲之 間;大學學歷最多;居住地方面,以居住於北部地 區的人數居多;至於職業方面以作家、教育、資訊 相關工作居多。 表 3 部落格作者之基本資料統計 2008 年 10 月 26 日 Top 100 2009 年 9 月 6 日 Top 100 男 49 45 女 34 31 保留 14 20 性 別 總計 97 96 11-20 歲 0 0 21-30 歲 18 10 31-40 歲 10 11 41-50 歲 4 7 保留 65 68 年 齡 總計 97 96 國中 1 0 高中 5 13 大學 16 18 碩士 12 10 博士 2 2 保留 61 62 學 歷 總計 97 96 北部 22 21 中部 4 3 南部 3 3 東部 0 0 海外 3 4 保留 65 65 居 住 地 總計 97 96 作家 18 21 教育 6 5 資訊 7 1 醫療 4 4 學生 2 0 音樂 1 1 家管 1 0 設計 1 0 金融投資 1 0 貿易 1 1 服務業 1 0 藝人 1 0 攝影 1 1 大眾傳播 1 2 旅遊 1 1 議員 1 0 建築營造 0 1 網路 0 4 命理 0 1 藝術 0 1 科技 0 3 娛樂/出版 0 1 保留 50 47 職 業 總計 97 96

(9)

二、連結網絡

圖 1 為本研究繪製完成的兩個時點的部落格朋友 連結網絡。圖 1(a)為 2008 年 10 月 26 日前百大部落 格在 2008 年 11 月 1 日的連結網絡,節點上的數字 代表該節點於 2008 年 10 月 26 日的排名;圖 1(b) 為 2008 年 10 月 26 日前百大部落格與 2009 年 9 月 6 日前百大部落格在 2009 年 9 月 11 日的連結網絡, 節點上的數字代表該節點於 2009 年 9 月 6 日的排 名。在圖 1(b)中,藍色圓形節點代表兩個時點都在 前百大之內的部落格;綠色正三角形則是 2009 年 9 月 6 日新進榜的部落格;而紅色倒三角形則是 2009 年 9 月 6 日退出榜的部落格。總結,2008 年 11 月 1 日的連結網絡有 97 個節點,204 條連結,其中 48 條雙向、156 條單向;而 2009 年 9 月 11 日的連結 網絡則擴大為 124 個節點,302 條連結,其中 72 條 雙向、230 條單向。將 2008 年 11 月 1 日與 2009 年 9 月 11 日的連結網絡相較,節點數與連結數均有相 當的增加,不過我們卻發現最大弱連通成份雖有擴 大的趨勢,最大強連通成份卻有縮小的趨勢,如表 4 所示。我們推測此一現象的原因如下。弱連通成 份只要多加入任一單、雙向連結即可擴大它的範 圍;但強連通的擴大則須由雙向連結,或由形成循 環(cycle)的多條單向連結來達成。然而在雙向連 結不多,單向連結又有優先附加(preferential at-tachment)效應下(Barabási, 2005),各個部落格傾 向只連往排名較前的部落格,因此造成最大弱連通 成份擴大、最大強連通成份卻有縮小的現象。 表 4 連通特性彙整 連通 成份 連結 網絡 強連通 弱連通 2008 年 11 月 1 日 共有 62 個成份。最大成份由 34 個節點組成, 包含 85 條連線(39 條單向,46 條雙向)。 共有 18 個成份。最大成份由 79 個節點組成, 包含 203 條連線(155 條單向,48 條雙向)。 2009 年 9 月 11 日 共有 75 個成份。最大成份由 27 個節點組成, 包含 72 條連線(33 條單向,39 條雙向)。 共有 13 個成份。最大成份由 112 個節點組成, 包含 302 條連線(230 條單向,72 條雙向)。

K-核心分析

在 k-核心分析中,一個節點或一條連結若屬於 c-核心,那麼也屬於(c-1)-核心。利用此包含特性,我 們比對部落格朋友連結網絡的變遷。圖 2 是我們 k-核心分析的結果:由 2008 年 11 月 1 日之最大 5-核 心成份到 2009 年 9 月 11 日之最大 7-核心成份,可 看出整體部落格社群明顯的成長。

一、社群變遷

根據以上 k-核心分析,我們再以核心性的變化來 觀察社群網絡變遷。表 5 是 2008 年 11 月 1 日至 2009 年 9 月 11 日之間部落格核心性變遷統計,表中的對 角線代表核心性保持不變與社群持平的部落格個 數;右上部份代表核心性提昇與社群成長的部落格 個數;左下部份則代表核心性降低與社群疏離的部 落格個數。由表 5 的統計可發現由 2008 年 11 月 1 日至 2009 年 9 月 11 日,社群成長的部落格個數遠 較社群疏離的部落格個數為多。 接著,我們挑出 2008 年 11 月 1 日最大 5-核心與 2009 年 9 月 11 日最大 7-核心,仔細檢視這兩個最

(10)

大 核心的社群網絡變遷。首先,由表 6 最大 k-核心成員之基本資料,可以發現 2008 年 11 月 1 日 之 5-核心是以資訊科技與網路應用為主題所形成 的部落格社群,作者以男性為主,自行架站比例較 高:12 位成員中,有 4 位使用 WordPress,1 位使 用 Hi3B;至於 2009 年 9 月 11 日之 7-核心則以圖 文為主題所形成的部落格社群,其中有部份女性成 員,而所有成員的部落格大多架設於「無名小站」 之上。

二、疏離的社群

檢視表 6 中 2008 年 11 月 1 日最大 5-核心成員由 2008 年 11 月 1 日至 2009 年 9 月 11 日的變化,我們 可以發現此資訊科技社群呈現出些許疏離的狀況: 節點數維持不變,單向連結微幅增加,但雙向連結 卻大量流失。而在核心性變化方面,雖多數節點持 平,但卻有三個節點:21/56、92/139、97/42 的核心 性降低。

三、成長的社群

檢視表 6 中 2009 年 9 月 11 日最大 7-核心成員由 2008 年 11 月 1 日至 2009 年 9 月 11 日的變化,我 們可以發現此圖文社群呈現出快速成長的趨勢:節 點數增加三個,單、雙向連結均大幅增加。而在核 心性變化方面,除了新進榜的三個節點:101/16、 121/96、174/89 大幅成長之外,以節點 32/6 的核 心性提升最多:由 2008 年 11 月 1 日原來不屬於 圖文社群的 2-核心,至 2009 年 9 月 11 日進入圖 文社群的 7-核心。另外,若不計入新進榜的三個 節點,圖文社群於 2009 年 9 月 11 日仍可擴展成 為 6-核心。 表 7 為兩個部落格社群的拓撲特性變遷彙整:疏 離的資訊科技社群可由降低的平均分支度、升高的 路徑長度、與降低的平均群聚度看出;成長的圖文 社群則可由升高的平均分支度、降低的路徑長度、 與升高的平均群聚度看出[2]。

討論

關於以上所分析出的社群疏離與成長現象,我們 有以下的推測:日新月異的資訊科技隨時改變著部 落格作者的興趣與目標,所以社群的凝聚相對不易 維持;反觀圖文部落格社群的成員裡,許多都是從 部落格發跡、現已成名的網路作家,因此在馬太效 應(Matthew effect)的影響下,自自然然擴大社群 的組成(Martin, 2009)。此外,以上分析結果與 Banks (2007)對世界知名部落格作者的訪談報告相較, 我們可以發現資訊科技社群同樣是熱門的趨勢;但 圖文社群則是臺灣特有的發展;然而,歐美國家中 活躍的政治部落格社群(Adamic & Glance, 2005), 則還未於臺灣浮現。以上比較結果可能為文化差異 所造成的現象,仍須進一步的研究與探討。 在本研究中我們只專注在資訊科技(5-核心)與 圖文(7-核心)部落格社群的變遷觀察,然而再檢 視圖 2(b)之 k-核心分析結果,我們可以發現 3-核心 與 4-核心的節點散落於 5-核心與 7-核心之間,這些 節點可能因對資訊科技的興趣連結到 5-核心,因對 圖文的興趣而連結到 7-核心。換言之,這中間的節 點有許多社群重疊的部份,然而 k-核心分析,由於 包含特性的限制,只能觀察出社群內的變遷,無法 觀察出社群間的變遷。這部份問題仍有待我們在後 續的研究中,嘗試其他的社會網絡分析方法探索 (Everett & Borgatti, 1998; Palla et al., 2005)。

(11)

(a) 2008 年 11 月 1 日

(b) 2009 年 9 月 11 日

(12)

(a) 2008 年 11 月 1 日

(b) 2009 年 9 月 11 日

(13)

表 5 部落格核心性變遷統計 2009 年 9 月 11 日 核心性 核心性 0 1 2 3 4 5 6 7 0 10 8 9 8 0 5 0 3 1 1 6 1 4 1 0 0 0 2 0 4 6 2 1 0 0 1 3 0 2 1 7 4 0 0 0 4 1 1 1 1 14 3 0 7 5 0 0 1 0 2 9 0 0 6 0 0 0 0 0 0 0 0 2008 年 11 月 1 日 7 0 0 0 0 0 0 0 0 表 6 最大 k-核心成員之基本資料 2008/2009 排名 2008/2009 核心性 內容 分類一 內容 分類二 內容 分類三 使用 平台 作者 性別 作者 年齡 作者 學歷 作者 職業 作者 居住地 17/9 5/5 資訊科技 網路應用 動漫遊戲 Blogger N/A N/A N/A N/A 基隆 21/56 5/4 藝術設計 網路應用 工作職場 Blogger 男 N/A N/A 設計 台北 34/92 5/5 網路應用 資訊科技 財金投資 WordPress 男 N/A N/A N/A N/A 43/90 5/5 流行消費 休閒嗜好 知識學習 Hi3B N/A N/A N/A N/A N/A 48/84 5/5 心情日記 動漫遊戲 網路應用 Blogger 男 21~30 N/A 作家 N/A 55/39 5/5 圖文 資訊科技 休閒嗜好 Xuite N/A N/A N/A N/A 高雄 56/122 5/5 資訊科技 網路應用 知識學習 WordPress N/A N/A N/A N/A N/A 71/94 5/5 資訊科技 網路應用 N/A WordPress 男 N/A N/A N/A N/A 75/40 5/5 影像 旅行 美食 天空部落 男 N/A 碩士 藍領 台北 92/139 5/4 心情日記 資訊科技 社會評論 Blogger N/A N/A N/A N/A N/A 95/110 5/5 運動健康 N/A N/A WordPress N/A N/A N/A 醫療 N/A 2008 年

11 月 1 日 之 5-核心

97/42 5/2 音樂 影像 親子家庭 Blogger 男 31~40 N/A N/A 台北 1/1 4/7 圖文 N/A N/A 無名小站 女 21~30 高中 作家 N/A 7/11 4/7 圖文 N/A N/A 無名小站 男 N/A N/A 作家 N/A 8/12 4/7 圖文 N/A N/A 無名小站 女 21~30 大學 作家 台北 10/13 4/7 圖文 N/A N/A 無名小站 男 N/A N/A N/A N/A 16/15 4/7 旅行 N/A N/A 無名小站 女 N/A 大學 作家 N/A 32/6 2/7 圖文 N/A N/A 樂多日誌 男 31~40 高中 N/A N/A 40/181 4/7 圖文 N/A N/A 無名小站 男 21~30 N/A N/A N/A 41/102 4/7 圖文 N/A N/A 無名小站 男 21~30 大學 學生 N/A 101/16 0/7 圖文 N/A N/A 無名小站 男 N/A N/A N/A N/A 121/96 0/7 圖文 寵物 藝術設計 天空部落 男 N/A 大學 N/A 台北 2009 年

9 月 11 日 之 7-核心

174/89 0/7 圖文 藝術設計 N/A 無名小站 男 N/A 碩士 藝術 N/A

表 7 部落格社群之拓撲特性變遷彙整 拓樸特性 部落格社群 節點數 v 連結數 (雙向+單向) e=(ebi + euni) 平均分支度 K = 2e/v 路徑長度 L 平均群聚度 C 資訊科技 (2008) 12 40=(22 + 18) 6.667 1.504 0.471 資訊科技 (2009) 12 31=(9 + 22) 5.167 1.747 0.381 圖文 (2008) 11 16=(9 + 7) 2.909 N/A 0.353 圖文 (2009) 11 49=(24 + 25) 8.909 1.280 0.657 圖文 (2008) ※ 8 16=(9 + 7) 4.000 N/A 0.486 圖文 (2009) ※ 8 25=(14 + 11) 6.250 1.204 0.702 ※扣除新進榜三個節點之圖文部落格社群。

(14)

結論

本研究以「部落格觀察」網站登錄的部落格為母 體,分別選取 2008 年 10 月 26 日與 2009 年 9 月 6 日排行榜之前一百名部落格為樣本,據以蒐集 2008 年 11 月 1 日與 2009 年 9 月 11 日樣本部落格首頁上 的朋友連結名單,來觀察部落格社群的朋友連結網 絡,並分析部落格社群的形成與變遷。我們先利用 k-核心分析找出了圖文與資訊科技兩大主要社群, 接著由變遷分析發現圖文社群呈現出快速發展的趨 勢,至於資訊科技社群則有些許疏離的現象。與國 外的部落格發展相較,我們則發現資訊科技社群同 樣是熱門的趨勢;但圖文社群卻是臺灣地區特有的 發展。 在本研究中,我們藉由部落格抽樣所分析出的結 果雖不能全然代表臺灣地區部落格社群的變遷,但 至少探索了其部份樣貌與發展現況:根據 k-核心的 定義,我們所找出的 k-核心必然為實際最大 k-核心 的子集合。此外,本研究只探討兩個時點的社群變 遷,未來我們將繼續部落格社群資料收集,結合時 間序列分析,同時加入部落格文章的回應及引用等 網絡的拓撲分析,並嘗試其他社群間的變遷分析方 法,期待對部落格的社群發展能有更進一步的了解。

附註

[1] 因為「部落格觀察」網站運作的關係,當日的 排名無法於當日確定,「排名取得」與「網絡收集」 之間有些許的時間差。以 2008 年的網絡收集為例, 在 2008 年 10 月 26 日的排名資料於 2008 年 11 月 1 日確定之後,我們才進行部落格朋友網絡的收集。 [2] 路徑長度的計算只能針對連通成份,而圖文社 群於 2008 年仍未連通,所以無法計算路徑長度,表 7 中用 N/A 表示。

致謝

本論文作者感謝兩位匿名審查委員的寶貴建議, 以及國家科學委員會的研究計畫贊助(計畫編號: NSC 97-2410-H-182-011),特此誌謝。

參考文獻

Adamic, L.A. & Glance, N. (2005). The Political blo-gosphere and the 2004 U.S. election: Divided they blog. Proceedings of the 3rd international workshop

on Link discovery, Illinois, USA.

Agarwal, N. & Liu H. (2008). Blogosphere: Research issues, tools, and applications. ACM SIGKDD

Ex-plorations Newsletter, 10 (1), 18-31.

Aharony, N. (2009). Librarians and information scientists in the blogosphere: An exploratory analysis. Library &

Information Science Research, 30(3), 174-181.

Ali-Hasan, N. & Adamic, L.A. (2007). Expressing social relationships on the blog through links and comments. International Conference on Weblogs

and Social Media, Colordo, USA.

Analytic Technologies (2006). NetDraw Version 2.32, http://www.analytictech.com/Netdraw/netdraw.htm Analytic Technologies (2010), UCINET Version 6.258,

http://www.analytictech.com/ucinet/

Banks, M.A. (2007). Blogging Heroes: Interviews with

30 of the World's Top Bloggers, Wiley, New Jersey.

Barabási, A.-L. (2005). The Origin of bursts and heavy tails in human dynamics. Nature, 435(7039), 207-211. Blood, R. (2002). The Weblog Handbook: Practical

Advice on Creating and Maintaining Your Blog,

Perseus Publishing, Massachusetts.

Borgatti, S.P. & Everett, M.G. (2000). Models of core/periphery structures. Social Networks, 21(4), 375-395.

Chau, M. & Xu, J. (2007). Mining communities and their relationships in blogs: A Study of online hate groups.

Int'l J. Human-Computer Studies, 65(1), 57–70.

de Nooy, W., Mrvar, A., & Batagelj, V. (2005).

Ex-ploratory Social Network Analysis with Pajek,

Cambridge University Press, New York.

Everett, M.G. & Borgatti, S.P. (1998). Analyzing clique overlap. Connections, 21(1), 49-61.

Freeman, L.C. (1978/1979). Centrality in social net-works: conceptual clarification. Social Networks,

(15)

Gillmor, D. (2004). We the Media: Grassroots

Jour-nalism by the People, for the People, O’Reilly,

California.

Gotz, M., Leskovec, J., McGlohon, M., & Faloutsos, C. (2009). Modeling blog dynamics. Proceedings of the

Third International Conference on Weblogs and So-cial Media, Colordo, USA.

Hanneman, R. & Riddle, M. (2005). Introduction to

Social Network Methods, University of California,

Riverside, California.

Herring, S.C., Scheidt, L.N., Bonus, S., & Wright, E. (2004). Bridging the gap: A Genre analysis of we-blogs. Proceedings of the 37th Annual Hawaii

In-ternational Conference on System Sciences, Hawaii,

USA.

Herring, S.C., Kouper, I., Paolillo, J.C., Scheidt, L.N., Tyworth, M., Welsch, P., Wright, E., & Yu, N. (2005). Conversations in the blogosphere: An Analysis from the bottom up. Proceedings of the

38th Annual Hawaii International Conference on System Sciences. Hawaii, USA.

Johnson, D. (2006). RSS and Atom in Action: Web 2.0

Building Blocks, Manning Publications, Connecticut.

Kumar, R., Novak, J., Raghavan, P., & Tomkins, A. (2004). Structure and evolution of blogspace.

Com-munications of the ACM, 47(12), 35-39.

Leskovec, J., Backstrom, L., & Kleinberg, J. (2009). Meme-tracking and the dynamics of the news cycle.

Proceedings of the 15th ACM SIGKDD interna-tional conference on knowledge discovery and data mining, Paris, France.

Marlow, C.A. (2006). Linking without thinking: we-blogs, readership, and online social capital formation.

International Communication Association Conference,

Dresden, Germany.

Martin, J.L. (2009). Social Structures, Princeton Uni-versity Press, New Jersey.

Merriam-Webster Dictionary (2004). Merriam-

Web-ster's Words of the Year 2004, http://www.

mer-riam-webster.com/info/04words.htm

Newman, M.E.J. & Girvan, M. (2004). Finding and

evaluating community structure in networks.

Physi-cal Review E, 69(2), 026113.

O’Reilly T. (2005). What is Web 2.0? http:// oreilly.com/web2/archive/what-is-web-20.htm Palla, G., Derenyi, I., Farkas, I., & Vicsek, T. (2005).

Uncovering the overlapping community structure of complex networks in nature and society. Nature,

435(7043), 814-818.

Otte, E., & Rousseau, R. (2002). Social network analy-sis: A Powerful strategy, also for the information sciences. Journal of Information Science, 28(6), 441-453.

Radicchi, F., Castellano, C., Cecconi, F., Loreto, V., & Parisi, D. (2004). Defining and identifying commu-nities in networks. Proceedings of the National

Academy of Sciences of the United States of America, 101(9), 2658–2663.

Sahni, S. (2001). Data Structures, Algorithms, and

Applications in Java, McGraw-Hill, New York.

Seidman, S.B. (1983). Network structure and mini-mum degree. Social Networks, 5(3), 269-287. Sifry, D. (2007). The State of the Live Web, April 2007,

http://www.sifry.com/alerts/archives/000493.html Smith, T. (2008). Power to the People - Social Media

Tracker Wave 3, http://www.universalmccann.com/

Assets/wave_3_20080403093750.pdf

Wasserman, S. & Faust, K. (1994). Social Network

Analysis, Cambridge University Press, New York.

Watts, D.J. & Strogatz, S.H. (1998). Collective dynamics of 'small-world' networks. Nature, 393(6684), 440- 442.

Winer, D. (2001). What are weblogs? http:// oldwe-blogscomblog.scripting.com/personalWebPublishing Communities

Winn, P. (2009). State of the blogosphere 2008, http://technorati.com/blogging/feature/state-of-the-bl ogosphere-2008/

維 基 百 科 (2009) 。 部 落 格 。 http://zh.wikipedia.org/ w/index.php?title=%E7%B6%B2%E8%AA%8C&v ariant=zh-tw

數據

表 1  部落格平台統計(續)  WorldPress 19  16  Movable Type  2  0  b2evolution 1  1  F2blog 2  0  Lifetype 1  0  Textcube 1  0  Hi3B 2  1  自行撰寫 0  5 自 行 架 站  小計 28  23  總計 97  96  表 2  部落格內容分類統計  內容分類  2008 年  10 月 26 日  Top 100  2009 年  9 月 6 日 Top 100  資訊科技 19  16
表 3 為部落格作者的個人資料統計,可以發現多 數部格作者保留個人資訊,但在公開的個人資料 中,性別以男性居多;年齡皆集中在 21 至 30 歲之 間;大學學歷最多;居住地方面,以居住於北部地區的人數居多;至於職業方面以作家、教育、資訊相關工作居多。  表 3  部落格作者之基本資料統計  2008 年  10 月 26 日  Top 100  2009 年  9 月 6 日 Top 100  男 49  45  女 34  31  保留 14  20 性 別  總計 97  96  11-20 歲 0
圖 1  部落格朋友連結網絡
圖 2  k-核心分析圖
+2

參考文獻

相關文件

• Note that posterior variability is higher in the full Bayesian analysis, reflecting posterior uncertainty in

The thesis uses text analysis to elaborately record calculus related contents that are included in textbooks used in universities and to analyze current high school

The remaining positions contain //the rest of the original array elements //the rest of the original array elements.

Failure Mode and Effects Analysis (Failure Modes and Effects Analysis, FMEA) is used to analyze the product / system, the potential failure modes, identify potential trouble spots

The main objective of this article is to investigate market concentration ratio and performance influencing factors analysis of Taiwan international tourism hotel industry.. We use

Tunnel excavation works on the support of the simulation analysis, three-dimensional finite element method is widely used method of calculating, However, this

However, the information mining system has already been a trend of the current epoch, if it is possible to obtain an effective management system to integrate data that relates to

This study collected consumer expectations and perception of medical tourism industry, with Neural Network Analysis and Mahalanobis Distance Analysis found the key to the