• 沒有找到結果。

第二章 相關研究

2.2 社群網路的相關研究

立 政 治 大 學

Na tiona

l Ch engchi University

10

表 2.1:Greedy algorithm

使用貪婪演算法在計算影響力的期望值時,利用透過實驗的方式找出每個點在社群 網路上的影響力期望值。對每個節點而言,我們會計算如果選取此一節點時,在這一回 合裡影響了社群網路上幾個節點,然後計算 R 個回合,在將所有影響的節點個數除以 R 算出此節點在社群網路上的影響力期望值。當找出社群網路上影響力期望值最大的節點 後,我們會利用此節點結合社群網路上的其他節點,找出兩個節點在一起時影響力期望 值為最大的組合,藉此找出 K 個節點時影響力期望值最大的組合來。

2.2 社群網路的相關研究

在[1]的研究中,主要是在定義影響力在社群網路上最大化的問題。此問題希望在 一個社群網路上,找出影響力最大化的節點組合。由於這個問題本身已經被證明是一個 NP-hard 的問題,所以要找到最佳解需要花費大量的時間,所以大部分的論文研究都針 對如何縮短時間以及找出趨近於最佳解為主。在社群網路上,影響力的計算有個特殊的 性質就是兩個節點在一起時的影響力並不等於兩個節點各自的影響力相加,而是必須同

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

11

時計算兩個節點在一起時的影響力,因為必須扣除重複影響的節點。[1]使用貪婪演算 法(Greedy algorithm)來解決這個問題,先計算出每個節點在社群網路上的影響力期 望值,挑出影響力最大的節點。以這個節點為主,結合社群網路上其他的節點,找出兩 個節點在一起時影響力最大的組合來,以此類推直到找到 K 個點在一起時影響力最大的 組合來。在之後的研究都以減少計算影響力期望值的時間為主。[3]設計了兩種不同的 演算法以達到減少計算時間的效果:一種方法是改良貪婪演算法(MixGreedy

algorithm),另外則是提出一個新的直覺式演算法(DiscountDegree algorithm),目 的都是縮短計算影響力期望值的時間。以往的計算期望值的方式是一條一條邊慢慢去測 詴邊是否能夠使兩個點互相影響,MixGreedy algorithm 則是一次測詴完整個社群網路 的邊,直接把不能影響的邊刪除,剩下來的邊都是確定可以互相影響的邊。在 Greedy algorithm 裡,我們在計算每個節點的影響力期望值的時候,必須將每條邊都測詴是否 能使兩個節點互相影響 。但在[3]中,一開始就先將社群網路上的每條邊都測詴過一 遍,知道哪些邊是可以互相影響的,因此可以一次計算出所有節點的影響力期望值。因 為是一次算出所有節點的影響力期望值而不是一個節點一個節點慢慢去計算影響力期 望值,所以可以有效率的節省計算節點在社群網路上影響力期望值的時間。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

12

表 2.2:MixGreedy algorithm

如上圖所示,MixGreedy algorithm 一開始先測詴社群網路上的每條邊,並且刪除 掉那些不會影響的邊,剩下的邊都是確定可以使兩個節點互相影響的。接著就計算每個 節點在社群網路上的影響力期望值。在以往計算影響力期望值時,通常先挑選出一個節 點,針對此節點周圍的邊進行測詴直到測詴完所有社群網路的邊為止。假設社群網路上 有 n 個節點、m 條邊,那就必須計算 n*m 次才可以算完每個節點在社群網路上的影響力 期望值。而先測詴社群網路上的每條邊時,則只需要計算 m 次就可以算完每個節點在社 群網路上的影響力期望值,因此可以節省很多的計算時間。

DiscountDegree Algorithm 則是利用節點的維度達到節省計算時間的效果,此演算 法的精神在於透過節點維度的多寡去計算此節點在社群網路上的影響力期望值,例如有 一個節點的維度為 10,而另一個節點的維度為 5 時,則此演算法會優先挑選維度高的節

(Community-based greedy algorithm)來達到減少計算影響力期望值的時間。

Community-based greedy algorithm 利用分群的方法將社群網路分成不同的幾群,而分 群的目的是希望在相同的分群內部的邊越密集越好,而群和群之間的邊則是越稀疏越 設置水污染的偵測裝置可以有效的偵測水污染(CELF Algorithm)。假設目前有許多的 抽水站,我們應該在哪些抽水站放置偵測水污染的裝置才能夠達到最好的水污染偵測效 果,而放置裝置本身也需要花費些許費用,在預算有限的情況下,我們需要有效的運用

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

14

我們的預算來放置水污染的偵測裝置,因此如何在有限的預算下達到最好的水污染偵測 效果就是此篇研究的重點。此篇研究討論的主題與我提出的研究問題是相同的。我的問 題是如何在有限的預算下找出影響力最大的代言人組合,我提出了新的演算法在計算時 間不比之前的研究慢的情況下去解此問題,並且在我的方法下所挑選出來的節點所造成 的影響力期望值可以優於之前研究所提出的演算法。

CELF algorithm 利用將節點本身的影響力期望值除以節點本身的費用,算出每個節 點的本益比,然後從本益比較高的節點開始選擇,直到擁有的預算使用完為止,算是一 種非常直覺式的算法,且此演算法所找出來的代言人組合並不是最佳解。

舉例來說:目前我們的預算為 6B,有三位代言人(S1,S2,S3),代言的費用分別為 c(S1)=4B,c(S2)=3B,c(S3)=3B 且每位代言人的影響力期望值為 R(S1)=8B,R(S2)=5B,

R(S3)=4B。因此我們可以得知本益比(S1)=2,(S2)=1.66,(S3)=1.33。在選擇代言人的 時候我們會先選擇本益比最高的 S1,並且花掉 4B 的費用,但這樣我們的預算就只剩下 2B 無法再去聘請其他的代言人,因此我們所得到的影響力期望值就是 8B,但比較好的 代言人組合應該是(S2+S3),影響力期望值為 9B 才對。[2]是第一篇在社群網路上計算 影響力最大化的情況下,加入預算和費用的論文,因為與我所要研究的問題一樣,所以 此篇研究也是我比較好壞的重點。我希望可以在計算時間上明顯低於此篇研究所提出來 的演算法,並且在影響力的大小上高於此篇研究。

的影響力期望值相加即可。在分群完成之後,我們會使用群聚係數(Clustering Coefficient)當做是判斷點與點之間關係的緊密程度,群聚係數越高,代表此社群網 路圖型中點與點之間的關係越密切,其單點群聚公式為:

相關文件