1990 年代網際網路興起,網路使用者數量急遽上升,越來越多應用都是透過網路來 進行。到了 1990 末期,隨著用戶端設備功能日漸增強,以及網路頻寬加大,點對點應 用儼然成為最熱門的網路傳輸方式。雖然目前已有許多不同種類點對點網路架構,但是 主要基礎架構多出於集中索引(Index Server)、分散式服務(Distribute Service)、分散式雜 湊表(DHT,Distribute Hash Table)等三種。由於 P2P 技術的成熟與進步,P2P 軟體隨手 可得,目前的 P2P 軟體大部分都應用於檔案的分享,而造成了網路頻寛的消耗,版權的 保護也成為 P2P 技術令人爭議的問題。
1.1 動機與目的
最近十幾年來,網際網路使用者數量呈曲線指數上升,越來越多生活應用都是透過 網路來進行,如商業行為、生活、娛樂等。到了 1990 年代末期,隨著用戶端設備不斷 更新,以及網路頻寬日漸加大,點對點應用儼然成為最熱門的網路傳輸方式。雖然目前 已有各式各樣的點對點網路架構,但是主要基礎架構多出於集中索引(Index Server)、分 散式服務(Distribute Service)、分散式雜湊表(DHT,Distribute Hash Table)等三種,從技 術及法律的種種層面來看,各有其優缺點,但尚未出現一個最佳的架構。
雖然網路頻寬變得越來越大,傳輸的效能也越來越好,但是由於現在網路應用程式 的普及化與多樣化,使得我們並沒有從網路的發達中得到同樣多的好處,更糟的是,我 們碰上了更多的效能問題。
圖 1 各種網路應用比例圖(資料來源[ 33 ])
舉個例子來說(如圖 1),在 2003 年,IDC 曾經做出研究報告指出,某家典型的美國大型 企業每年花費約兩千六百萬美金在網際網路上面,卻只有 14%的頻寬用在必要的工作 上,其餘的都是網頁瀏覽、電子郵件傳送、P2P 程式等等,甚至還有網路遊戲。
P2P 是 Peer-to-Peer 之簡稱,是一種分散式的網路技術,在 P2P 網路中每台電腦同 時身兼兩種角色:Client 和 Server。任兩台電腦間可以直接連線而不用透過伺服器,可 以對等的互相分享資源,有別於過去個人電腦,一定要連結上某個網站或公司的伺服 器,才可以下載取得檔案資料的主從式(Client/Server)架構作業模式。現行的點對點應用 架構,多著重於資料查詢或者與其他用戶端之間的溝通維護。但是往往沒有考慮到部分 用戶因被選為熱點(via point,中繼點),不僅僅造成該用戶端網路壅塞及效能低落,更嚴 重地,影響整體網路的效能,造成網路癱瘓,除此之外,萬一該用戶故障,則和該用戶 相關的資訊不僅全部斷除,更需要花上許多回復成本及浪費頻寬。點對點應用上所傳輸 的內容及流量對整體網路的壅塞,是否也是影響了網路效能的原因。
在 P2P 的發展過程中,產生「集中式(centralized)」與「分散式(decentralized)」
兩類不同的架構,雖然都採用分散式檔案共用的設計,但集中式 P2P 為爭取搜尋效率,
在中央伺服器中建有目錄,提供檔案名稱或索引之管理;分散式 P2P 則未利用到中央伺 服器,所有搜尋、傳輸及重製均發動及完成於使用者之間,在這個搜尋以及下戴檔案的 過程中,所消耗的頻寬,對於網路的效能造成了很大的影響。
根據 Yankee Group research firm 在 2002 年對美國 P2P 軟體使用情形所做的調查結 果顯示,當時在美國約有 5 千 7 百萬的人使用 P2P 軟體,而透過 P2P 軟體分享的檔案數 量超過 50 億,此數據持續增加。雖然在網路中流通的檔案數量極為龐大,但是著作權 人(影音業者)卻很難從中獲取利潤,甚至因為 P2P 軟體的普及而招致損失。RIAA 便表 示消費者利用 P2P 軟體非法下載 MP3 造成唱片銷售量的減少,損失金額至少超過數百 萬美元。
在本篇論文中,我們希望能在真實的環境之下進行封包的搜集,並嘗試對目前點對 點應用對網路生態造成的影響進行研究,以及點對點應用對目前法律及生活所帶來的新 層面衝擊進行探討。
1.3 論文架構
論文將以點對點傳輸架構演進的順序,說明其改進的緣由以及優缺點,並介紹目前 熱門的點對點檔案分享軟體,同時講述相關知識。另外,再藉由分析網路流量來探討各 種 P2P 軟體使用的比例以及 P2P 軟體使用情形對網路的影響。
本論文的整體架構如下,第二章介紹與本論文相關的背景知識,包括 P2P 技術的應 用、P2P 架構的演進以及目前熱門的 P2P 熱門應用軟體。第三章探討目前提出分析網路 流量的方法,如協定基礎分析方法(Protocol-Based Traffic Analysis)和資料基礎(Packet Payload Based Analysis)分析方法。第四章說明本論文用來分析網路流量方法,首先說 明針對網路各種應用如 HTTP、FTP、POP3 等所佔網路流量比例的分析方法,然後再講 述分析 P2P 流量中各種軟體所佔的比例以及 P2P 檔案分享內容所佔比例的方法。第五章 列出我們分析的結果包括網路應用比例、P2P 軟體使用比例、P2P 檔案分享比例。第六 章對本論文研究進行討論、提出結論,並說明未來可能的研究方向。