• 沒有找到結果。

第一章 緒論

1.5 論文大綱

本論文主要分為五個章節,第一章為緒論,主要在介紹本篇論文研究的緣 起及研究成果,包含前言、研究動機、研究目的、研究成果及論文大綱;第二 章,主要介紹本論文所使用相關概念與技術背景,包含資料庫儲存、頁面呈現 等;第三章,完整介紹本論文的系統設計與架構,包含了資料分析、前端頁面 設計與操作流程、排程資料處理機制等;第四章,說明本系統的功能驗證與分 析成果,實際運用臉書粉絲頁貼文來解析超連結並套用排程資料處理機制後的 成效,以及實際分析資料後的成果展示說明;最後,於第五章提出本論文的結 論與未來可能的發展。

5

對於有些字串很長的網址,為方便資訊交換,縮短網址(URL shortening)

即成為網路上一個方便使用的網路服務,以一個非常簡短的網址代替原來的長 網址,當使用者存取短網址時,將會被導向原來的網址。短網址的原理為各家 提供短網址服務的服務提供者會存有一個對照表(URL Mapping table),裡面 存放 key 值和其所對應的原網址,當收到 Request 時,便可比對對照表找出原網 址,並重新導向之,流程圖可參考下圖 2-1:

2 Web Form 架構:建立主要具有瀏覽器使用者介面的應用程式。這當然包括可透過全球資訊網 公開取得的應用程式。

6 需求者選擇使用,譬如關聯式資料庫中的 MySQL、PostgreSQL5等或 NoSQL 的 HBase6、MongoDB7等。但因在分析過程中,我們已經會先將蒐集回來的資料 的 MySQL AB 公司,該公司再 2008 年被昇陽微系統(Sun Microsystems)收 購。2009 年,甲骨文公司(Oracle)收購昇陽微系統公司,MySQL 成為 Oracle 旗 下產品。

MySQL 以成本低廉且擁有高效能及可靠性著名,並成為許多新興網站最想 選用的資料庫系統,尤其以資金成本較低的中小型網站為主。MySQL 的特色在 於其效能高、成本低、可靠性好,是目前最流行的開源資料庫之一,甚至許多 中小企業受因無法負擔較高成本的大型資料庫系統,多轉向使用 MySQL 作為

3Oracle:甲骨文股份有限公司,是全球大型資料庫軟體公司,其下 Oracle 資料庫系統為目前最 被廣泛運用的商業資料庫系統。

4DB2:DB2 是 IBM 公司開發的一種大型關係型資料庫平台.它支持多用戶或應用程序在同一條 SQL 語句中查詢不同 database 甚至不同 DBMS 中的數據。

5 PostgreSQL:是 Open Soruce 的資料庫管理系統,在靈活的BSD-風格授權條款下發行。

6HBase:Hbase 是 Apache Hadoop 的資料庫, 能夠對大型資料提供隨機、即時的讀寫存取

7MongoDB:是一種檔案導向資料庫管理系統,由C++撰寫而成,以此來解決應用程式開發社 群中的大量現實問題。

7

其資料庫系統使用。而隨著 MySQL 的逐漸成熟穩定,甚至目前也有許多大規 模的網站如維基百科8、Facebook、Google9等也都有使用 MySQL 作為資料儲存 使用;更有著名的網站程式語言 PHP 結合 MySQL 推出一整套的開放、免費網 站的解決方案套件 PHPMyAdmin10,甚至在建置動態網站中所盛行的自由、免 費網站的整體解決方案「LAMP」11,其中的「M」即代表 MySQL。 者使用,而其中微軟推出的.Net Framework 更包含有一整套的開發工具以及程 式語言完整的套件,因此在前端頁面開發部分即採用此整合套件之平台以開發 前端頁面,此外再搭配一些開發前端頁面技術常用的套件如 jQuery、AJAX 等 和 jQuery 的圖表套件 Highcharts 做圖表化的結果呈現,讓頁面能更豐富完整。

2.3.1 ASP.NET

本研究之成果系統前端頁面主要是採用 ASP.NET[11],其是由微軟

(Microsoft)在.NET Framework 框架中所提供,開發 Web 應用程式的類別庫,

8維基百科:是一個自由內容、公開編輯且多語言的網路百科全書協作計畫,透過Wiki技術使 得包括您在內的所有人都可以簡單地使用網頁瀏覽器修改其中的內容。

9 Google:是一家美國的跨國科技企業,業務範圍涵蓋網際網路搜尋、雲端運算、廣告技術等領 域,開發並提供大量基於網際網路的產品與服務。

10 PHPMyAdmin:是一個以PHP為基礎,以 Web-Base 方式架構在網站主機上的MySQL的資 料庫管理工具,讓管理者可用 Web 介面管理 MySQL 資料庫

11 LAMP:一個是 Linux 作業系統上面,搭配 Apache + MySQL + PHP 等而達成,這個系統被稱 為 LAMP。此為流行的自由軟體架構。

8

可以運行在安裝.Net Framework 的 IIS(Internet Information Services,網際網路 資訊服務)伺服器12上,包含一般 Win Server13或是 Windows 系統的個人電腦皆 可安裝運行,其運作架構如下圖 2-2,堪稱是一套很方便的網站開發平台,很多 人都把 ASP.NET 當做是一種程式語言,但它實際上只是一個由 .NET

Framework 提供的一種開發平台,並非程式語言。也可認為 ASP.NET 是.NET 元件,任何.NET 語言,例如 C#,可以參照該元件,建立網頁或 Web 服務,而 本研究主要採用 C#做為開發之程式語言。

圖 2- 2ASP.NET 運行架構 引用來源:http://zh.wikipedia.org/wiki/ASP.NET

12 IIS(Internet Information Services,網際網路資訊服務)伺服器:是由微軟公司提供的基於 運行。Microsoft Windows的網際網路基本服務的伺服器。

13 Win Server:運行由微軟公司提出的伺服器作業系統,如 Win2003、Win2008、

Win2012 等。

9

2.3.2 jQuery

jQuery[12]是一套跨瀏覽器的JavaScript 函式庫,簡化HTML與 JavaScript 之間的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上釋出第一個版 本。目前是由 Dave Methvin 領導的開發團隊進行開發。全球前 10,000 個存取最 高的網站中,有 65%使用了 jQuery,是目前最受歡迎的 JavaScript 函式庫。而 微軟的 ASP.NET 中亦整合 jQuery 來輔助網頁程式的開發,其特色在於可以使 用 DOM(Document Object Model, 文件物件模型)14快速對 Web Form 上的欄 位進行操作,此功能可節省開發者不少的開發時間;另外對於一些畫面的呈現 如 CSS15、特效及動畫等也都有很足夠支援,也因此 jQuery 幾乎成為了開發網 頁中不可或缺的重要函式庫。

2.3.3 AJAX

AJAX(Asynchronous JavaScript and XML, 非同步的 JavaScript 與 XML 技 術) [13]指的是一套綜合了多項技術的瀏覽器端網頁開發技術。傳統的 Web 應 端採用 JavaScript 處理來自伺服器的回應。因為在伺服器和瀏覽器之間交換的 資料大量減少(大約只有原來的 5%),伺服器回應更快了。同時,很多的處理 工作可以在發出請求的客戶端機器上完成,因此 Web 伺服器的負荷也減少了。

14DOM(Document Object Model, 文件物件模型):是 W3C 組織推薦的處理可擴展置標語言的標 準編程介面。它是一種與平台和語言無關的應用程序介面,它可以動態地訪問程序和腳本,更 新其內容、結構和 www 文檔的風格。

15CSS:Cascading Style Sheets,一種用來為結構化文件(如HTML文件或XML應用)添加樣 式(字型、間距和顏色等)的電腦語言,由W3C定義和維護。

10

2.3.4 Highcharts

Highcharts[14] 是一個用純 JavaScript 編寫的一個圖表庫, 能夠很簡單便捷 的在 Web 網站或是 Web 應用程式添加有交互性的圖表,並且免費提供給個人 學習、個人網站和非商業用途使用。Highcharts 支援的圖表類型有曲線圖、區域 圖、柱狀圖、餅狀圖、散狀點圖和綜合圖表。Highcharts 介面美觀,由於使用 JavaScript 編寫,所以不需要像 Flash 和 Java 那樣需要外掛程式才可以運行,而 且運行速度快。另外 Highcharts 還有很好的相容性,能夠完美支持當前大多數 瀏覽器。現在官方的最新版本為 Highcharts-4.1.5。Highcharts 的主要特性包括:

1. 相容性:Highcharts 採用純 JavaScript 編寫,相容當今大部分的流覽 器,包括 Safari、IE 和 Firefox 等等;

2. 圖表類型:Highcharts 支援圖表類型,包括曲線圖、區域圖、柱狀圖、

餅狀圖、散狀點圖和綜合圖表等等,可以滿足各種需求。

3. 不受語言約束:Highcharts 可以在大多數的 WEB 開發中使用,並且對 個人用戶免費,支援 ASP,PHP,JAVA,.NET 等多種語言中使用。

4. 提示功能:Highcharts 生成的圖表中,可以設置在資料點上顯示提示效

11

程技術則使用運行在 Windows 系統內建的工作排程器[15]。這個工具也能讓使 用者建立、刪除、查詢、變更、執行和結束本機或遠端電腦上排定的工作。

2.5 超連結分析相關研究

在「網址還原探勘技術於傳播研究之應用:解析2012台灣總統大選Twitter 之新聞來源引用」的研究中[3],開發了社交媒體之探勘技術,透過資訊科技與 傳播研究結合,探討於Twitter上在2012台灣總統大選期間對於新聞來源之引 用。本研究參考其分析Twitter上超連結的方式,運用在臉書粉絲頁貼文中的超 連結分析。

12

第三章 系統設計與架構

3.1 系統設計原則

本研究之目的主要為了提供社會人文學者一個能分析 Facebook 粉絲頁貼文 內容的輔助系統,因此在系統設計時,除了必須考量到分析資料的穩定性及系 統效能之外,學者們的使用行為也須一併考量,才能讓本研究成果系統更貼近 學者們的使用需求。另外為考量本研究成果系統後續維護修改等議題,在程式 架構上必須也要著重於擴充性、延展性等,因此本系統的設計原則共有下列幾 點:

1. 前端操作頁面主要作為 Client 端使用者與系統間互動的圖形化介面,而後端 超連結擷取還原作業則為自動排程架構,兩者皆可獨立執行,並以資料庫資 料作為溝通的管道,其架構如下圖 3-1 臉書粉絲頁超連結分析系統架構。

圖 3- 1 臉書粉絲頁超連結分析系統架構

2. 簡化前端頁面操作流程,讓使用者能夠快速地熟悉應用本研究成果之系統。

13

3. 超連結擷取還原作業以工作排程方式採獨立進行,以定期檢查的方式來確保 資料的完整性,而每次作業間的資料軌跡都有另作紀錄,可作為日後觀察使 用。

4. 分析成果以圖形化介面方式展現,除了基本原始資料呈現,對於未來有可能 新增其他不同項目的分析成果也保留有擴充性。

臉書粉絲頁超連結分析系統技術架構如下圖 3-2 臉書粉絲頁超連結分析系 統技術架構,基於此架構,本研究總共開發出三個主要的功能模組,並由這三 個模組組成臉書粉絲頁超連結分析系統,模組架構圖如圖 3-3。

臉書粉絲頁超連結分析系統技術架構如下圖 3-2 臉書粉絲頁超連結分析系 統技術架構,基於此架構,本研究總共開發出三個主要的功能模組,並由這三 個模組組成臉書粉絲頁超連結分析系統,模組架構圖如圖 3-3。

相關文件