• 沒有找到結果。

手機市場有 HTC、Samsung 等等,筆記型電腦市場則有 Asus、DELL、HP 等等。

此外,也有一些品牌跨足多類智慧型攜帶裝置產品,如 Apple 有 iPhone、iPad 與 Mac 橫跨三類產品。每一個產品的品牌、系列、型號名稱都是有可能的搜尋 關鍵字,因此我們將以這三種關鍵字的類型分別蒐集文章。

接著是文章來源。我們將鎖定文章的來源為兩個國內主要的網路論壇,分別 是台大批踢踢實業坊網頁版11(下稱「批踢踢」)以及 Mobile0112。批踢踢是電子 布告欄系統(Bulletin Board System; BBS)台大批踢踢實業坊的網頁版本,也是 國內最大的 BBS 站。根據官方的流量統計13,批踢踢每日平均有 8 到 9 萬人同時 在線。其站內討論的主題相當廣泛,而各個不同的討論主題之間則以「看板」的 形式區隔,其中和攜帶型智慧裝置有關的綜合看板主要有 nb-shopping(筆記型 電腦與平板電腦交易板)以及 MobileComm(手機板),而較知名的廠商也可能 會擁有專屬的看板,如 iPhone、Android、BlackBerry、WindowsPhone 等等。

Mobile01 是國內知名的以網路和 3C 為主的綜合性網路論壇,其中和攜帶型智慧 裝置有關的綜合討論區主要有攜帶型電腦綜合討論區以及智慧型手機綜合。和批 踢踢類似,各大廠商會有各自專屬的討論區。此外,由於 Apple 橫跨多類產品,

Mobile01 也為 Apple 開設一個專屬的分類。本研究的語料庫文章數量將在兩個論 壇之間平衡,但是由於各論壇的產品分類方式不同,所以我們不在各討論區和看

12 http://www.mobile01.com/

13 http://www.ptt.cc/statistics.html

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

列同名,如 iPad,導致在搜尋時無法確認該文章的意見目標是系列或型號。因此 在選擇型號名稱時,我們指定與系列名稱不同的產品型號作為搜尋目標。本研究 對於各類產品所選擇的品牌、系列、型號關鍵字如表 2 至表 4 所示。

我們使用的搜尋引擎為目前主流的搜尋引擎 Google,而在搜尋之前,必須 先刪除瀏覽器中所有的 Cookie 與瀏覽紀錄,以避免前面的搜尋干涉到後面的搜 尋結果。此外,在蒐集來自 Mobile01 論壇的文章時,必須在查詢的欄位加上關 鍵字「site:www.mobile01.com/topicdetail.php」;同樣地,在蒐集來自批踢踢的文 章時,也必須加上「site:www.ptt.cc/bbs/」。如此才能鎖定搜尋範圍到論壇中由使 用者發布在討論區或看板上的文章。

表 2 智慧型手機的品牌、系列、型號關鍵字列表

品牌 系列 型號

Apple iPhone iPhone 5s HTC Butterfly Butterfly s Nokia Lumia Lumia 920 Samsung Galaxy Galaxy s4 Sony Xperia Xperia Z 華為 Ascend Ascend G700

表 3 平板電腦的品牌、系列、型號關鍵字列表

品牌 系列 型號

Acer Iconia Iconia A1 Apple iPad iPad mini Asus Nexus Nexus 7 LG G Tablet G Tablet 8.3 Samsung Galaxy Note Galaxy Note 3 Sony Xperia Tablet Xperia Tablet Z

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

表 4 筆記型電腦的品牌、系列、型號關鍵字列表

品牌 系列 型號

Acer Aspire Aspire S7 Apple MacBook MacBook Air Asus ZENBOOK ZENBOOK UX301 DELL Inspiron Inspiron 14

Lenovo ThinkPad X ThinkPad X230 Toshiba PORTEGE R PORTEGE R930

本研究以自行撰寫的網路爬蟲程式蒐集文章。由程式對 Google 下關鍵字搜 尋後,取得 Google 的搜尋結果網頁,而 Google 的搜尋結果都位於 HTML 的標 題標籤「<h3 class=”r”>」內的超連結標籤「<a>」中(圖 4)。接著程式從每一筆 搜尋結果中取得該標籤的文字和超連結網址。針對每個網址,我們將同樣以網路 爬蟲連至對應的網站並蒐集其 HTML 檔。

圖 4 Google 搜尋結果網頁與部分原始碼(以三星為例)

根據表 2 至表 4,我們應有 54 個關鍵字,但其中部分的品牌關鍵字有重複 出現,如 Apple。扣除重複出現的品牌後,共計有 48 個關鍵字。每個關鍵字則

隔標籤「<div class=”single-post-content”>」內的第一個分隔標籤「<div>」內,

如圖 5。另外,現今以網頁為介面的網路論壇或社群網站多有提供由該網站自訂

相關文件