本研究透過知名的旅遊虛擬社群 「背包客棧自助旅行論壇」,進行 資料抽樣與分析。「背包客棧自助旅行論壇」是國內最大自助旅行論壇,
網站開站至今已有 24 萬位會員以及 12 萬個旅遊主題,文章篇數也高達 1,13 萬 篇 ( 資 料 來 源 : 2008 年 背 包 客 棧 自 助 旅 行 論 壇 http://www.backpackers.com.tw/forum/),因此相當適合作為本研究的抽樣 對象。
本研究是觀察 2008 年 1 月到 12 月為期一年的時間,先以簡單隨機 抽樣的方式抽籤,決定要進入的主要討論區、次要討論區及次要子討論 區,直到進入次要子討論區其下的主題版面後,再以系統抽樣的方式抽 出每筆資料。如「背包客棧自助旅行論壇」之論壇頁面,將論壇內容分 類為十大主要討論區(第一層),分別是「東北亞」、「東南亞」、「紐澳及太 平洋諸島」、「歐洲」、「美洲」、「南亞」、「亞西」、「非洲」、「中國港澳」
及「台灣」等十大主要討論區,而各大主要討論區又各自再細分其下的 次要討論區(第二層),如在「東北亞」主要討論區裡,又細分為「日本關 東」、「日本北海道」、「韓國」、「東北亞精華區」、「日本關西」、「日本綜 合」及「蒙古國」等七個次要討論區,一般而言,在簡單隨機抽樣進入 第一層和第二層討論區後,便可進入主題版面,如「東北亞」主要討論 區(第一層)「日本關東」次要討論區(第二層)「日本關東」的主題版
面,但有少數討論區因為討論內容繁多,所以要簡單隨機抽樣到三層的 討論區,才可進入主題版面,如「東北亞」主要討論區(第一層)「日本 綜合」次要討論區(第二層)「日本九州」次要討論區(第三層) 「日本 九州」的主題版面,而主題版面是虛擬社群成員在此討論區下所發表的 主題(資料),每個主題(每筆資料)依發表或回應的時間順序,將最新的主 題(資料)置於主題版面的首頁。系統抽樣的方式就是針對主題版面內的各 主題(各筆資料)進行資料抽樣,而其所謂的「一筆資料」則是主題內所包 含的一筆發文與零至多筆的回文,其作法是抽取每月同一日之一筆資料 做為系統抽樣的間距,從1 月開始抽到 12 月為止,視為第一批資料抽樣。
於第一次抽樣時(第一批抽樣),在進入主題版面後,且在對各主題(各 筆資料)進行系統抽樣之前,會先採用簡單系統抽樣的方式從 1~28 號(因 為2 月只有 28 天)中抽取一個號碼,做為系統抽樣開始的第一筆資料,如 本研究在第一批抽樣中,以簡單隨機抽樣從1~28 個號碼中抽取 1 號(1 日) 做為系統抽樣之「每個月份的固定抽取日期」,即 1 月 1 日一筆、2 月 1 日一筆、…,到 12 月 1 日一筆止,完成第一批後即離開主題版面,回到
「背包客棧自助旅行論壇」之論壇頁面,再次進行上述之簡單隨機抽樣 及系統抽樣的步驟,以此類推。從第二批抽樣開始,皆是以每月1 號(1 日)做為系統抽樣之「每個月份的固定抽取日期」,然而,若是再次進入到 相同的主題版面,則不再對「每個月份的固定抽取日期」再做簡單系統
抽樣,而是直接將系統抽樣之「每個月份的固定抽取日期」改為2 號(2 日),依此類推,如假設第二批抽樣又進入相同的主題版面,則抽取 1 月 2 日一筆、2 月 2 日一筆、…,到 12 月 2 日一筆止。在抽樣的過程中,
凡遇同月同日多筆資料時,則依時間順序抽取時間最早的那一筆資料,
若遇當月份沒有「每個月份的固定抽取日期」這天的資料,則自動此筆 資料略過,繼續抽取下個月「每個月份的固定抽取日期」這天的資料,
如在抽樣的過程中,假設某主題版面2 月份裡的所有資料,若恰巧沒有 1 號(1 日)這筆「每個月份的固定抽取日期」的資料,則直接略過此筆資料。
因限於研究時間限制,本研究共蒐集500 筆資料為止。由於本研究的資 料蒐集是採用簡單隨機抽樣與系統抽樣的方式,而抽樣的過程也較為複 雜繁瑣,所以於此以範例一和範例二來做更詳細的說明,其說明如下。
範例一:背包客棧自助旅行論壇>東北亞>日本關東>日本關東主題版面 步驟一:
「背包客棧自助旅行論壇」之論壇頁面,將論壇內容分類為十大主 要討論區(第一層),分別是「東北亞」、「東南亞」、「紐澳及太平洋諸島」、
「歐洲」、「美洲」、「南亞」、「亞西」、「非洲」、「中國港澳」及「台灣」
等十大主要討論區,本研究以簡單隨機抽樣的方式抽出「東北亞」這個 主要討論區,如圖3-2 所示。
圖3-2 十大主要討論區(第一層)
資料來源(http://www.backpackers.com.tw/forum/index.php) 十大主要討論區(第一層)採用簡單隨機抽樣抽取「東北亞」主要討論區
步驟二:
進入「東北亞」主要討論區後又各自再細分其下的次要討論區(第二 層),分別是「日本關東」、「日本北海道」、「韓國」、「東北亞精華區」、「日 本關西」、「日本綜合」及「蒙古國」等七個次要討論區,本研究以簡單 隨機抽樣的方式抽出「日本關東」次要討論區,如圖3-3 所示。
圖3-3 次要討論區(第二層)
資料來源(http://www.backpackers.com.tw/forum/index.php)
次要討論區(第二層)採用簡單隨機抽樣抽取「日本關東」次要討論區
步驟三:
進入「日本關東」次要討論區後即可看到「日本關東」的主題版面,
如圖3-4 所示。
圖 3-4 主題版面(第三層) 資料來源
(http://www.backpackers.com.tw/forum/forumdisplay.php?f=43&order=desc
&page=141)
「日本關東」的主題版面(第三層)
步驟四:
在「日本關東」的主題版面裡,先以簡單隨機抽樣的方式抽出 1 號(1 日)作為系統抽樣的第一筆資料,而以每月抽取一筆資料作為系統抽樣的 間距,即資料的抽取為1 月 1 日、2 月 1 日、3 月 1 日、…、12 月 1 日,
如圖3-5 所示。
圖3-5 抽取第一筆資料 資料來源
(http://www.backpackers.com.tw/forum/forumdisplay.php?f=43&order=desc
&page=141)
先後採用簡單隨機抽樣與系統抽樣抽取
「日本關東」主題版面(第三層)的第一筆 資料
在「日本關東」的主題版面裡,由於虛擬社群成員的發文討論相當
熱絡,因此在同月同日常會出現多筆資料,若遇此情況系統抽樣則抽取 時間順序最早的一筆資料,於此2 月 1 日一共有 6 筆資料,抽取的資料 是時間順序最早(2008 年 2 月 1 日 10:49)的「東京 4 月初賞櫻之旅(最新 行程)」,如圖 3-6 所示。
圖 3-6 抽取資料(多筆的資料) 資料來源
(http://www.backpackers.com.tw/forum/forumdisplay.php?f=43&order=desc
&page=134)
「日本關東」主題版面(第三層)之同月同日 多筆資料時,則抽取時間順序最早的資料
範例二:背包客棧自助旅行論壇>東北亞>日本綜合>日本九州>日北九州 主題版面
步驟一:
同範例一之步驟一所示。
步驟二:
進入「東北亞」主要討論區後又各自再細分為七個次要討論區,本 研究以簡單隨機抽樣的方式抽出「日本綜合」次要討論區,如圖3-7 所示。
圖3-7 次要討論區(第二層)
資料來源(http://www.backpackers.com.tw/forum/index.php) 次要討論區(第二層)採用簡單隨機抽樣抽取「日本綜合」次要討論區
步驟三:
大部分的討論區在進入次要討論區後,即可看見其主題版面,但有 少數討論區因為討論內容繁多,所以要簡單隨機抽樣到三層的次要子討 論區後才可進入主題版面,在「日本綜合」次要討論區裡又分為「日本 九州」、「日本東北」、「日本沖繩」、「中部北陸」、「東海伊豆」、「日本四 國」等六個次要子討論區,本研究以簡單隨機抽樣的方式抽出「日本九 州」次要子討論區,如圖3-8 所示。
圖 3-8 次要子討論區(第三層)
資料來源(http://www.backpackers.com.tw/forum/forumdisplay.php?f=57) 次要子討論區(第三層)採用簡單隨機抽樣抽取
「日本九州」次要子討論區
步驟五:
進入「日本九州」次要子討論區後即可看到「日本九州」的主題版 面,如圖3-9 所示。
圖 3-9 主題版面(第四層) 資料來源
(http://www.backpackers.com.tw/forum/forumdisplay.php?f=138&order=desc
&page=21)
「日本九州」的主題版面(第四層)
步驟六:
方法同範例一之步驟四,延用先前簡單隨機抽樣抽出的 1 號(1 日)作 為系統抽樣的第一筆資料,再以每月抽取一筆資料作為系統抽樣的間 距,即資料的抽取為1 月 1 日、2 月 1 日、3 月 1 日、…、12 月 1 日。若 在系統抽樣的過程中同月同日出現多筆資料,系統抽樣則抽取時間順序 最早的一筆資料;反之,若當月沒有1 號(1 日)此筆資料則略過,繼續抽 取下個月1 號(1 日)的資料。在「日本九州」的主題版面裡,2007 年 12 月31 日之後的下一筆資料是 2008 年 1 月 3 日,由此可知缺少 1 月 1 日 此筆資料,如圖3-10 所示。
圖 3-10 抽取資料(缺少 1 月 1 日這筆資料) 資料來源
(http://www.backpackers.com.tw/forum/forumdisplay.php?f=138&order=desc
&page=21)
「日本九州」主題版面(第四層)缺少資料 1 月 1 日,因此略過此筆資料