二、研究方法設計與資料蒐集方法

2. 彈幕「悅 T 人」之「悅」的具體意涵有哪些？

根據上述研究問題，本研究以中國最大的彈幕網站 Bilibili 彈幕網自 2009 年 9 月網站正式投入運營後五年內的點擊與收藏排行數據為母體（張濤，2015），選擇影片《【古箏】千本櫻》為研究案例，一方面是因為它在 Bilibili 開展六年來的榜單中，觀看次數（點擊量）和收藏數（點讚量）排名皆為第一，可代表大多彈幕影片觀眾的興趣取向；另一方面因本影片係由Bilibili 網站取名「墨韻隨步搖」的「UP 主」用古箏翻奏日本著名虛擬偶像初音未來的名曲《千本櫻》作品，影片的彈奏者與拍攝者都是這位上傳者，這代表本影片乃是彈幕網站最具代表性的 KGC（key opinion leader generated content，關鍵意見領袖製造內容）作品。且該影片自上傳至今，始終保持著一定的活躍度，綜合看來，該影片的時長及本身所具有的代表性都較為適合作為本研究對彈幕的初探性研究。

本文以立意抽樣方式，抓取該影片在 2016 年春節假期八天（2 月 7-14 日）內將近 7,768 則後臺彈幕數據，將其作為研究對象。選擇這個區間是因其包括了完整的工作與休息日週期（一星期），又同時跨越了中式（春節）、西式（情人節）兩個節慶，當能涵括彈幕文本表達的豐富性。

1. 將抓取的彈幕數據按天篩分

彈幕文本動輒成千上萬，逐個分析並不實際，從彈幕網站後臺以

「天」為單位抓取歷史彈幕，將代表某個具體日期的代碼發送至網站後

臺請求彈幕之後，會出現下圖：

圖 1：歷史彈幕後臺數據截圖

註：資料截取日期：2016 年 3 月 12 日。

上圖中倒數三排是代表每則各方面信息的代碼，圖中被框起的

<maxlimit>及<max_count>兩則信息，前者表示該彈幕影片被設定的每日彈幕池容納彈幕數量上限，即每日最多可被收入歷史彈幕數據庫中的彈幕則數；而後者則是當日被收入歷史彈幕數據庫當中的實際彈幕數量。而上表中兩者皆為 1000。這種重複並非是一種巧合，本研究選擇收集的八天彈幕文本中每日歷史彈幕信息可整理為下表：

表 1：本研究搜集彈幕文本之數據庫綜合信息日期新增彈幕數 max_count 1 2016/2/7 899 1000 2 2016/2/8 1071 1000 3 2016/2/9 1016 1000 4 2016/2/10 902 1000 5 2016/2/11 1044 1000 6 2016/2/12 1002 1000 7 2016/2/13 967 1000 8 2016/2/14 1066 1000 註：表格為研究者自行整理。

由上表可知，無論當日新增彈幕的實際數量大於或小於 1000 則，

最終被數據庫收納的彈幕數量都是 1000 則。這就表明，當該日實際新增彈幕數量大於1000 則（如 2 月 8 日、9 日、11 日、12 日及 14 日）

時，並非所有的當日彈幕文本都會被收入歷史彈幕數據庫，而剩下每日新增彈幕不足 1000 則的三天中，彈幕網站後臺也會用非當天的彈幕文本來湊齊1000 則彈幕保存入歷史彈幕數據庫。

2. 釐清彈幕網站後臺保存數據的原則

若要釐清歷史彈幕數據庫選擇需刪除以及需補充的彈幕之原則，可使用以下步驟進行操作：

經對比解碼後的每日彈幕具體文本對應的實際發送時間可知，數據庫的收納方式是以當日 24:00 為時間起點，逆時向前抓取，以 1000 則為定量，若當日之新增彈幕多於彈幕池所設定的上限 1000 則，那麼，

當日早期發送的「多餘」彈幕則會被洗掉，不知所蹤；若當日之新增彈幕不足 1000 則，那麼，逆時抓取會跨過當日繼續向前一日進行操作，

將前一日線性時間後段發送的彈幕抓取相應數量補足 1000 則收納入當日彈幕數據庫。

這種數據搜集方式也導致在合併八天的歷史彈幕文本之後一些彈幕文本會重複出現，因其分別被收入相鄰兩天的歷史彈幕數據庫中，而一些原有的彈幕數據也會因是超過 1000 則的早期「多餘」彈幕而消失不見。

3. 篩除完全重複的彈幕文本

為篩除上述歷史彈幕保存原則所導致的完全重複的彈幕文本，本研究使用SAS 工具合併並比對了歷史彈幕庫中八天共計 8000 則彈幕，並最終得出有效的 7768 則彈幕文本。需要說明的是，「完全重複」的彈

幕文本不僅指的是彈幕文本內容相同，還包括彈幕發送者的 ID、發送的實際時間、彈幕顯示的虛擬時間點以及彈幕顏色、類型等種種訊息完全相同的彈幕。

為了區辨與進一步分析這近 8000 則錯綜複雜的彈幕文本，本文考慮到「彈幕」所展現出的大量話語疊加性特點，選擇先自「詞頻分析」

入手，透過統計其重複率來衡量重要性，然後輔以時序分析將完全重複的文本篩除，並將剩下的有效彈幕分類整理，進一步通過互文性分析以探究其表達之特色，具體地探究其出現情境及脈絡。

總而言之，本文結合詞頻分析、時序分析與互文性分析三種研究方法，探尋文本背後的彈幕科技所塑造出的特殊互動情境，以及這種情境中的「悅T 人」究竟「悅」從何來。

在文檔中「悅 T 人」的彈幕：虛擬即時之互文情境下的遊戲 (頁 24-27)