第三章 研究方法
第三節 資料收集方法
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
H6c. 在 “懷舊咖啡館”類 UGC 中,UGC 創作者與 UGC 搜索者之間,有相同 的城市別背景趨勢。
第三節 資料收集方法
與其他研究不太一樣的是,本研究並沒有採用傳統的問卷調查方式來收集資料,
而是直接採用小紅書公司的內部資料庫數據進行研究分析。之所以採用這種資料 收集方式,主要來源於以下兩方面的原因:
一方面,傳統的問卷調查方式有較為明顯的樣本偏誤。在碩士階段,論文研究大 部分都是採用網路問卷的形式,且基本都散播於各大專院校的社交媒體群組中。
這就導致了接觸到這些問卷的受訪者基本上都是在校學生,樣本同質性較高。這 種較為單一的樣本來源,在研究所需的目標群體不僅僅為學生群體時,就會產生 較大的樣本偏誤。
而本研究的目標群體為社會各界各年齡層對於懷舊有興趣的人,因此採用問卷調 查的方式,無論是樣本準確度亦或是研究成本方面,都不具有優勢。
另一方面,本論文偏向於實務研究,希望能夠最真實有效地直接將研究結果為企 業所用。因此,本篇論文在研究結果上,較為注重產出實際的商業效果,而非理 論效果。因此,筆者直接選擇了當下大陸最熱門的互聯網公司的商業資料庫進行 分析,而沒有採用一般的學術問卷調查的形式。
除此之外,本研究的研究對象其實包含了兩種類型的潛在消費者。第一類是,對 懷舊這個主題有興趣的人,具體的呈現行為可能是經常會在網路上搜尋懷舊相關 得資訊和文章。第二類是,對創作懷舊主題相關 UGC 有興趣的人,具體的呈現行 為可能是會定期在平臺上發佈懷舊主題相關文章和筆記,以吸引他人觀看。
從某種角度上來說,第二類消費者其實是包含於第一類消費者中。畢竟通常的邏 輯是,消費者要首先對一個主題感興趣,才會去持續產出這一主題的 UGC 內容。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
不難發現,第一類消費者和第二類消費者是密不可分的。因此,本研究會把這兩 類消費者的研究結果進行整合,一起呈現出懷舊行銷的完整商業版圖。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y 第四章 資料分析結果
因為本研究是直接採用小紅書商業資料庫的真實數據,所以並沒有筆者自行進行 數據採集的過程。在官方進行數據採集的過程中,小紅書的數據工程師團隊已經 對於數據有了初步的篩選和過濾,所以可以保證數據的純淨度和準確性。因此,
我們可以直接通過數據分析的結果,來對於前述假設進行驗證。
本研究使用的數據庫為“小紅書後台數據管理系統”,又可以稱為“Vela 系統”。 在懷舊類產品和服務目標客群的資料分析部分,本研究取得的數據時間維度均為 2020/01/01~2020/05/18,數據顆粒精確到每日。在懷舊類 UGC 的資料分析部分,
本研究取得的數據時間維度均為 2020/04/18~2020/05/18,數據顆粒精確到每日。
本研究使用的數據分析工具為 Excel 2016,主要會用到 ANOVA 分析,迴歸分析 以及敘述統計分析等統計工具。以下為本研究資料分析的結果:
第一節 懷舊類產品和服務目標客群的資料分析
在 H1. 性 別 與 懷 舊 需 求 的 關 係 部 分 , 我 們 會 從 Vela 數 據 庫 中 抓 取 2020/01/01~2020/05/18 期間,每一次搜索該懷舊產品的消費者的性別信息。值 得注意的是,我們的呈現結果是不同性別的消費者對於某種產品的搜索數量總和。
這裡的搜索數量是累積的數量,並不是搜索人數。舉例來說,A 君如果搜索了 5 次懷舊餐廳,那麼就會計入數據庫中 5 次。換句話說,例如男性用戶搜索懷舊餐 廳的數量為 50000,並不代表該段期間有 50000 位男性用戶搜索了懷舊餐廳,而 是代表小紅書的男性用戶在該段期間,總共搜索懷舊餐廳的次數為 50000 次。
同理,在 H2.年齡與懷舊需求和 H3.城市別與懷舊需求的部分,對應的搜索次數 也不是該年齡層或該城市別的消費者的總體搜索人數;而是代表該年齡層或該城 市別的消費者,在該期間內總共搜索了幾次對應的懷舊產品。
除此之外,這些用戶信息(性別/年齡/城市別)為小紅書用戶在註冊時所提供,
但非強制性提供,因此會出現部分資料缺失的情況。例如某用戶可能會提供他的 性別信息和城市別信息,但是拒絕提供其年齡信息,從而在年齡一欄顯示無數據。
‧
為了驗證 H1a 假設,我們需要取得在 2020/01/01~2020/05/18 期間內,所有搜索 過“懷舊”類別產品的用戶的性別信息。統計結果如表 4-1:
表 4-1 性別與“懷舊”類別搜索數量未編碼數據 性別 “懷舊”類別搜索數量
男 113481 女 908502
為了分析的方便,我們把男性消費者指定為編碼 1,女性消費者指定為編碼 2。
經過轉化後的數據結果如表 4-2:
表 4-2 性別與“懷舊”類別搜索數量已編碼數據 性別 “懷舊”類別搜索數量
1 113481 2 908502
我們把這個結果進行 ANOVA 單因子變異數分析,得到的結果如表 4-3:
表 4-3 性別與“懷舊”類別搜索數量 ANOVA 分析 ANOVA 分析
差異源 SS df MS F P-value F crit 組間 12318780100 1 12318780100
1987.6
7 0.0005
18.512 8 組內 12395221 2 6197610.5
總計 12331175321 3
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
我們可以發現該結果的 P 值為 0.0005<0.05,表明男性消費者對於懷舊類別的總 體需求與女性消費者對於懷舊類別的總體需求具有顯著差異。
我們接下來藉助敘述統計來確定到底男性對於懷舊類別的總體需求較高還是女 性對於懷舊類別的總體需求較高。我們可以發現男性消費者在該段時間內總共搜 索了 113481 次懷舊類產品,而女性消費者在該段時間內總共搜索了 908502 次懷 舊類產品。結合 ANOVA 分析的結果,我們可以確定女性消費者對於懷舊類產品的 總體需求顯著高於男性消費者,H1a 假設成立。
其次,為了驗證 H1b 假設,我們需要取得在 2020/01/01~2020/05/18 期間內,所 有搜索過“懷舊餐廳”類別產品的用戶的性別信息。統計結果如表 4-4:
表 4-4 性別與“懷舊餐廳”類別搜索數量未編碼數據 性別 “懷舊餐廳”搜索數量
男 29648
女 140171
為了分析的方便,我們把男性消費者指定為編碼 1,女性消費者指定為編碼 2。
經過轉化後的數據結果如表 4-5:
表 4-5 性別與“懷舊餐廳”類別搜索數量已編碼數據 性別 “懷舊餐廳”搜索數量
1 29648
2 140171
我們把這個結果進行 ANOVA 單因子變異數分析,得到的結果如下:
表 4-6 性別與“懷舊餐廳”類別搜索數量 ANOVA 分析 ANOVA 分析
差異源 SS df MS F P-value F crit 組間 1218568464 1 1218568464 44.018 0.02197 18.5128 組內 55366765 2 27683382.5
總計 1273935229 3
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
我們可以發現該結果的 P 值為 0.02197<0.05,表明男性消費者對於懷舊餐廳的 總體需求與女性消費者對於懷舊餐廳的總體需求具有顯著差異。
我們接下來藉助敘述統計來確定到底男性對於懷舊餐廳的總體需求較高還是女 性對於懷舊餐廳的總體需求較高。我們可以發現男性消費者在該段時間內總共搜 索了 29648 次懷舊餐廳,而女性消費者在該段時間內總共搜索了 140171 次懷舊 餐廳。結合 ANOVA 分析的結果,我們可以確定女性消費者對於懷舊餐廳的總體需 求顯著高於男性消費者,H1b 假設成立。
接著,為了驗證 H1c 假設,我們需要取得在 2020/01/01~2020/05/18 期間內,所 有搜索過“懷舊民宿”類別產品的用戶的性別信息。統計結果如表 4-7:
表 4-7 性別與“懷舊民宿”類別搜索數量未編碼數據 性別 “懷舊民宿”搜索數量
男 27345
女 115783
為了分析的方便,我們把男性消費者指定為編碼 1,女性消費者指定為編碼 2。
經過轉化後的數據結果如表 4-8:
表 4-8 性別與“懷舊民宿”類別搜索數量已編碼數據 性別 “懷舊民宿”搜索數量
1 27345
2 115783
我們把這個結果進行 ANOVA 單因子變異數分析,得到的結果如表 4-9:
表 4-9 性別與“懷舊民宿”類別搜索數量 ANOVA 分析 ANOVA 分析
差異源 SS df MS F P-value F crit 組間 996191406.3 1 996191406.3 55.9659 0.0174 18.5128 組內 35599922.5 2 17799961.25
總計 1031791329 3
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
我們可以發現該結果的 P 值為 0.0174<0.05,表明男性消費者對於懷舊民宿的總 體需求與女性消費者對於懷舊民宿的總體需求具有顯著差異。
我們接下來藉助敘述統計來確定到底男性對於懷舊民宿的總體需求較高還是女 性對於懷舊民宿的總體需求較高。我們可以發現男性消費者在該段時間內總共搜 索了 27345 次懷舊民宿,而女性消費者在該段時間內總共搜索了 115783 次懷舊 民宿。結合 ANOVA 分析的結果,我們可以確定女性消費者對於懷舊民宿的總體需 求顯著高於男性消費者,H1c 假設成立。
最後,為了驗證 H1d 假設,我們需要取得在 2020/01/01~2020/05/18 期間內,所 有搜索過“懷舊咖啡館”類別產品的用戶的性別信息。統計結果如表 4-10:
表 4-10 性別與“懷舊咖啡館”類別搜索數量未編碼數據 性別 “懷舊咖啡館”搜索數量
男 12652
女 59253
為了分析的方便,我們把男性消費者指定為編碼 1,女性消費者指定為編碼 2。
經過轉化後的數據結果如表 4-11:
表 4-11 性別與“懷舊咖啡館”類別搜索數量已編碼數據 性別 “懷舊咖啡館”搜索數量
1 12652
2 59253
我們把這個結果進行 ANOVA 單因子變異數分析,得到的結果如表 4-12:
表 4-12 性別與“懷舊咖啡館”類別搜索數量 ANOVA 分析 ANOVA 分析
差異源 SS df MS F P-value F crit 組間 254434401 1 254434401 23.357 0.04025 18.5128 組內 21786601 2 10893301
總計 276221002 3
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
我們可以發現該結果的 P 值為 0.04025<0.05,表明男性消費者對於懷舊咖啡館 的總體需求與女性消費者對於懷舊咖啡館的總體需求具有顯著差異。
我們接下來藉助敘述統計來確定到底男性對於懷舊咖啡館的總體需求較高還是 女性對於懷舊咖啡館的總體需求較高。我們可以發現男性消費者在該段時間內總 共搜索了 12652 次懷舊咖啡館,而女性消費者在該段時間內總共搜索了 59253 次懷舊咖啡館。結合 ANOVA 分析的結果,我們可以確定女性消費者對於懷舊咖啡 館的總體需求顯著高於男性消費者,H1d 假設成立。
綜上所述,我們在 H1.性別與懷舊需求的關係部分所提出的研究假說,經過數據 驗證,已經全部成立。在分析完性別與懷舊的數據之後,我們發現分析結果和研
綜上所述,我們在 H1.性別與懷舊需求的關係部分所提出的研究假說,經過數據 驗證,已經全部成立。在分析完性別與懷舊的數據之後,我們發現分析結果和研