• 沒有找到結果。

以預測為目的的民調面臨巨大的挑戰

N/A
N/A
Protected

Academic year: 2022

Share "以預測為目的的民調面臨巨大的挑戰"

Copied!
35
0
0

加載中.... (立即查看全文)

全文

(1)

 「政治學研究方法的回顧與前瞻:

科技發展與科際整合」研討會 實證主義下的探索式資料分析:

復古?創新?

2018.6.2

中山大學政研所 劉正山  

(2)

幾個現象

• 民調目前面臨巨大的挑戰

• 實證主義者正往測量、實驗 & 因果關係大步邁進

• 也開始面對大數據思維及研究的衝擊

(3)

以預測為目的的民調面臨巨大的挑戰

成本巨大、涵蓋率降(代表性降)、政治的測量 &   測量的政治…

(4)

POLLS SEEM TO BE

TRUSTED…

(5)

AND NECESSARY

FOR DEMOCRACY

(6)

BUT THEY ARE NOT SEEN FAIR AND

OBJECTIVE…

(7)

POLLS ARE

POLITICAL.

(8)

民意調查目前學術上的主要應用面

描述、假設檢定、實驗( A/B TEST )

(9)
(10)

實證主義者正往實驗之路大步邁進

因果?

代表性?

(11)
(12)

如何面對大數據思維及研究的衝擊

HOW DO WE DO WITH THEORY?

(13)

傳統的長條圖和圓餅圖

(14)
(15)

透過問受訪者更深刻的問題

我們可以從調查資料中發掘更多的可能樣貌。

一般民調市調會偏重於詢問行為面及偏好的問題,但我們還可以問出更多關於價值觀的問 題。

(16)

WEB SAMPLE NOV. 11~29, 2016

(17)

你有想過,台灣民眾對於「獨立」的定義有很多種,而且很可能沒有什麼共識嗎?

(18)
(19)

用民調做探索式的資料分析

發掘世代之間的差異:

以18歲前後經歷重大政治事件作為切點,分出五個世代。

(20)
(21)
(22)

DATA SETS

• F2F SURVEY:

TAIWAN SOCIAL CHANGE SURVEY (TSCS) 2013 (N=1,952)

• CATI TELEPHONE SURVEY 2015 (N=1,100)

• WEB PANEL 2015-2016 (N=468)

(23)

第一世代( 1931 前出生)

(24)

第二世代( 1932~1953 出生)

(25)

第三世代( 1954~1968 出生)

(26)

第四世代( 1969~1978 出生)

(27)

第五世代( 1979~1988 出生)

(28)

4

1 2 3

5

(29)

跨題找到重要變數類別的組合

(30)
(31)

大數據背後的知識論給我們的啟示:

網調平台可以同步帶來學術及市場價值

• 透過網調平台,我們能夠從資料聆聽者(被動使用挖來或買來的數據)轉換為資 料創造者(主動透過發問收集到被研究對象價值和偏好)

• 網調 PANEL 能降低資料雜訊及帶來更快速的決策。

• 形成社群後所創造定群追蹤樣本,可以產生變數的合併帶來的巨大價值。

• 以網路數據作初探( PILOT STUD ),之後再啟動隨機電話調查,增加推論力度。

• 初探階段便可以進行隨機分派實驗,找出意義、樣貌,甚至是發現新理論。

(32)

探索式資料分析很復古

FACTOR ANALYSIS & EXPLORATIVE DATA ANALYSIS 早就有了 但以前使用類別型資料的民調同行 想都別想 

(33)

民調結合探索式資料分析卻也可以很創新

LAKATOS, Z. (2015). TRADITIONAL VALUES AND THE INGLEHART CONSTRUCTS.

PUBLIC OPINION QUARTERLY, 79(S1), 291–324.

HTTPS://DOI.ORG/10.1093/POQ/NFV005

(34)

結語:實證主義的分進 & 合擊

Evans & Aceves (2016) “Machine Translation: Mining Text for Social Theory.”

(35)

其他參考資料

• BLASIUS, J., & GREENACRE, M. (EDS.). (2014). VISUALIZATION AND VERBALIZATION OF DATA. CRC PRESS.

• HUSSON, F., LE, S., & PAGES, J. (2010). EXPLORATORY MULTIVARIATE ANALYSIS BY EXAMPLE USING R (1 EDITION). CRC PRESS.

• PAGÈS, J. (2014). MULTIPLE FACTOR ANALYSIS BY EXAMPLE USING R (1 EDITION). BOCA RATON:

CHAPMAN AND HALL/CRC.

• PASEK, J., JANG, S. M., COBB, C. L., DENNIS, J. M., & DISOGRA, C. (2014). CAN MARKETING DATA AID SURVEY RESEARCH? EXAMINING ACCURACY AND COMPLETENESS IN CONSUMER-FILE DATA.

PUBLIC OPINION QUARTERLY, 78(4), 889–916.

• ROUX, B. L., & ROUANET, H. (2009). MULTIPLE CORRESPONDENCE ANALYSIS. SAGE PUBLICATIONS.

參考文獻

相關文件

Additional Key Words and Phrases: Topic Hierarchy Generation, Text Segment, Hierarchical Clustering, Partitioning, Search-Result Snippet, Text Data

It costs >1TB memory to simply save the raw  graph data (without attributes, labels nor content).. This can cause problems for

• Utilize feedback from school administrations, teachers, and students to continuously make improvements. • Jointly interpret and make sense of data and generate ways to use

2 machine learning, data mining and statistics all need data. 3 data mining is just another name for

In developing LIBSVM, we found that many users have zero machine learning knowledge.. It is unbelievable that many asked what the difference between training and

• Information retrieval : Implementing and Evaluating Search Engines, by Stefan Büttcher, Charles L.A.

This bioinformatic machine is a PC cluster structure using special hardware to accelerate dynamic programming, genetic algorithm and data mining algorithm.. In this machine,

We try to explore category and association rules of customer questions by applying customer analysis and the combination of data mining and rough set theory.. We use customer