以最高價準則為門檻 - 預測市場準確度之實證研究：準確度、變數與預測誤差

壹、前言

選舉預測市場（prediction markets）是透過電子期貨交易，將市場參與者的選情資訊彙整之新興機制，其交易價格為預測候選人是否當選或得票率的指標。

全球第一個以期貨市場交易模式為藍本的「預測市場」，是由美國愛荷華大學於

1988 年成立的「愛荷華電子市場 (Iowa electronic markets, IEM)」。「預測市場」

的特徵在於「提供適當獎懲機制」與「連續修正」。交易者根據公開資訊或私有資訊對未來事件的預測下單，未來事件的真實結果會決定交易者的報酬，而未來事件的均衡合約價格可視為整體市場對該事件發生與否的機率或落點的預測 (Agrawal et al, 2010:46-49)。

「預測市場」是讓參與者買賣「未來事件合約」的市場，參與者依據對價格走勢的判斷及事件發生結果的預測進行買賣，合約的價格可以做為預測該事件是否發生或如何發生的預測的參考。每個合約都會事先設定「所預測的事件」、

「清算標準」及「到期日」，合約到期時，由該事件「發生」、「未發生」或是「如何發生」決定該合約的清算價格。這個市場的運作類似一般的「期貨市場」，透過這個機制來彙整各方面的資訊預測未來事件發生的結果。舉例來說，

在一個有關選舉的「預測市場」中，參與者可以買賣各候選人當選的合約，其獲利或虧損由相同合約的買賣價差來決定，或由買賣價格與清算價格之價差來

決定。例如：在到期時，若該候選人當選則以價格 100 清算，曾經買進但尚未

賣出該合約的參與者即獲利，曾經賣出但尚未買進該合約即虧損。反之，若該

候選人落選則以價格 0 清算，曾經買進但尚未賣出該合約的參與者即虧損，曾

經賣出但尚未買進該合約即獲利。又例如：如果參與者買進或賣出「候選人得票率」的合約並持有到選舉結束，其獲利及虧損的多寡即由候選人實際得票率與買進或賣出該合約之差額決定。

利用「預測市場」進行預測所面臨的理論挑戰是：為什麼「預測市場」參與者交易的結果（價格）可以被當作一種預測的工具？「預測市場」預測工具的成效是否優於傳統的預測工具？關於第一個問題，預測市場背後的理論基礎是市場可以解決資訊的問題，市場價格可以準確預測資產的價格。一個競爭性市場將會透過價格機制達成市場效率，而且這是最有效彙整不對稱而分散的市場參與者資訊的手段，這便是「海耶克假說」(Hayek hypothesis) (Hayek, 1945;

Smith, 1982)。如果市場是有效率的，市場價格將充分反應所有可以獲得的資訊；

如果價格可以反應所有可獲得的資訊即是有效率的市場(Fama 1970)。根據理性預期理論，預測市場的價格是交易者可以獲得的所有資訊的統計量(Grossman,

1981; Sunder, 1995)。

最後，競爭性市場的價格提供彙整參與者公開與私人資訊的機制，而且可以同時彙整私人資訊的共識與分歧(Spann and Skiera, 2003; Gruca et al, 2005)。進一步而言，可以分成兩個途徑討論。第一個途徑假設所有「預測市場」交易者的平均預測就是最佳的預測。在這個出發點之下，理論上要解決的問題是：市場價格是否剛好會等於所有交易者的平均預測？以前述第一類的合約為例（即

報酬由特定事件發生與否決定），假定其報酬為「在特定事件發生為 1，否則

為 0」(Manski, 2006)。10 在每個交易者願意承擔的最大損失相同的假設之下，

Manski (2006)指出「認為事件發生的機率大於該價格的交易者佔所有交易者的比例恰好等於該價格」。如果將所有未來事件交易所的「0-100 型合約」設定合

約清算價格「特定事件發生為 100，否則為零」。交易者對事件發生機率的預

測取平均值，則這平均值會落在一個以均衡價格為中點的區間(半徑為均衡價格減均衡價格的平方)。此外，Wolfers and Zitzewitz (2006) 認為，在交易者效用為對數函數的假設之下，均衡價格等於所有交易者對事件發生機率預測值的加權平均。如果所有交易者的財富相同，均衡價格就等於所有交易者的平均預測。

在大多數的狀況下，即使放寬對效用函數的假設，Wolfers and Zitzewitz (2006) 發現結論也大致相同，所以預測市場的觀察者可以使用價格預測事件發生的機 Forsythe et al. (1992)、Forsythe et al. (1999) 和 Oliven and Rietz (2004)以「愛荷華電子市場」的資料進行的實證研究的支持。因此，「預測市場」參與者交易的結果（價格）可以被當作一種預測的工具。

「預測市場」和其他兩種常見的預測方法（民意調查和專家座談）的主要區別在於：預測市場獎勵擁有較佳資訊的參與者與連續不斷地透過交易而修正市場的預測（價格）。Kou and Sobel (2004)建構了一個簡單的數理模型以比較預測市場和民意調查的選舉預測能力。他們發現：市場價格的偏誤(bias)（各個

33 al.(2008, 285-300) 比對該市場與蓋洛普、哈里斯、紐約時報等大型媒體共 964 場民調，在 1988~2004 年間預測美國總統大選的表現，結果顯示預測市場的準

確率比傳統民調的次數高出 74%。其他說明預測市場準確度的文獻還包括：

Ortner (1998)、Pennock et al. (2001, 987-988)、Wolfers and Leigh (2002, 223-240)、

Brüggelambert (2004,742-768)、Servan-Schreiber et al. (2004,243-251)、Wolfers and Zitzewitz (2004, 107-126)、Gürkaynak and Wolfers (2005) 及 Leigh and Wolfers (2006, 325-340)。

然而，社會大眾對於選舉預測市場的最高價候選人，直覺預測該候選人將

34 (out-of-sample)測試，發現利用迴歸模型的樣本外預測結果並不好(Berg et al, 1997: 444-463)。以 1992、1996 及 2000 年的美國總統選為例，分析三種模型對

於預測誤差的判斷，包括市場微結構因素（交易人數、數量與共識）、長期價格

走勢、與隱含波動率(implied volatility)估計預測標準誤 (forecast standard deviation) (Berg et al, 2003)。他們認為，贏者全拿合約的預測市場價格可以作為交易者對得票率預測的信心程度的合理指標，但是也認為需要更多的資料來驗

為100 除以「有效候選人數 (Number of effective candidates)」。⁸然而，我們希望事前判斷事件結果，可是「有效候選人數」只能選舉結束後才能取得，因此這

本研究以未來事件交易所（http://xfuture.org）（童振源等，2009：131-166）之選舉期貨預測事件作為樣本，評估最高價準則在選舉預測市場的預測效果，並且建構四個鑑別模型在選舉前評估選舉預測事件之預測結果是否準確。

第二節說明研究方法與資料，第三節分析四個鑑別模型之鑑別力，第四節分析四個鑑別模型的預測力，第五節為結論。

貳、研究方法與資料

在「類別預測」最常使用的是 Logit 模型與鑑別分析模型(discriminant analysis, DA)，本研究也採用這兩種方法作為類別預測的機制。對自變數處理有 2 種方式：原始變數與主成份變數。我們運用主成份分析（principal component analysis，PCA）的優點，將「全面且大量」可用的變數全部納入模型體系，同時可避免共線性的問題，使研究者收集到的資料訊息極大化，完整的資訊可能讓預測工作更加準確。

一、Logit 模型與 DA 模型

本研究分析最高價準則成立與否（亦即，某選舉預測事件的價格為該選區的最高價，而且該選舉預測事件在選舉後確實發生；某選舉預測事件的價格並非該選區的最高價，而且該選舉預測事件在選舉後確實沒有發生），以虛擬變數 (dummy variable)之 0 或 1 表示。Carvalho et al.(1998:717-722), Hwang et al.

(1997:317-334)和 West (1985: 253-266)曾利用 Logit 迴歸作為預測的方法。本研

究先採用 Logit 迴歸模型，鑑別每一合約是否滿足最高價準則。其標準格式可

參考附錄1。

本研究使用 STATA 計量軟體得到 , , ⋯ , ，再運用文獻常使用的樣本平均數(sample mean)，作為我們 Logit 鑑別分組門檻。以本研究的最高價準則為例，在選舉前夕收集一組合約變數 , , ⋯ , ，輸入上一方程式等號右邊可算出一個配適值，此一數值若比樣本平均數大時，則我們判定該合約的加權平均價「符合」最高價準則，另一種情況，該合約的配適值小於樣本平均數時，

則本研究模型判定此合約價格可能「不符合」最高價準則。

另外一種方法是多變量的模型，利用 DA 分組樣本功能以鑑別選舉預測事

件的結果。例如，Blin and Whinston（1975:557-566）應用 DA 在多數決的投票研究。Mitchneck（1995:150-170）運用 DA 的區分樣本的特質，應用在地理經濟的議題，以及 Mitra et al.（2002:497-508）使用 DA 討論小型開放國家貿易保

護措施的影響。與 Logit 模型相似，僅需要依變數與自變數，所以其變數設定

上完全與Logit 相同。

Næs and Mevik (2001) 提出共線性問題的二種建議處理方式： PCR(PCA+Regression)以及 PLS(偏最小平方法)。本研究引用第一種方式處理共

線性的問題，亦即建構PCA+Logit 與 PCA+DA 的鑑別模型，同時亦進行原始變數的 Original-Logit 鑑別模型與 Original-DA 鑑別模型之分析。在自變數與依變

數各有兩種選擇下，我們將測試4 個模型的鑑別力與預測力，分類如下：

表2-2 四種預測模型分類

原始自變數主成份變數

Logit 迴歸 Original-Logit 模型 PCA-Logit 模型 DA 鑑別分析 Original-DA 模型 PCA-DA 模型

二、鑑別模型設定與預測說明

一般預測模型選前預測某一位候選人將會勝選，則其他候選人被預測將會落選。

傳統預測方式在這兩個候選人的預測上有完全相關性，很多統計理論無法適用。

然而，鑑別模型的最大優勢就是可規避，預測上的互斥且相關性之問題。直覺上，預測市場的最高價候選人會被預測當選，非最高價的參選人將被預測落選，

我們將這兩個面向結果，重新整合一個預測結論，被稱為「符合最高價準則」，

這個準則包括上述兩個面向。進一步來說，鑑別模型的推論僅分成：「符合」與

「不符合」最高價準則。以下我們以DA 鑑別模型之圖形說明：

圖2-1 DA 樣本外測試流程圖

選前最高價且選後當選

選前非最高價且選後落選

選前最高價且選後落選

選前非最高價且選後當選

符合最高價準則，

Fisher 1 函數：

不符合最高價準則，

Fisher 2 函數：

樣本內合約的結果

樣本外單一合約的 40 自變數資料：

∙ 鑑別數據1

∙ 鑑別數據2

數據比大

在文檔中預測市場準確度之實證研究：準確度、變數與預測誤差 (頁 35-62)