預測市場準確度之實證研究：準確度、變數與預測誤差

(1)

科技部補助專題研究計畫成果報告

期末報告

預測市場準確度之實證研究：準確度、變數與預測誤差(第

3 年)

計畫類別：個別型計畫計畫編號： NSC 99-2628-H-004-001-MY3 執行期間： 101 年 08 月 01 日至 103 年 07 月 31 日執行單位：國立政治大學國家發展研究所計畫主持人：童振源共同主持人：林繼文計畫參與人員：碩士級-專任助理人員：林鴻文碩士班研究生-兼任助理人員：蔡宛臻碩士班研究生-兼任助理人員：陳建希碩士班研究生-兼任助理人員：郭俊宇碩士班研究生-兼任助理人員：許富翔碩士班研究生-兼任助理人員：郭曜禎碩士班研究生-兼任助理人員：林佑龍碩士班研究生-兼任助理人員：楊婷安博士班研究生-兼任助理人員：王國臣博士後研究：周子全報告附件：移地研究心得報告出席國際會議研究心得報告及發表論文處理方式： 1.公開資訊：本計畫涉及專利或其他智慧財產權，1 年後可公開查詢 2.「本研究」是否已有嚴重損及公共利益之發現：否 3.「本報告」是否建議提供政府單位施政參考：否

(2)

(3)

中文摘要：本研究成功建構預測市場的最適價格門檻，作為判定預測事件是否發生的依據，將事件發生的機率預測（probabilistic forecasting）轉換成事件發生與否的類別預測（categorical forecasting），作為公共政策與企業決策的重要依據。以 2006-2011 年的未來事件交易所 7,881 個預測事件樣本分析，本研究透過計算所有價格的準確率尋找最適價格門檻，並且比較價格 50 門檻與最高價門檻準則的準確率。本研究發現：全部預測事件樣本的最適價門檻為價格 60，其判定預測事件的準確率比價格 50 門檻與最高價門檻準則都要高，具有統計上的顯著性，並且通過樣本外測試。其次，根據預測市場(prediction market)的文獻，預測選舉已有良好預測準確率，但該準確率是事後的、總體的，而非更有實際價值的事前、個別選舉合約預測的鑒別準確率。本研究建構四個鑑別選舉預測市場準確度的模型，在選前針對每個選舉合約的預測準確度進行鑑別。根據預測市場在選前一天提供選舉合約的 40 個原始變數資訊，Logit 模型最能精準判斷那些選舉合約會符合最高價準則的準確預測合約。本研究以「2008 年總統選舉」、「2009 年縣市長選舉」及「2010 年五都市長選舉」做為樣本外測試的樣本，使用原始變數的 Logit 模型之預測力均高於其他模型。Logit 模型的樣本外鑑別正確準確率均為 100％，但是，Logit 模型對於鑑別未正確預測組的預測能力仍須改善。中文關鍵詞：預測市場、機率預測、類別預測、最適價格門檻、支援決策、臺灣選舉預測、選舉預測市場、鑑別模型、預測準確率、邊際交易者

英文摘要： We successfully construct a methodology to find optimal price thresholds for prediction markets as the basis of categorizing the occurrence of the prediction events. This method enables us to transform the probabilistic forecasting of event occurrence to the categorical forecasting, thereby creating an important reference for public policy and corporate decision-making. Based upon 7,881 samples of prediction events from the Exchange of Future Events between 2006 and 2011, we determine optimal price thresholds and compare the accuracy rates with those obtained by two benchmark rules. This paper finds that the price of 60 is the optimal price

(4)

accuracy rate higher than those obtained by the common threshold of 50 and the highest-price threshold. The superiority is statistically significant and is also robust in out-of-sample tests.

In addition, according to literature, election prediction markets have excellent accuracy rates of prediction. However, one can only acknowledge the prediction results after the elections and cannot discriminate the accuracy rates of particular election predictions prior to the elections. Our research constructs four models to discriminate the accuracy rate of each election contract prior to the election. According to the information of 40 original variables collected from the election contracts in the prediction markets, the Logit model can precisely discriminate which election contracts with the

highest price criteria of predictions will be likely correct. In addition to the complete sample model, our research uses election contracts of the 2008 presidential election, the 2009 magistrate and mayoral elections, and the 2010 five-metropolis

mayoral elections as out-of-sample tests. In terms of prediction accuracy, the Logit model using 40

original variables is the best among the four discrimination models. The accuracy rates of discrimination of the Logit model for correct predictions are all 100%. Nevertheless, the Logit model＇s prediction ability for discriminating incorrect prediction groups needs to be improved.

英文關鍵詞： prediction markets, probabilistic forecasting, categorical forecasting, optimal price threshold, decision-making support, election predictions in Taiwan, election prediction markets, discrimination model, prediction accuracy, marginal trader.

(5)

1

科技部補助專題研究計畫成果報告

（

□期中進度報告/V 期末報告）

預測市場準確度之實證研究：準確度、變數與預測誤差

計畫類別：v 個別型計畫 □整合型計畫

計畫編號：MOST 99 －2628－H －004 －001－MY3

執行期間：2010 年 8 月 1 日至 2014 年 7 月 31 日

執行機構及系所：國立政治大學國家發展研究所

計畫主持人：童振源

共同主持人：林繼文（中央研究院政治學研究所）

計畫參與人員：林鴻文、陳建希、許富翔、林佑龍、王國臣、蔡宛臻、

郭俊宇、郭曜禎、楊婷安、周子全

本計畫除繳交成果報告外，另含下列出國報告，共 _2_ 份：

v 執行國際合作與移地研究心得報告

v 出席國際學術會議心得報告

期末報告處理方式：

1. 公開方式：

v 非列管計畫亦不具下列情形，立即公開查詢

□涉及專利或其他智慧財產權，□一年□二年後可公開查詢

2.「本研究」是否已有嚴重損及公共利益之發現：v 否 □是

3.「本報告」是否建議提供政府單位施政參考 □否 □是，（請列舉提供之單

位；本部不經審議，依勾選逕予轉送）

中華民國 103 年 7 月 17 日

(6)

2 中文摘要本研究成功建構預測市場的最適價格門檻，作為判定預測事件是否發生的依據，將事件發生的機率預測（probabilistic forecasting）轉換成事件發生與否的類別預測（categorical forecasting），作為公共政策與企業決策的重要依據。以 2006-2011 年的未來事件交易所 7,881 個預測事件樣本分析，本研究透過計算所有價格的準確率尋找最適價格門檻，並且比較價格50 門檻與最高價門檻準則的準確率。本研究發現：全部預測事件樣本的最適價門檻為價格60，其判定預測事件的準確率比價格50 門檻與最高價門檻準則都要高，具有統計上的顯著性，並且通過樣本外測試。其次，根據預測市場(prediction market)的文獻，預測選舉已有良好預測準確率，但該準確率是事後的、總體的，而非更有實際價值的事前、個別選舉合約預測的鑒別準確率。本研究建構四個鑑別選舉預測市場準確度的模型，在選前針對每個選舉合約的預測準確度進行鑑別。根據預測市場在選前一天提供選舉合約的40 個原始變數資訊，Logit 模型最能精準判斷那些選舉合約會符合最高價準則的準確預測合約。本研究以「2008 年總統選舉」、「2009 年縣市長選舉」及「2010 年五都市長選舉」做為樣本外測試的樣本，使用原始變數的 Logit 模型之預測力均高於其他模型。Logit 模型的樣本外鑑別正確準確率均為 100％，但是，Logit 模型對於鑑別未正確預測組的預測能力仍須改善。關鍵字：預測市場、機率預測、類別預測、最適價格門檻、支援決策、臺灣選舉預測、選舉預測市場、鑑別模型、預測準確率、邊際交易者

(7)

3

Abstract

We successfully construct a methodology to find optimal price thresholds for

prediction markets as the basis of categorizing the occurrence of the prediction events. This method enables us to transform the probabilistic forecasting of event occurrence to the categorical forecasting, thereby creating an important reference for public policy and corporate decision-making. Based upon 7,881 samples of prediction events from the Exchange of Future Events between 2006 and 2011, we determine optimal price thresholds and compare the accuracy rates with those obtained by two

benchmark rules. This paper finds that the price of 60 is the optimal price threshold for the all sample studied, which yields an accuracy rate higher than those obtained by the common threshold of 50 and the highest-price threshold. The superiority is

statistically significant and is also robust in out-of-sample tests.

In addition, according to literature, election prediction markets have excellent accuracy rates of prediction. However, one can only acknowledge the prediction results after the elections and cannot discriminate the accuracy rates of particular election predictions prior to the elections. Our research constructs four models to discriminate the accuracy rate of each election contract prior to the election. According to the information of 40 original variables collected from the election contracts in the prediction markets, the Logit model can precisely discriminate which election contracts with the highest price criteria of predictions will be likely correct. In addition to the complete sample model, our research uses election contracts of the 2008 presidential election, the 2009 magistrate and mayoral elections, and the 2010 five-metropolis mayoral elections as out-of-sample tests. In terms of prediction accuracy, the Logit model using 40 original variables is the best among the four discrimination models. The accuracy rates of discrimination of the Logit model for correct predictions are all 100%. Nevertheless, the Logit model’s prediction ability for discriminating incorrect prediction groups needs to be improved.

Keywords: prediction markets, probabilistic forecasting, categorical forecasting, optimal price threshold, decision-making support, election predictions in Taiwan, election prediction markets, discrimination model, prediction accuracy, marginal trader.

(8)

4

以預測市場匯聚資訊支援決策之方法：從機率

預測到類別判定

1. 緒論

「預測市場」，又稱之為「資訊市場」，其運作類似一般的「期貨市場」，讓參與者買賣「未來事件合約」的期貨市場，透過這個網路平台機制來彙整各方面的資訊，預測未來事件發生的結果，或者匯聚眾人的智慧，判斷未來事件的發展趨勢與眾人偏好。透過預測市場的資訊匯流所達成的預測與創新功能比起傳統的民意調查、焦點團體或訪談調查更具有優勢，能夠領先、即時、連續、長期提供決策與避險的重要參考依據。最近 25 年來，「預測市場」（prediction markets）的研究方法已經普遍被運用到預測各類事件或領域，包括政治、經濟、運動、娛樂、產品開發、政策研發、商業活動及企業管理等等。目前較為活耀的公開預測市場包括：愛荷華電子市場（Iowa Electronic Markets）、好萊塢證劵交易所（Hollywood Stock Exchange）、Intrade、iPredict、遠見交易所（Foresight Exchange）、及未來事件交易所（Exchange of Future Events）。1

2007 年 5 月，包括 Kenneth Arrow, Daniel Kahneman, Thomas Schelling 與 Vernon Smith 四位諾貝爾經濟學獎得主在內的二十五位知名經濟學家連署發表「預測市場宣言」（Statement on Prediction Markets）。他們共同認為預測市場可以顯著提昇公部門和私部門的決策品質（Arrow et al., 2007）。隔年 5 月， Arrow 再度領銜二十二位經濟學家，在著名的《科學》（Science）雜誌發表「預測市場的許諾」（The Promise of Prediction Markets），再次強調群眾智慧的預測能力（Arrow et al., 2008）。已有不少國際大企業利用預測市場的網路平台開發公司員工的集體智慧或匯聚眾人資訊協助企業進行決策，至少包括惠普（HP）、雅虎（Yahoo）、微軟（Microsoft）、英特爾（Intel）、奇異（General Electric）、百思買（Best Buy）、良策（Rite-Solution）、西門子（Siemens）及谷歌（Google）。這些大企業預測標的包括產品研發、銷售預測、財務狀況、行銷策略等公司重要發展指標（LaComb et al., 2007; Spears et al., 2009; Lavoie, 2009; Soukhoroukova et al.,

1_{網址分別為：www.biz.uiowa.edu/iem；www.hsx.com；www.intrade.com；www.ipredict.co.nz；}

(9)

5 2012）。說明預測市場的準確性高於其他預測方法的文獻相當豐富，顯示預測市場作為資訊彙整的平台已經相當成熟。比對預測市場與蓋洛普、哈里斯、紐約時報等大型媒體共 964 場民調，在 1988~2004 年間預測美國總統大選的表現，結果顯示預測市場的準確率比傳統民調的次數高出74% （Berg et al., 2008）。其他文獻至少包括：（Ortner, 1998; Pennock et al., 2001; Wolfers and Leigh, 2002; Brüggelambert, 2004; Servan-Schreiber et al., 2004; Wolfers and Zitzewitz, 2004; Gürkaynak and Wolfers, 2005; Leigh and Wolfers, 2006; Tung et al., 2011）。

「預測市場」的預測標的可以分成兩類預測事件：「是否發生型」事件與「落點預測型」事件。「是否發生型」事件是預測某事件是否發生，例如某候選人是否當選或台股指數是否上萬點；「落點預測型」事件是預測該事件的落點，例如候選人得票率或經濟成長率。絕大部分的上述文獻都是針對「落點預測型」事件的預測結果進行實證分析，比較與傳統預測方法的預測準確度。針對「是否發生型」事件的預測結果，已有研究都顯示（Manski, 2006; Gjerstad, 2005; Wolfers and Zitzewitz, 2006; Christiansen, 2007; Ottaviani and Sorensen, 2007），預測市場的價格可以視為預測事件發生的機率。近期研究也顯示（童振源等人，2011a，2011b），預測市場的預測事件價格可以作為候選人當選之機率。然而，「是否發生型」事件的結果只有該事件是否發生，關切重點應該是預測市場對該預測事件結果的預測是否會發生，而不是該預測事件結果發生的機率，因為很多決策或避險是建立在該事件是否發生的基礎上。因此，本研究將利用未來事件交易所的交易資料，建構預測市場的最適價格門檻，作為判定預測事件是否發生的依據，將事件發生的機率預測（probabilistic forecasting ）轉換成事件發生與否的類別預測（ categorical forecasting）。因應政府與企業等預測單位之需要，本研究透過計算所有價格的準確率尋找最適價格門檻，將預測市場客觀產生的最終交易價格（反映事件發生機率），轉換成事件發生與否的判定基準及公共政策與企業決策的重要依據。文獻上使用「門檻」的觀念經常出現在天氣預報、醫療診斷、圖形判讀等研究。例如，天氣預報必須設下最佳門檻規則，以判別「雨天」、「陰天」、「多雲」等天氣型態，門檻設定攸關預報的準確度與效益（Murphy, 1977; Murphy and Brown, 1984）。在醫療行為上，每項醫療診斷需要一個標準門檻，作為是否積極治療的依據，使得發生誤診的機率達最低（Pauker and Kassirer, 1980）。其他門檻研究：以區別分析方法建構門檻辨識灰色圖像（Otsu, 1979）；

(10)

6

使用最小誤差法應用在影像分類軟體，其最小誤差法亦具備極大化分組準確率的基礎（Kittler and Illingworth, 1986）。

童振源等人（2011a）及童振源等人（2011b）針對 2006-2009 年的台灣選舉預測事件研究，以預測事件的最後一天加權平均價格超過某特定價格門檻，則預測市場預測該事件會發生；如果預測事件的最後一天加權平均價格低於某特定價格門檻，則預測市場預測該事件不會發生。他們以價格 100 除以有效候選人數（number of effective candidate，NEC）作為價格門檻。2在選舉研究當中，「有效候選人數」是衡量選舉競爭激烈程度，其概念上，同一選區兩位候選人的得票率相當，且該選區其他候選人的得票率接近零，則 NEC 會趨近 2；同理，三位候選人的得票率不相上下，則 NEC 會接近 3；因此「有效候選人數」愈大，則選舉競爭愈激烈，則每位候選人當選機率愈低（Cox, 1997）。因此，預測事件的最後一天加權平均價格超過此價格門檻，則表示該預測事件應該會發生。他們也以價格50（事件發生機率為 50％）及最高價（在同一個選區的候選人當中，最高價的預測事件發生機率最高）作為選舉預測事件的價格門檻，進行穩健性測試。但是，前述的研究並沒有比較以上三種價格門檻對於選舉預測準確度的影響，只是將價格 50 與最高價作為穩健性測試的門檻。在三種門檻的命中率當中，價格 100 除以有效候選人數作為價格門檻的表現似乎較好，但是缺乏全面而有系統的比較分析，而且僅侷限在選舉預測事件。McHugh and Jackson（2012）分析 357 個是否預測型事件，發現價格門檻從價格 55 到 80 變動都不會影響到市場預測的準確率。可惜樣本太少，而且沒有詳細的分析資料。價格是預測市場的最重要訊息，是各種資訊彙整的均衡結果。然而，每個預測事件的特徵及交易過程都不一樣，難以一概而論每個預測事件是否有一致的價格門檻。不過，為了方便判定預測事件的預測結果是否發生，我們確實需要一個適當的價格門檻判定該預測事件是否發生，而不是將價格當作該預測事件的發生機率。因此，本研究的目的即是尋找最適當的價格門檻，極大化預測市場的預測準確率，以便預先判定預測事件的預測結果是否會發生，讓我們適當管控該事件發生與不發生的相關風險，或進行該事件相關的決策。除了傳統上的價格 50 門檻及最高價門檻之外，本研究將建構最適價格門檻 2 有效候選人數的定義為： NEC _∑ ，其中為第 i 個候選人的得票率，為候選人數。「有效合約數量」、「事件合約數量」、「合約交易筆數」、「合約交易人數」、「合約可交易天數」與「合約交易口數」等變數對於最適門檻和準確率詳細討論請參見附錄 1。

(11)

7 作為判定預測事件是否發生的準則。此外，童振源等人（2011a）與童振源等人（2011b）均分析價格 100 除以有效候選人數的價格門檻，但是本研究並不只針對選舉，所以希望建構最適價門檻，以便一體適用到其他類型預測事件。本研究章節安排如下：第二節為研究方法與資料敘述，第三節為全部預測事件的最適價門檻準則之實證分析，第四節為各類型預測事件的最適價門檻準則之實證分析，第五節為三種價格門檻準則的樣本外測試與比較，最後則是結論。

2. 研究方法與資料

本研究的資料來源為未來事件交易所在 2006 月 7 月至 2011 年 8 月所有「是否發生型」預測事件，3但不包括個別預測事件，一個預測事件組至少有兩個預測事件，才能進行最高價門檻的準確率計算與比較。減去交易量為零的預測事件，全部的預測事件數量共計 7,881 個，政治類有 867 個、選舉類（一定是政治類）有650 個、經濟類有 2,761 個、社會類有 259 個、兩岸類有 411 個、國際類有 1,216 個、運動類有 2,437 個、娛樂類有 1,730 個，所有預測事件的統計量見表1-1：表1-1 未來事件交易所預測事件的全部與分類敘述統計量：2006-2011 合約類別事件數量平均成交筆數平均交易人數平均交易天數平均成交口數全部 _{7881 108.04 33.44} _{46.41 27994.19} 政治 ₈₆₇_{457.17 110.96 115.26}_130414.77 選舉 650 559.55 128.43 108.76 166862.54 經濟 2761 54.89 22.4 39.52 9176.59 社會 ₂₅₉_{70.24 31.15 72.98 8783.93} 兩岸 _{411 101.21 39.16 117.73 15383.45} 3_{未來事件交易所網址為 http://xfuture.org，為 2006 年 7 月由國立政治大學預測市場研究中心所} 創立，目前由未來事件交易股份有限公司經營。

(12)

8 國際 _{1216 53.3 20.33 36.69 9237.47} 運動 2437 106.6 32.21 46.22 31297.64 娛樂 1730 27.19 15.83 25.23 3569.27 圖 1-1 按照價格的所有預測事件的次數分布，絕大部分的預測事件分布在價格低與價格高的兩個區域。當然，價格高的預測事件之發生機率高，價格低的預測事件之發生機率低；這兩個區域的預測事件應該是呈現預測市場的強烈共識。不過，即便發生機率高或低，都不代表該預測事件必然會發生或不發生；預測事件的價格確實隱含諸多資訊，但是我們無法從預測事件的價格直接判斷該事件被預測會發生或不會發生。圖1-1 未來事件交易所預測事件分布圖：按照價格 0 100 200 300 400 500 3000 4000 1 11 21 31 41 51 61 71 81 91 次數價格

(13)

9 本研究希望找到一個最適當的價格門檻，判定預測事件是否會發生。如果某預測事件價格在此價格門檻以上，便判定該預測事件為「預測會發生」；某預測事件價格在此價格門檻以下，便判定該預測事件為「預測不會發生」。然而，預測與事實結果很難完美，所以可能某預測事件價格在此價格門檻以上而判定該預測事件為「預測會發生」，但卻「沒有發生」；或者，某預測事件價格在此價格門檻以下而判定該預測事件為「預測不會發生」，但卻「真的發生」。圖 1-2 為預測事件的價格與實際結果的分布示意圖。假設價格門檻為「Threshold」，所有預測事件在此價格門檻以上（預測該事件會發生），而且事實結果為發生的預測事件分布在 Q1（預測正確組），事實結果為沒有發生的預測事件分布在 Q4（預測錯誤組）。相對的，所有預測事件在此價格門檻以下（預測該事件不會發生），但事實結果為發生的預測事件分布在 Q2（預測錯誤組），事實結果為沒有發生的預測事件分布在 Q3（預測正確組）。「預測正確組」由 Q1 與 Q3 組成，「預測錯誤組」由 Q2 與 Q4 組成。若將價格門檻設得太高，將縮小 Q1、擴大 Q2；若將價格門檻降得過低，將縮小 Q3、擴大 Q4。因此，這個價格門檻要使 Q1＋Q3 極大化，使 Q2＋Q4 極小化，才能作為日後準確判定某預測事件是否會發生的準則。 Ps=100 Ps=0 圖1-2 預測事件分布示意圖：按照價格與實際結果 Threshold Q2 Q4 Q3 Q1 價格次數

(14)

10 各個價格門檻準則的準確率計算方式如下：方程式（1）當中的 Q1 為該合約價格高於門檻，且事後確實發生的合約數量；而 Q3 為合約價格小於門檻，且事後事件未成立的合約數量；方程式（1）的分母，即為圖 2：Q1、Q2、Q3 與 Q4 所有合約的總數。圖 3 為按照預測事件價格與實際結果區分之未來事件交易所的全部預測事件分布圖。很明顯的，絕大部分價格低的預測事件都是沒有發生，絕大部分價格高的預測事件都是發生。然而，從圖 1-3 來看，幾乎無法找到一個價格門檻，使得預測事件價格在價格門檻以上的預測事件都是發生，同時使預測事件價格在價格門檻以下的預測事件都沒有發生。圖1-3 未來事件交易所之預測事件分布圖：按照價格與實際結果 本研究將從價格 1 至 99 逐一計算個別價格門檻的準確率，將準確率最高的 3899 600 400 200 0 200 事件實際發生事件未成立價格次數價格門檻準則的準確率= _∑ （1）

(15)

11 價格門檻當做「最適門檻」。此外，本研究還計算 50 為價格門檻的準確率及最高價門檻的準確率。最適價格門檻與價格 50 門檻準則都是固定價格門檻，但是最高價門檻準則為變動的價格門檻，視預測事件的群組之最高價而定，最高價可能是95，也可能是 35。例如，在台北市長選舉時有五位候選人，最後只會有一個候選人當選，因此這五位候選人的事件期貨價格最高者應該被認定為最可能當選之候選人。不過，不同的選舉態勢會有不同的事件期貨價格分布。例如，如果一位候選人獨霸，則該候選人的事件期貨價格可能高達 95，其他候選人的事件期貨價格可能都是個位數；如果三強鼎立，則三位候選人的事件期貨價格可能都趨近30，另外兩位候選人的事件期貨價格可能是個位數。在計算完各項價格門檻的準確率之後，本研究以卡方檢定判定三個準確度的差異性是否存在。其次，本研究再以 Z 檢定，測試任意二價格門檻的準確率在統計上的顯著差異，比較最適價格門檻、價格 50 門檻及最高價門檻的準確率。以下便先分析全部預測事件的最適價格門檻與比較三種價格門檻準則的準確度，其整個研究流程圖如下：

(16)

12 圖1-4 研究流程圖 間距為0.1 的情況下，分別從價格 1 至 99 視為門檻，依序計算每個門檻的準確率，當中產生最高準確率之門檻，即被認定「最適門檻X」。比較「門檻50 準則」、「最高價格門檻」與「最適門檻 X」的準確率個別Z 檢定：「門檻50 準則」V.S「最適門檻 X」「最高價格門檻」V.S「最適門檻 X」顯著差異三個準確率的卡方檢定無顯著差異無法拒絕三者準確率相等的虛無假設顯著差異無顯著差異無法拒絕兩者準確率相等的虛無假設最適門檻X 準確率明顯高於「門檻 50 準則」與「最高價格門檻」，或最適門檻X 準確率明顯高於「門檻 50 準則」，或最適門檻X 準確率明顯高於「最高價格門檻」，

(17)

13

3. 全部預測事件的最適價門檻準則之實證分析

從價格門檻 1 到價格門檻 99，圖 5 為全部預測事件之不同價格門檻的準確率。很明顯的，價格 50 作為價格門檻的準確率並非最高，也就是 50 非最適價格門檻。根據價格 50 以後的價格門檻計算，全部預測事件的準確率有顯著提高，準確率的最高點出現在價格 60。本研究測試所有價格的準確率，理論或客觀上可找到一個最高準確率的門檻，此價格即為「最適門檻」。圖1-5 整體預測事件之不同價格門檻的準確率 此外，為確認這些最適門檻的穩定性，本研究進行 K=10 的 K-fold 交叉驗證，將原先樣本隨機區分成 10 等份，每次使用其中九等份作為訓練樣本，計算出各自的最適門檻價格，總共十個門檻值的平均價格為：60.1625，訓練樣本的平均準確率為：90.89%，樣本外十分之一等份的測試準確率為 90.88%。為更精確估計，本研究再重新執行 20 次 K=10 的 K-fold，其結果：K-fold 最適門檻的平均數為 60.21、變異數為 0.0201，測試準確率的平均數為 90.86、變異數為 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 10.9 20.9 30.9 40.9 50.9 60.9 70.9 80.9 90.9 準確率價格門檻

(18)

14 0.0008，此交叉驗證的變異很小，且平均值與圖 1-5 的最適價趨於一致，顯示此最適價格門檻具有穩定性。除了價格 50 的價格門檻與最適價格門檻 60 之外，本研究再以最高價門檻計算全部 7881 個預測事件的準確率，結果在表 2。以價格 50 為價格門檻的全部預測事件準確率為 89.47％，以最高價為價格門檻的全部預測事件準確率為 88.45％，以最適價為價格門檻的準確率為 90.79％。最適價似乎是全部預測事件的最好價格門檻，準確率至少可以提昇1-2 個百分點。表1-2 不同價格門檻之全部預測事件的準確率：2006-2011 （單位：％） 樣本數價格50 最高價最適價（60） 7881 89.47 88.45 90.79 根據表 1-2 可知門檻的準確率排名，最適價預測準則最好，價格 50 為次佳與最高價準則最差，但這三者準確率的差距，是否在統計上顯著差異，則我們可用卡方檢定來檢驗。底下表1-3 為各準則下的實際預測結果：表1-3 全部 7881 合約分別在三個門檻準則之觀測個數 價格50 最高價最適價（60）總合實際正確預測 7051 6971 7155 21177 實際錯誤預測 _{830 910 726 2466} 總合 _{7881 7881 7881 23643} 觀察上方表1-3，最適價門檻準則的正確預測個數最多，最高價門檻準則的

(19)

15 正確預測個數最少，為凸顯實際預測結果的差距，正確預測個數可和樣本期望個數作比較，而樣本期望值可利用表 1-3 計算得到：觀測值的兩個邊際比例相乘，之後再乘以全部樣本的總合，其結果如表1-4：表1-4 全部 7881 合約分別在三個門檻準則之期望個數 價格50 最高價最適價（60）期望正確預測 7059 7059 7059 期望錯誤預測 _{822 822 822} 說明：1、7059=（7881/23643）*（21177/23643）*23643； 2、822=（7881/23643）*（2466/23643）*23643。利用上述兩個表格數據和卡方檢定值公式，可算出卡方檢定值為 23.22，此數值大於自由度為2 且顯著水準為 5%的卡方臨界值 5.99，故在統計上，三個預測準則準確率（正確預測合約數量）存在顯著差異。計算過程如方程式（2）： ∑ ∑ ，其中為觀測個數和為理論期望值（2） 23.22 _. 2 5.99 本研究總共使用7,881 個樣本合約，因此我們以大樣本的兩個母體比例 z 統計量，其檢定的樣本分配為： , （3）

(20)

16 與卡方檢定使用相同表 1-3 的資料，、即為任兩個準則的準確率，引入方程式（3）得到 z 值。表1-5 全部預測事件之三種價格門檻準確率的 Z 檢定 虛無假設 _: _: _: Z 值 -2.0434** 2.7788*** 4.8196*** 說明：1. 為價格門檻50 準則的準確率，為最高價門檻準則的準確率，為最適價門檻準則的準確率；2. ***表示 1%的顯著水準，**表示 5%的顯著水準，以及*表示 10%的顯準水準。儘管最適價在全部預測事件作為價格門檻的準確率顯著比其他兩項價格門檻準則的準確率要高，但是每類預測事件的特性及交易狀況都不一樣，因此接下來將針對各類預測事件的最適價門檻準則進行實證分析。

4. 各類預測事件的最適價門檻準則之實證分析

表 1-6 呈現各類預測事件的最適價門檻及各類預測事件之三種價格門檻準則的準確率。大致上，各類預測事件的最適價門檻都在價格 60 附近，但是社會類為價格50，娛樂類為價格 78。其次，除了政治類（包括選舉類）與社會類以最高價門檻準則判定預測事件的準確率最高之外，4其他類別的預測事件都呈現最適價門檻準則是三種價格門檻準則中的準確率最高。第三，雖然政治類與社會類的最高價準則判定預測事件的準確率高於其他兩項價格門檻準則，但是雙方的差距都相當小，不到一個百分點。 4_{政治類別的合約當中，存在 74.97%的選舉類別合約（650/867）。}

(21)

17 表1-6 各類預測事件之三種價格門檻的準確率 合約類別樣本數門檻50 最高價最適價最適價門檻政治類* 867 94.69 95.27** 94.93 62 經濟類* 2761 91.13 87.87 91.49** 60 社會類 _{259 94.21}_94.98**_{94.21 50} 兩岸類* 411 91.24 89.29 94.16** 60 國際類 _{1216 82.24 82.89}_{85.94** 60} 運動類* 2437 87.44 87.94 89.62** 60 選舉類* 650 94.15 94.62** 94.46 62 娛樂類* 1730 87.17 86.76 89.42** 78 說明：打*號的各類預測事件存在多個相同準確率之最適價門檻，為精簡篇幅目的，本研究僅列出一個，最接近全部預測事件之最適價格門檻60 的價格數值。打**號的數值為三項價格門檻準確率較高者。表 1-7 為卡方檢定結果，除了政治類（包括選舉類）與社會類之外，不同類別預測事件之三種價格門檻準確率差異性都在統計上顯著。

(22)

18 表1-7 三種價格門檻的正確預測個數之卡方檢定 合約類別 p 值政治類 0.8584 經濟類 _0.0000*** 社會類 _0.9062 兩岸類 0.0411** 國際類 0.0310** 運動類 0.0462** 選舉類 _0.9342 娛樂類 0.0365** 說明：1. 卡方檢定的虛無假設 : 三個門檻準則的準確率無差異； 2. ***表示 1%的顯著水準，**表示 5%的顯著水準，以及*表示 10%的顯準水準。表 1-8 為不同類別預測事件之三種價格門檻準確率的 Z 檢定，以分別比較任兩個價格門檻準則的準確率。在經濟類的預測事件，最高價準則與最適價價格門檻的準確率，顯著高於價格 50 準則之準確率。在兩岸類、國際類、運動類、娛樂類的預測事件，最適價格門檻的準確率，都顯著高於價格 50 門檻與最高價門檻準則。整體而言，最適價格門檻在各類預測事件的預測準確率呈現相當不錯表現。

(23)

19 表1-8 不同類別預測事件之三種價格門檻準確率的 Z 檢定 : : : 備註政治類 0.55 0.23 -0.33 不顯著經濟類 -3.96*** 0.47 4.43*** 最差社會類 0.39 0.00 -0.39 不顯著兩岸類 -0.94 1.61* 2.54*** 最好國際類 0.42 2.5*** 2.08** 最好運動類 0.53 2.39*** 1.86** 最好選舉類 0.37 0.24 -0.13 不顯著娛樂類 -0.36 2.06** 2.42*** 最好說明：1. 為價格門檻 50 準則的準確率，為最高價門檻準則的準確率，為最適價門檻準則的準確率； 2. ***表示 1%的顯著水準，**表示 5%的顯著水準，以及*表示 10%的顯準水準。在政治類（選舉）與社會類預測事件，最高價準則的準確率稍微高於最適價門檻準確率，但統計上尚未達到顯著的檢定結果。也就是說，以統計學角度而言，最適價門檻的準確率仍不亞於最高價準則準確率。其次，價格 50 門檻準則顯然都不是最適當判定預測事件是否發生的價格門檻。

5. 三種價格門檻準則的樣本外測試與比較

本研究前半部分使用全部預測事件，驗證最適價格門檻準則較價格 50 門檻

(24)

20 與最高價門檻準則具有優勢。本節以 2006 至 2009 年的預測事件作為訓練樣本，再針對 2010 至 2011 年的預測事件進行樣本外測試，5計算最適價門檻準則、最高價門檻準則和價格 50 門檻準則的預測準確率。進行樣本外測試時，本研究將樣本分成全部事件及政治、經濟、社會、兩岸、國際、運動、選舉與娛樂等八大類預測事件進行分析。首先，本研究針對 2006 至 2009 年的樣本內樣本尋找最適價門檻，全部事件的最適價門檻為 60，除了娛樂類預測事件的最適價門檻為 78 較高之外，其他類預測事件的最適價門檻分布在 50-62 之間。再者，以三種不同價格門檻的準則計算樣本外樣本的預測準確率。在全部預測事件方面，最適價門檻準則的預測準確率領先另外二個準則 2-3 個百分點。在政治類（包括選舉類）預測事件方面，最高價門檻準則領先其他兩項價格門檻準則；在社會類與兩岸類預測事件方面，三項價格門檻準則平分秋色。除此之外，最適價門檻準則的表現都優於其他兩項準則。（見表1-9）表1-9 2010-2011 年樣本外測試 2010 年前最適門檻訓練樣本數 2010-2011 年測試樣本數門檻50 準則之準確率最高價準則之準確率最適門檻準則之準確率全部事件 _{60 4803 3078 88.66 87.91 90.35*} 政治類 62 715 152 96.71 97.37* 94.74 經濟類 51 2078 683 93.12 85.36 93.27* 社會類 _{50 223 36 100 100 100} 兩岸類 _{56 313 98 95.92 95.92 95.92} 國際類 56 300 916 80.13 82.31 83.52* 5_{本研究收集資料至 2011 年 8 月，因 2011 年僅有 8 個月的合約交易記錄，故使用 2010 年以後} 的合約，作為樣本外測試對象。

(25)

21 運動類 _{62 1201 1236 85.19 87.46 87.94*} 選舉類 62 517 133 96.24 96.99* 93.98 娛樂類 78 785 945 88.04 88.25 90.26* 說明：*為準確率最高的價格門檻準則。在卡方檢定結果，三項價格門檻準則的差異只有在全部樣本、經濟類、運動類是顯著的，其他類事件可能因為樣本數過少而造成統計上的不顯著。（見表1-10）表1-10 不同類別預測事件之三種價格門檻準確率的卡方檢定：樣本外測試 : p 值全部事件 0.0000*** 政治類 0.4519 經濟類 0.0000*** 國際類 _0.1611 運動類 0.0968* 選舉類 0.4499 娛樂類 0.2380 說明：***表示 1%的顯著水準，**表示 5%的顯著水準，以及*表示 10%的顯準水準。

(26)

22 在個別準確率的差異 Z 檢定，在全部事件與娛樂類，最適價門檻準則表現顯著優於其他兩項價格門檻準則；6在國際類，最適價門檻準則表現顯著優於價格 50 門檻準則；在經濟類，最高價門檻準則表現顯著遜於其他兩項準則；在運動類，價格 50 門檻準則顯著表現最差；在政治類（選舉類），三項價格門檻準則的兩兩比較準確率都不顯著。7（見表1-11）表1-11 不同類別預測事件之三種價格門檻準確率的 Z 檢定：樣本外測試 Z 值 : : : 備註全部事件 -0.91 2.16** 3.08*** 最好政治類 _{0.34 -0.85}_-1.18不顯著經濟類 _{-4.66*** 0.11 4.77***}最差國際類 1.20 1.88** 0.69 好過運動類 1.64** 2.01** 0.36 最差選舉類 0.34 -0.86 -1.19 不顯著娛樂類 0.14 1.55* 1.41* 最好說明：***表示 1%的顯著水準，**表示 5%的顯著水準，以及*表示 10%的顯著水準。根據表 1-9 的 2006 至 2009 年樣本，政治類事件的最高價門檻準則表現較好，社會與兩岸類的三項價格門檻準則表現平手。為釐清這些特殊狀況的可能原因，本研究彙整各類預測事件交易價格之統計資料。相較於其他類別事件， 6_{由於社會類與兩岸類的樣本外預測事件之三種價格門檻的準確率完全相同，所以本研究不再} 針對這兩類樣本外事件進行卡方檢定。 7_{由於社會類與兩岸類的樣本外預測事件之三種價格門檻的準確率完全相同，所以本研究不再} 針對這兩類樣本外事件進行Z 檢定。

(27)

23 政治類預測事件的交易價格平均普遍較高，而且交易價格的標準差也比較大，最高價的平均值較大，最高價的標準差較小，最高價與次高價差額之平均數也顯著高於其他類別。這顯示，政治類預測事件的最高價普遍較高（85 以上），也就是市場共識相當強，或者選舉的態勢強弱懸殊，所以市場的判斷相當明確，也較容易判定預測事件的結果。此外，社會與兩岸類的最高價平均值及最高價與次高價差額之平均數也都相當高，展現市場的共識相當強烈或預測事件的結果相當容易判斷，但是交易價格平均並不高、交易價格的標準差比較小，這可能是社會與兩岸類的三項價格門檻準則之準確率難分軒輊的原因。（見表 1-12）

(28)

24 表1-12 各類預測事件交易價格之統計數據 變數政治選舉社會經濟兩岸國際運動娛樂交易價格（Pi）的平均數 23.17 25.25 17.99 15.61 17.52 21.76 18.79 17.65 交易價格的標準差 36.70 37.31 33.35 29.49 32.70 31.24 30.28 28.27 |Pi-50|之平均數 43.86 42.88 44.97 43.51 44.32 39.33 41.16 40.52 |Pi-50|之標準差 11.89 12.80 10.55 12.61 12.58 15.04 13.99 14.27 最高價的平均值 87.01 85.11 87.31 71.12 80.72 61.80 70.81 71.72 最高價的標準差 17.46 17.68 20.30 29.43 29.32 30.43 28.01 26.40 最高價與次高價差額之平均數 71.50 67.74 71.98 48.22 67.84 24.65 40.61 48.97 最高價與次高價差額之標準差 31.45 32.58 27.95 34.43 34.50 29.46 36.04 33.78 |交易價格與最適價絕對差額之平均數| 50.73 49.25 44.97 51.02 51.47 46.65 48.62 62.75 交易價格與最適價絕對差額之標準差 16.74 17.75 10.55 15.40 14.91 16.18 15.83 22.44 說明：符號| |為取絕對值。

(29)

25

6. 結論

預測市場的資訊匯流提供領先、即時、連續、長期的重要資訊，作為決策與避險的重要參考依據。然而，透過網路匯聚的集體智慧資訊，乃是以最終收盤價格呈現，反映參與者對事件發生的機率預測。如何將此機率預測轉換成類別預測，以佐助公共政策與企業決策，則是研究者必須處理的研究課題。為了方便判定預測市場上的預測事件之預測結果是否發生，本研究成功利用未來事件交易所的交易資料，建構最適價門檻準則，極大化預測市場的準確率，以便預先判定預測事件的預測結果是否會發生，讓我們適當管控該事件發生與不發生的相關風險。以2006 至 2011 年的未來事件交易所 7,881 個預測事件樣本分析，全部預測事件的最適價門檻為價格 60，其判定預測事件的準確率比價格 50 門檻與最高價門檻準則都要高，而且具有統計上的顯著性。以分類事件而言，除了政治類與社會類之外，最適價門檻準則普遍比其他兩種價格門檻準則要好，而且大部分具有統計上的顯著性。在政治類與社會類的預測事件方面，雖然最高價門檻準則的準確率比最適價門檻要好，但並不具統計上的顯著性。在樣本外測試與比較方面，以 2006 至 2009 年預測事件為樣本內樣本， 2010 至 2011 年預測事件為樣本外樣本，全部預測事件的最適價門檻為價格 60，其判定預測事件的準確率比價格 50 門檻與最高價門檻準則都要高，而且具有統計上的顯著性。除了政治類之外，大部分類別的預測事件，皆呈現最適價門檻準則較其他兩項價格門檻準則要好；不過，部分類別可能因為樣本數太少（例如，社會類與兩岸類，未來事件交易所在 2010 至 2011 年分別發行 36、98 個合約，但是運動類卻有 1,236 個合約），其差異性分析都不顯著。在政治類預測事件方面，雖然最高價門檻準則的準確率比最適價門檻要好，但並不具統計上的顯著性。總體而言，以價格 60 為最適價門檻之準確率，普遍高於價格 50 門檻或最高價門檻的準則，其可作為判定某預測事件是否會發生的價格門檻。政治類預測事件仍可以沿用最高價門檻準則，其他類別預測事件則以最適價門檻準則較具優勢。透過預測事件價格的分析與比較，我們可以更有信心利用最適價格門檻判定預測事件的結果，以便我們作決策與進行避險的重要參考。本研究結論條列如下：一、以極大化預測市場準確率為目的，本研究建構最適價門檻準則，其價

(30)

26 格門檻可使市場從機率預測轉成類別判定，讓我們適當管控該事件發生與不發生的風險；二、針對全部樣本，「最適價門檻準則」比「門檻 50 準則」、「最高價門檻準則」具備更高的準確率，且大部分具有統計上的顯著性，亦通過樣本外測試；三、針對分類樣本，除了政治類與社會類的預測事件，分類的預測事件也都呈現「最適價門檻準則」比「門檻 50 準則」、「最高價門檻準則」具備更高的準確率，而且大部分具有統計上的顯著性。未來，我們可以給以預測事件結果不同權重，以建構新的最適價格門檻。本研究將發生與不發生的正確預測視為同樣的效益，但兩者的影響可能不一樣，兩種正確預測對政府與企業決策的價值也未必相同。例如，發生車禍與否的後果完全是生離死別，正確預測「車禍不發生」的效益與正確預測「車禍發生」的效益不同。因此，新的權重最適價格門檻，應將不同權重的效益考量進去，以便建構類似天氣預報與醫療診斷判定的門檻。此外，我們應該可以從更多的交易資訊與預測市場型態，例如交易人數、時間、數量、交易者特質、預測事件特質等等，進一步建構模型，在事前有更多資訊判定預測事件發生的結果。這將讓我們更從容利用預測市場的資訊，支援企業、社會及政府的決策。最後，本論文研究未來事件交易所的交易資料，是一個個案研究，而非通例結論，此模型參數未必適用到其他預測市場，需要以此模型引入至其他預測市場，進行相同步驟的分析，才能確認其最適門檻的價格。

參考文獻

童振源、周子全、林繼文、林馨怡（2011a）。2009 年台灣縣市長選舉預測分析。選舉研究，18（1），63-94。 童振源、周子全、林繼文、林馨怡（2011b）。選舉結果機率之分析：以 2006 年與2008 年台灣選舉為例。臺灣民主季刊，8（3），135-159。

Arrow, K. J., Sunder, S., Forsythe, R., et al. (2007). Statement on prediction markets.

AEI-Brookings Joint Center Related Publication (Working Paper No. 7-11).

Retrieved May 6, 2014, from http://papers.ssrn.com/sol3/papers.cfm?abstract_id=984584

(31)

27

Arrow, K. J., Forsythe, R., Gorham, M., et al. (2008). The promise of prediction markets. Science, 320(5878), 877-878.

Berg, J. E., Nelson, F. D., & Rietz, T. A. (2008). Prediction market accuracy in the long run. International Journal of Forecasting, 24(2), 285-300.

Brüggelambert, G. (2004). Information and efficiency in political stock markets: Using computerized markets to predict election results. Applied Economics,

36(7), 753-768.

Christiansen, J. D. (2007). Prediction markets: Practical experiments in small markets and behaviours observed. Journal of Prediction Markets, 1(1), 17-41.

Cox, G. W. (1997). Making votes count: Strategic coordination in the world’s

electoral systems. Cambridge: Cambridge University Press.

Gjerstad, S. (2005). Risk aversion, beliefs, and prediction market equilibrium

(Mimeo). Retrieved May 6, 2014, from http://www.aeaweb.org/assa/2006/0106_1015_0701.pdf

Gürkaynak, R., & Wolfers, J. (2005). Macroeconomic derivatives: An initial analysis

of market-based macro forecasts, uncertainty, and risk (Working Paper

2005-26). Retrieved May 6, 2014, from http://www.frbsf.org/publications/economics/papers/2005/wp05-26bk.pdf

Kittler, J., & Illingworth, J. (1986). Minimum error thresholding. Pattern Recognition,

19(1), 41-47.

LaComb, C. A., Barnett, J. A., & Pan, Q. (2007). The imagination market.

Information Systems Frontier, 9(2-3), 245-256.

Lavoie, J. (2009). The innovation engine at rite-solutions: Lessons from the CEO.

Journal of Prediction Markets, 3(1), 1-11.

Leigh, A., & Wolfers, J. (2006). Competing approaches to forecasting elections: Economic models, opinion polling and prediction markets. Economic Record,

82(258), 325-340.

Manski, C. F. (2006). Interpreting the Predictions of Prediction Markets. Economics

Letters, 91(3), 425-429.

McHugh, P., & Jackson, A. L. (2012). Prediction market accuracy: The impact of size, incentives, context and interpretation. Journal of Prediction Markets, 6(2), 22-46.

(32)

28

Murphy, A. H. (1977). The value of climatological, categorical and probabilistic forecasts in the cost-loss ratio situation. Monthly Weather Review, 105(7), 803-816.

Murphy, A. H., & Brown, B. G. (1984). A comparative evaluation of objective and subjective weather forecasts in the United States. Journal of Forecasting, 3(4), 369-393.

Ortner, G. (1998). Forecasting markets-An industrial application. Mimeo, Technical University of Vienna.

Otsu, N. (1979). A threshold selection method from gray-level histograms. IEEE

Transactions on Systems, Man, and Cybernetics, 9(1), 62-66.

Ottaviani, M., & Sorensen, P. N. (2007). Aggregation of information and beliefs in

prediction markets (Working Paper). Retrieved May 13, 2014, from

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.320.7486&rep=rep1& type=pdf

Pauker, S. G., & Kassirer, J. P. (1980). The threshold approach to clinical decision making. The New England Journal of Medicine, 302(20), 1109-1117.

Pennock, D. M., Lawrence, S., Nielsen, F. A., & Giles, C. L. (2001). Extracting collective probabilitistic forecasts from web games. Proceedings of the Seventh

ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, USA.

Servan-Schreiber, E., Wolfers, J., Pennock, D. M., & Galebach, B. (2004). Prediction markets: Does money matter? Electronic Markets, 14(3), 243-251.

Soukhoroukova, A., Spann, M., & Skiera, B. (2012). Sourcing, filtering, and evaluating new product ideas: An empirical exploration of the performance of idea markets. Journal of Product Innovation Management, 29(1), 100-112. Spears, B., LaComb, C., Interrante, J., Barnett, J., & Senturk-Dogonaksoy, D. (2009).

Examining trader behavior in idea markets: An implementation of GE’s imagination markets. Journal of Prediction Markets, 3(1), 17-39.

Tung, C. Y., Chou, T. C., Lin, J. W., & Lin, H. Y. (2011). Comparing the forecasting accuracy of prediction markets and polls for Taiwan’s presidential and mayoral elections. Journal of Prediction Markets, 5(3), 1-26.

Wolfers, J., & Leigh, A. (2002). Three tools for forecasting federal elections lessons from 2001. Australian Journal of Political Science, 37(2), 223-240.

(33)

29

Wolfers, J., & Zitzewitz, E. (2004). Prediction markets. Journal of Economic

Perspectives, 18(2), 107-126.

Wolfers, J., & Zitzewitz, E. (2006). Interpreting prediction market prices as

probabilities (Working Paper No. 12200). Retrieved May 6, 2014, from

http://www.nber.org/papers/w12200

附錄

1

根據第一節對有效候選人數（NEC）的定義，NEC 的計算過程需要真實的得票率，因此 NEC 為事後變數。本研究以事前預測為研究目的，且研究對象不只包含選舉類合約，故我們必須以事件發生前的交易價格代替得票率，此變數稱為「有效合約數量」，以交易價格替代得票率，計算方法與NEC 相同：_∑ ，為第i 個候選人的「交易價格」/100，為候選人數，其表示預測事件的預測困難度。以下討論「有效合約數量」、「事件合約數量」、「合約交易筆數」、「合約交易人數」、「合約可交易天數」與「合約交易口數」等變數，對於最適門檻和準確率的影響。我們先利用各個變數的中位數作分界，將本研究的研究樣本區分成兩組，該變數在第一組的平均數將小於（或等於）中位數，相對此變數在第二組的平均數大於中位數，故我們列出表 13 比較這兩組的最適門檻與準確率：表1-13 六項變數對最適門檻與準確度之影響 中位數最適門檻準確率有效合約數量 _1.26 （81.00,60.10）（92.37,89.21）事件合約數量 ₉ （59.90,60.20）（90.64,90.57）合約交易筆數 14 （78.40,59.90）（89.39,91.83）

(34)

30 合約交易人數 ₁₃ （78.40,59.90）（89.62,91.68）合約可交易天數 14 （60.20,52.40）（87.63,93.71）合約交易口數 1235 （60.20,59.90）（88.85,92.30）說明：1. 括號內第一個數值，代表在小於或等於中位數樣本下所產生的數據，而括號內第二個數值，代表在大於中位數樣本下所產生的數據。 2. 此外，部分選區交易冷落，可能產生多數合約的價格接近零，根據有效合約數量定義：1 除以「（交易價格/100）平方值的加總」，將使有效合約數量發生不合理極端值，此處有效樣本為有效合約數量在10 以下的合約，總共 5,972 個事件合約。觀察上表，發現的確有部分的因素將使最適門檻異於 60，包括「有效合約數量」、「合約交易比數」與「合約交易人數」。以「有效合約數量」為例，小於或等於中位數的樣本，其試算的最適門檻為 81.00（括號第一個數據），對於大於中位數的樣本而言，其最適門檻為 60.10，兩門檻存在明顯差距，就「選舉合約」的有效合約數量低於 1.26 的樣本來說，該組當中的每一選區之有效合約皆接近 1 個，表示同一選區候選人的價格差距拉開，預測事件的預測困難程度相當低，所以價格門檻自然比較高。（根據上述定義，若一選區有 N 個候選人，選情激烈選區的每人價格為N 分之一，則有效合約數量為 N）以「合約交易筆數」與「合約交易人數」而言，市場交易冷落代表匯集資訊較弱的合約，可能需要較高的最適門檻，以反應市場的強烈共識。但針對這些變數，全部樣本無法像類別分組具備明確定義來劃定分組範圍，中位數分組僅為其中一種區分樣本的方式。未來的研究可討論更多種分組方法，作全面性和更詳盡的分析最適門檻值。

(35)

31

選舉預測市場之選前鑑別模型：

以最高價準則為門檻

壹、前言選舉預測市場（prediction markets）是透過電子期貨交易，將市場參與者的選情資訊彙整之新興機制，其交易價格為預測候選人是否當選或得票率的指標。全球第一個以期貨市場交易模式為藍本的「預測市場」，是由美國愛荷華大學於 1988 年成立的「愛荷華電子市場 (Iowa electronic markets, IEM)」。「預測市場」的特徵在於「提供適當獎懲機制」與「連續修正」。交易者根據公開資訊或私有資訊對未來事件的預測下單，未來事件的真實結果會決定交易者的報酬，而未來事件的均衡合約價格可視為整體市場對該事件發生與否的機率或落點的預測 (Agrawal et al, 2010:46-49)。「預測市場」是讓參與者買賣「未來事件合約」的市場，參與者依據對價格走勢的判斷及事件發生結果的預測進行買賣，合約的價格可以做為預測該事件是否發生或如何發生的預測的參考。每個合約都會事先設定「所預測的事件」、「清算標準」及「到期日」，合約到期時，由該事件「發生」、「未發生」或是「如何發生」決定該合約的清算價格。這個市場的運作類似一般的「期貨市場」，透過這個機制來彙整各方面的資訊預測未來事件發生的結果。舉例來說，在一個有關選舉的「預測市場」中，參與者可以買賣各候選人當選的合約，其獲利或虧損由相同合約的買賣價差來決定，或由買賣價格與清算價格之價差來決定。例如：在到期時，若該候選人當選則以價格 100 清算，曾經買進但尚未賣出該合約的參與者即獲利，曾經賣出但尚未買進該合約即虧損。反之，若該候選人落選則以價格 0 清算，曾經買進但尚未賣出該合約的參與者即虧損，曾經賣出但尚未買進該合約即獲利。又例如：如果參與者買進或賣出「候選人得票率」的合約並持有到選舉結束，其獲利及虧損的多寡即由候選人實際得票率與買進或賣出該合約之差額決定。利用「預測市場」進行預測所面臨的理論挑戰是：為什麼「預測市場」參與者交易的結果（價格）可以被當作一種預測的工具？「預測市場」預測工具的成效是否優於傳統的預測工具？關於第一個問題，預測市場背後的理論基礎是市場可以解決資訊的問題，市場價格可以準確預測資產的價格。一個競爭性市場將會透過價格機制達成市場效率，而且這是最有效彙整不對稱而分散的市場參與者資訊的手段，這便是「海耶克假說」(Hayek hypothesis) (Hayek, 1945; Smith, 1982)。如果市場是有效率的，市場價格將充分反應所有可以獲得的資訊；如果價格可以反應所有可獲得的資訊即是有效率的市場(Fama 1970)。根據理性預期理論，預測市場的價格是交易者可以獲得的所有資訊的統計量(Grossman,

(36)

32

1981; Sunder, 1995)。

最後，競爭性市場的價格提供彙整參與者公開與私人資訊的機制，而且可以同時彙整私人資訊的共識與分歧(Spann and Skiera, 2003; Gruca et al, 2005)。進一步而言，可以分成兩個途徑討論。第一個途徑假設所有「預測市場」交易者的平均預測就是最佳的預測。在這個出發點之下，理論上要解決的問題是：市場價格是否剛好會等於所有交易者的平均預測？以前述第一類的合約為例（即報酬由特定事件發生與否決定），假定其報酬為「在特定事件發生為 1，否則為 0」(Manski, 2006)。10 在每個交易者願意承擔的最大損失相同的假設之下， Manski (2006)指出「認為事件發生的機率大於該價格的交易者佔所有交易者的比例恰好等於該價格」。如果將所有未來事件交易所的「0-100 型合約」設定合約清算價格「特定事件發生為 100，否則為零」。交易者對事件發生機率的預測取平均值，則這平均值會落在一個以均衡價格為中點的區間(半徑為均衡價格減均衡價格的平方)。此外，Wolfers and Zitzewitz (2006) 認為，在交易者效用為對數函數的假設之下，均衡價格等於所有交易者對事件發生機率預測值的加權平均。如果所有交易者的財富相同，均衡價格就等於所有交易者的平均預測。在大多數的狀況下，即使放寬對效用函數的假設，Wolfers and Zitzewitz (2006) 發現結論也大致相同，所以預測市場的觀察者可以使用價格預測事件發生的機率。第二個途徑則把焦點從「所有交易者的平均」轉移到帶動價格變化的「邊際交易者」(marginal trader)的身上。只要最新價格反映出這些邊際交易者的最佳資訊，即使所有交易者的平均預測有所偏誤，預測市場仍是一個很有效的預測工具。在這個市場上，每個交易者透過下單表達了他為了賺取可能的價差而願意承擔的最大損失。買方所喊的價錢代表他願意承擔的最大損失（即價格減 0），而他所能賺到的最大價差則是 100 減價格。賣方所要的價錢則代表他所能賺到的最大價差（即價格減 0），而他願意承擔的最大損失則是 100 減價格。因為出價最高的買方和要價最低的賣方優先成交，所以成交的雙方分別是願意承擔比所有其他買方更大損失的買家和願意承擔比所有其他賣方更大損失的賣家。在成交的當時，沒有人願意為了獲取可能的價差而承擔更大的損失。如果一個交易者所願意承擔的損失反映出他對自己所擁有資訊的信心，則成交價就是「由最有自信的買賣雙方對事件發生機率所達成的共識」。隨著時間經過，成交價的改變代表這個共識機率的變化。這樣的「邊際交易者假說」得到 Forsythe et al. (1992)、Forsythe et al. (1999) 和 Oliven and Rietz (2004)以「愛荷華電子市場」的資料進行的實證研究的支持。因此，「預測市場」參與者交易的結果（價格）可以被當作一種預測的工具。

「預測市場」和其他兩種常見的預測方法（民意調查和專家座談）的主要區別在於：預測市場獎勵擁有較佳資訊的參與者與連續不斷地透過交易而修正市場的預測（價格）。Kou and Sobel (2004)建構了一個簡單的數理模型以比較預測市場和民意調查的選舉預測能力。他們發現：市場價格的偏誤(bias)（各個

(37)

33 時間點的價格減最後實際得票率的期望值）為零，民調結果的偏誤則不為零，而且市場價格的變異數小於民調結果的變異數。另外，若就均方預測誤差(mean square predictionerror)做比較，在「市場交易者可以看到民調結果」的假設前提之下，民調結果（或以各種方式將各個民調結果加權平均所得到的預測）都遜於市場價格（前者的均方預測誤差比後者大）。其他的預測方式通常難以兼有「適當的獎懲」與「連續的修正」等兩項特徵。下方表格彙整了「預測市場」和其他兩種常見預測方法的比較。表2-1 預測市場、民意調查和專家座談之比較預測市場民意調查專家意見或座談參與對象  主動參與  隨機抽樣  遴選或推薦意見表示期間  連續性  直到事件結束  一次性  一次性或是  週期性意見表示方式  互動式  獨立式（通常）  獨立式或互動式意見表示內容  預測事件發生機率  例如，誰將贏得選舉？  表達個人偏好  例如，您支持誰？  表達個人偏好或  預測事件發生機率參與者權重  不平等  權重按照投資的比重決定  平等  不一定參與誘因  等比例的經濟報酬  沒有  聲望或一次性固  定經濟報酬說實話誘因  經濟誘因與懲罰  使用實際金錢或虛擬金錢  對結果沒有絕對影響  缺乏獎懲機制  聲望  缺乏懲罰機制意見彙整結果  以價格訊號反應參與者之  共識變動連續性趨勢變化  靜態一次性分析  結果只能反映「過  去」的民意  一次性分析預測準確度  準確  普通  略好執行方式  需設立電子交易市場  需採用大規模訪談或問卷調查  需慎選參與專家名單說明預測市場的準確性高於其他預測方法的文獻相當豐富，例如：Berg et al.(2008, 285-300) 比對該市場與蓋洛普、哈里斯、紐約時報等大型媒體共 964 場民調，在 1988~2004 年間預測美國總統大選的表現，結果顯示預測市場的準確率比傳統民調的次數高出 74%。其他說明預測市場準確度的文獻還包括： Ortner (1998)、Pennock et al. (2001, 987-988)、Wolfers and Leigh (2002, 223-240)、 Brüggelambert (2004,742-768)、Servan-Schreiber et al. (2004,243-251)、Wolfers and Zitzewitz (2004, 107-126)、Gürkaynak and Wolfers (2005) 及 Leigh and Wolfers (2006, 325-340)。

(38)

34 當選，而其他非最價選舉人將會落選，但在大量預測事件中，此一最高價當選的預測準則難免會發生失準，因為未來事件交易所選舉合約的平均預測準備度只有 94.62％。因此，我們建構鑑別模型，可「事前」鑑別預測市場個別合約的最高價準則是否成立。如此，一般民眾所關注的特定選舉事件，可以在選前有一套評量機制，鑑別「預測市場的價格」是否符合最高價準則，是否可直接推斷選舉結果。以 IEM 在 1996 年及 2000 年的兩次美國總統選舉市場為樣本外 (out-of-sample)測試，發現利用迴歸模型的樣本外預測結果並不好(Berg et al, 1997: 444-463)。以 1992、1996 及 2000 年的美國總統選為例，分析三種模型對於預測誤差的判斷，包括市場微結構因素（交易人數、數量與共識）、長期價格走勢、與隱含波動率(implied volatility)估計預測標準誤 (forecast standard deviation) (Berg et al, 2003)。他們認為，贏者全拿合約的預測市場價格可以作為交易者對得票率預測的信心程度的合理指標，但是也認為需要更多的資料來驗證。目前的文獻並沒有適當的模型在事件發生前，提供我們判定某預測事件是否準確的方法，只能使用預測市場的總體(歷史)準確度作為評估的標準。但是，交易過程的變數相當多，包括交易的時間、交易者的數量與共識、預測事件的困難度等等，都可能影響預測事件的預測準確度。我們無法以過去的總體準確度在事前判斷當下預測事件的準確度。因此，本研究的目的即是發展鑑別模型，根據適當的價格門檻，能在事前判定預測市場個別選舉預測事件是否發生失準。進一步而言，事件發生的結果只有發生與未發生，我們如何在事前解讀預測事件的價格？如何評估預測準確度？目前文獻是以最後交易價格超過一定的價格門檻作為判定預測事件的結果，亦即將「機率預測」（probability forecasting）轉換成「類別預測」（categorical forecasting）。（童振源等，2009：131-166；童振源等，2011a：63-94；童振源等，2011b：135-159）第一種價格門檻為價格 50 為門檻。然而，這項門檻不太適合超過二位以上的候選人，特別是競爭激烈的選區，因為兩個候選人的政治期貨價格可能都沒有超過 50。第二種價格門檻為100 除以「有效候選人數 (Number of effective candidates)」。8然而，我們希望事前判斷事件結果，可是「有效候選人數」只能選舉結束後才能取得，因此這項門檻不適合作為本研究的價格門檻。因此，本研究採取「最高價原則」在事前判定該預測事件是否會發生，亦即，在同一個選區內，政治期貨最高價之候選人將當選，政治期貨非最高價之候選人將落選。預測市場的預測準確率是過去歷史合約的整體平均準確度，同時假設最高價準則一定成立，僅針對當前的交易價格，判定當前的合約是否會發生。然而，本研究的鑑別模型是根據過去的歷史交易資料訓練鑑別模型(共引進 40 個變數)，萃取相當多的變數資訊獲得重要的模型參數。再針對當前合約的交易資訊，鑑別模型會對每個合約進行獨立判定，提供個別合約的鑑別結果，讓我們在事前得以鑑別個別合約是否符合最高價原則，而不是過去的歷史或總體平均準確度。 8_{有效候選人的定義為：NEC} _{1/ ∑} _{, 為該選區候選人總數，為第 i 個候選人得票率。}

(39)

35 本研究以未來事件交易所（http://xfuture.org）（童振源等，2009：131-166）之選舉期貨預測事件作為樣本，評估最高價準則在選舉預測市場的預測效果，並且建構四個鑑別模型在選舉前評估選舉預測事件之預測結果是否準確。第二節說明研究方法與資料，第三節分析四個鑑別模型之鑑別力，第四節分析四個鑑別模型的預測力，第五節為結論。貳、研究方法與資料

在「類別預測」最常使用的是 Logit 模型與鑑別分析模型(discriminant analysis, DA)，本研究也採用這兩種方法作為類別預測的機制。對自變數處理有 2 種方式：原始變數與主成份變數。我們運用主成份分析（principal component analysis，PCA）的優點，將「全面且大量」可用的變數全部納入模型體系，同時可避免共線性的問題，使研究者收集到的資料訊息極大化，完整的資訊可能讓預測工作更加準確。一、Logit 模型與 DA 模型 本研究分析最高價準則成立與否（亦即，某選舉預測事件的價格為該選區的最高價，而且該選舉預測事件在選舉後確實發生；某選舉預測事件的價格並非該選區的最高價，而且該選舉預測事件在選舉後確實沒有發生），以虛擬變數 (dummy variable)之 0 或 1 表示。Carvalho et al.(1998:717-722), Hwang et al. (1997:317-334)和 West (1985: 253-266)曾利用 Logit 迴歸作為預測的方法。本研究先採用 Logit 迴歸模型，鑑別每一合約是否滿足最高價準則。其標準格式可參考附錄1。

本研究使用 STATA 計量軟體得到 , , ⋯ , ，再運用文獻常使用的樣本平均數(sample mean)，作為我們 Logit 鑑別分組門檻。以本研究的最高價準則為例，在選舉前夕收集一組合約變數 , , ⋯ , ，輸入上一方程式等號右邊

可算出一個配適值，此一數值若比樣本平均數大時，則我們判定該合約的加權平均價「符合」最高價準則，另一種情況，該合約的配適值小於樣本平均數時，則本研究模型判定此合約價格可能「不符合」最高價準則。

另外一種方法是多變量的模型，利用 DA 分組樣本功能以鑑別選舉預測事件的結果。例如，Blin and Whinston（1975:557-566）應用 DA 在多數決的投票研究。Mitchneck（1995:150-170）運用 DA 的區分樣本的特質，應用在地理經濟的議題，以及 Mitra et al.（2002:497-508）使用 DA 討論小型開放國家貿易保護措施的影響。與 Logit 模型相似，僅需要依變數與自變數，所以其變數設定上完全與Logit 相同。 Næs and Mevik (2001) 提出共線性問題的二種建議處理方式： PCR(PCA+Regression)以及 PLS(偏最小平方法)。本研究引用第一種方式處理共

(40)

36 線性的問題，亦即建構PCA+Logit 與 PCA+DA 的鑑別模型，同時亦進行原始變數的 Original-Logit 鑑別模型與 Original-DA 鑑別模型之分析。在自變數與依變數各有兩種選擇下，我們將測試4 個模型的鑑別力與預測力，分類如下：表2-2 四種預測模型分類 原始自變數主成份變數

Logit 迴歸 Original-Logit 模型 PCA-Logit 模型 DA 鑑別分析 Original-DA 模型 PCA-DA 模型二、鑑別模型設定與預測說明一般預測模型選前預測某一位候選人將會勝選，則其他候選人被預測將會落選。傳統預測方式在這兩個候選人的預測上有完全相關性，很多統計理論無法適用。然而，鑑別模型的最大優勢就是可規避，預測上的互斥且相關性之問題。直覺上，預測市場的最高價候選人會被預測當選，非最高價的參選人將被預測落選，我們將這兩個面向結果，重新整合一個預測結論，被稱為「符合最高價準則」，這個準則包括上述兩個面向。進一步來說，鑑別模型的推論僅分成：「符合」與「不符合」最高價準則。以下我們以DA 鑑別模型之圖形說明：

(41)

37 圖2-1 DA 樣本外測試流程圖 選前最高價且選後當選選前非最高價且選後落選選前最高價且選後落選選前非最高價且選後當選符合最高價準則， Fisher 1 函數：不符合最高價準則， Fisher 2 函數：樣本內合約的結果樣本內合約的結果樣本外單一合約的 40 自變數資料： ∙ 鑑別數據1 ∙ 鑑別數據2 數據比大選前鑑別模型認定交易價格，在未來選後將會符合最高價準則選前鑑別模型認定交易價格，在未來選後將會不會符合最高價準則樣本內資料樣本外資料

預測市場準確度之實證研究：準確度、變數與預測誤差

科技部補助專題研究計畫成果報告

期末報告

預測市場準確度之實證研究：準確度、變數與預測誤差(第

3 年)

科技部補助專題研究計畫成果報告

（

□期中進度報告/V 期末報告）

預測市場準確度之實證研究：準確度、變數與預測誤差

計畫類別：v 個別型計畫 □整合型計畫

計畫編號：MOST 99 －2628－H －004 －001－MY3

執行期間：2010 年 8 月 1 日至 2014 年 7 月 31 日

執行機構及系所：國立政治大學國家發展研究所

計畫主持人：童振源

共同主持人：林繼文 （中央研究院政治學研究所）

計畫參與人員：林鴻文、陳建希、許富翔、林佑龍、王國臣、蔡宛臻、

郭俊宇、郭曜禎、楊婷安、周子全

本計畫除繳交成果報告外，另含下列出國報告，共 _2_ 份：

v 執行國際合作與移地研究心得報告

v 出席國際學術會議心得報告

期末報告處理方式：

1. 公開方式：

v 非列管計畫亦不具下列情形，立即公開查詢

□涉及專利或其他智慧財產權，□一年□二年後可公開查詢

2.「本研究」是否已有嚴重損及公共利益之發現：v 否 □是

3.「本報告」是否建議提供政府單位施政參考 □否 □是， （請列舉提供之單

位；本部不經審議，依勾選逕予轉送）

中 華 民 國 103 年 7 月 17 日

以預測市場匯聚資訊支援決策之方法：從機率

預測到類別判定

1. 緒論

2. 研究方法與資料

3. 全部預測事件的最適價門檻準則之實證分析

4. 各類預測事件的最適價門檻準則之實證分析

5. 三種價格門檻準則的樣本外測試與比較

6. 結論

參考文獻

附錄

1

選舉預測市場之選前鑑別模型：

以最高價準則為門檻

共同主持人：林繼文（中央研究院政治學研究所）

3.「本報告」是否建議提供政府單位施政參考 □否 □是，（請列舉提供之單

中華民國 103 年 7 月 17 日