• 沒有找到結果。

第四章 樣本外的預測能力

第一節 2008 年總統大選前夕

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

第一節 2008 年總統大選前夕

首先,本文先以 2008 總統大選為例,說明 Original-Logit 模型的樣本外測試 過程。依時間順序從第 1 個合約至第 T1 個合約為樣本內資料,其每一合約包含 40 個自變數與 1 個依變數(最高價準成立與否的 0 或 1 虛擬變數),總共 T1 組資 料輸入 STATA 軟體,即可得到一組 Logit 迴歸係數。下一步驟我們定義樣本外 資料範圍:第 T1+ 1筆合約至第 T2 筆合約,總共有( T2 − T1)組的自變數與依變 數,再將此數據代入 Logit 迴歸係數,即可得到( T2 − T1)個 Logit 配適值。最後,

把配適值結果比較樣本平均數後,即可將樣本外合約區分成鑑別正確組和鑑別未 正確組。選舉結束後,我們便可以得到樣本外預測的鑑別準確率。分析流程如圖 2 所示:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

根據最高價準則,預測市場準確預測樣本內的選舉合約比例為 92.79%,最 高價準則不成立的樣本機率為 7.21% (100-92.79%)。Logit 模型對樣本內合約的鑑 別正確準確率達 97.74%,比最高價準則的預測準確率高,鑑別未正確準確率為 73.91%。(見表 8)

表 8 2008 年總統大選前之樣本內 333 個合約的 Logit 迴歸分組結果 Logit 分組情況

預測分組 分組內個數 鑑別正確預測組(O) 鑑別未正確預測組(X)

事實正確預測組(T) 309 303(A) 6(B)

事實未正確預測組(F) 24 7(C) 17(D)

準確率 92.79% 97.74% 73.91%

根據樣本內合約訓練的 Logit 模型進行樣本外測試。表 9 為樣本外測試結果,

Logit 模型對樣本外樣本的鑑別正確準確率有改善且高達 100%。不過,Logit 模 型的鑑別未正確準確率卻只有 26.67%,預測能力大幅下降。

表 9 2008 年總統大選之樣本外 78 個合約的 Logit 迴歸分組結果

Logit 分組情況

預測分組 分組內個數 鑑別正確預測組(O) 鑑別未正確預測組(X)

事實正確預測組(T) 74 63(A) 11(B)

事實未正確預測組(F) 4 0(C) 4(D)

準確率 94.87% 100.00% 26.67%

2008 年總統選舉預測的合約共有 78 個。若未使用本文的鑑別模型,僅使用 最高價準則,將有 94.87%正確預測選舉結果。但是,即使在選前知道選舉預測 合約的價格,亦無法區分哪些合約會符合最高價準則,哪些合約會發生預測錯誤。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

21

本文引入 Logit 鑑別方法,在「選舉前」可篩選出 63 個合約,該模型對選舉預 測合約的鑑別結果有 100%的預測準確率。

以下進一步比較四個模型對 2008 年總統選舉預測的樣本外預測能力。

Original-Logit 模型樣本外的 ARCI 為 100%,ARII 為 26.67%;Original-DA 模型 的 ARCI 為 100%,ARII 為 23.53%;PCA-Logit 模型的 ARCI 為 95.89%,ARII 為 20.0%;PCA-DA 模型的 ARCI 為 94.74%,ARII 為 0%。整體而言,Original-Logit 模型在 2008 年總統大選預測樣本外的預測能力都是最高。(見表 10)

表 10 四個鑑別模型對 2008 年總統大選預測的樣本外測試結果

機制 (A)組 (C)組 (B)組 (D)組 ARCI ARII

Original-Logit 模型 63 0 11 4 100% 26.67%

Original-DA 模型 61 0 13 4 100% 23.53%

PCA-Logit 模型 70 3 4 1 95.89% 20.00%

PCA-DA 模型 72 4 2 0 94.74% 0.00%

從交易結束、選舉結果揭曉前的鑑別模型,我們可以進一步發現鑑別模型在 事前、個別準確率的作用。例如,從 78 個大選的有效交易合約中,我們找出下 列 6 個合約(共 3 個選區群組),最終預測市場的交易結果顯示,按照最高價原則,

馬英九會當選總統(85.57 > 16.10),台南市最高票為謝長廷(58.83 > 42.92),

而雲林縣最高票為馬英九(61.80 > 44.48)。

0.4%、27.2%、41.38%、67.51%,都遠低於 2008 年總統選舉前選舉預測事件樣 本內,最高價準則成立的平均樣本比率(92.79%)。換言之,Original-Logit 鑑別 模型認定最高價準則在此 4 個合約成立不成立(X 組),可以事前認定此 4 合約 的最終結果與「未來事件交易所」的預測未必一致。(見表 12)

Original-Logit 模型鑑別「最 高價準則」成立之配適機率

Original-Logit 模型 鑑別組別

說明:謝長廷在全國、台南市與雲林縣的得票數為:5444949、216815 與 199558,馬英九的得票 數分別為:7659014、223034 與 187705。

相關文件