由於成交量大的交易日代表其交易機率較高,因此為了提高檢測結果之代表性,
本研究首先計算出研究期間全部交易日的平均成交量,再將每個交易日 t 之成交量與 前兩日(t-1、t-2)加總除以 3,取其 3 日均量,若 3 日均量低於平均成交量,便將該筆 資料自研究資料中剔除,在取得所有高於平均成交量之樣本資料後,再根據三個參考 點的選取規則從 5 檔權值股、期貨以及加權股價指數資料中,擷取出符合各參考點之 趨勢線圖的資料筆數,亦即從樣本資料當中,選取符合圖 3-2、圖 3-3 及圖 3-4 之所 有資料區間。
根據圖 3-2、圖 3-3 及圖 3-4 之趨勢線圖所選取出的資料區間,須符合一定的規 則。以圖 3-2 左方之示意圖為例,O、L、O、G、O 等 5 筆指數資料若依序以 p1、p2 至 p5 表示(如圖 3-5),則三個參考點 O 的指數值必須大約相等,此一限制乃是為了建 立較為一致的比較基準,可公式化為:
5 3
1 p p
p
I I
I ≅ ≅
(3-76 式)其中
1
I
p 、I
p3、I
p5代表參考點 O 的指數值p1
p2 p3
p4
p5 p1 p2
p3
p4 p5
p1
p2
p3 p4
p5
p1 p2
p3
p4
p5
圖 3-5 以PO、PL與PG為參考點之指數走勢示意圖
此外,本研究在選取資料區間的過程中發現,若欲取得足夠的樣本區間以進行關 聯規則探勘,須適度放寬三個參考點 O 彼此之間的數值差距,因此,在期貨及加權 股價指數資料的取樣過程中,本研究將三個參考點 O 彼此之間的差距設為 100,而在 權值股資料的取樣過程中,將數值差距設為 2,亦即 p1、p3、p5 三筆資料彼此之間 的數值差距須介於 0 到 100 或 0 到 2 之間,可公式化為:
c I I I I I
I
p−
p≅
p−
p≅
p−
p<
≤
5 3 3 1 5 10
(3-77 式)其中
在 3-76 式與 3-77 式成立的情況下,亦可進一步推得 3-78 式與 3-79 式之關係成 立。
c I I I
I
p − p − p − p <≤ 5 4 4 3
0 (3-78 式)
其中
c 為常數
3
I
p 、I
p5代表參考點 O 的指數值4
I
p 代表參考點 L 或參考點 G 的指數值c
I I I
I
p − p − p − p <≤ 3 2 2 1
0 (3-79 式)
其中
c 為常數
1
I
p 、I
p3代表參考點 O 的指數值2
I
p 代表參考點 L 或參考點 G 的指數值 茲將參考點PO的選取規則整理如下:5 3
1 p p
p
I I
I ≅ ≅
(3-80 式)c I I I I I
I
p−
p≅
p−
p≅
p−
p<
≤
5 3 3 1 5 10
(3-81 式)c I I I
I
p − p − p − p <≤ 5 4 4 3
0 (3-82 式)
c I I I
I
p − p − p − p <≤ 3 2 2 1
0 (3-83 式)
其中
c 為常數
1
I
p 、I
p3、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 L 或參考點 G 的指數 值當參考點為PL時,以圖 3-3 之示意圖為例,O、L、2L、L、O等 5 筆指數資料若 依序以p1、p2 至p5 表示(如圖 3-5),則兩個參考點O與參考點L的指數值必須大約相等,
可公式化為:
5
1 p
p
I
I ≅
,I
p2≅ I
p4 (3-84 式) 其中1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 L 的指數值在期貨及加權股價指數資料的取樣過程中,本研究將兩個參考點 O 及參考點 L 彼此之間的差距設為 100,而在權值股資料的取樣過程中,將數值差距設為 2,亦即 p1、p5 兩筆資料彼此之間的數值差距須介於 0 到 100 或 0 到 2 之間,p2、p4 亦同,
可公式化為:
c I I I
I
p−
p≅
p−
p<
≤
5 1 4 20
(3-85 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 L 的指數值在 3-84 式與 3-85 式成立的情況下,亦可進一步推得 3-86 式與 3-87 式之關係成 立。
c I I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
5 4 1 2 (3-86 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 L 的指數值c I I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
4 3 2 3 (3-87 式)2
I
p 、I
p4代表參考點 L 的指數值3
I
p 代表參考點 2L 的指數值 茲將參考點PL的選取規則整理如下:5
1 p
p
I
I ≅
,I
p2≅ I
p4 (3-88 式)c
I I I
I
p−
p≅
p−
p<
≤
5 1 4 20
(3-89 式)c I
I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
5 4 1 2 (3-90 式)c I I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
4 3 2 3 (3-91 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 L 的指數值3
I
p 代表參考點 2L 的指數值當參考點為PG時,以圖 3-4 之示意圖為例,O、G、2G、G、O等 5 筆指數資料若 依序以p1、p2 至p5 表示(如圖 3-5),則兩個參考點O與參考點G的指數值必須大約相 等,可公式化為:
5
1 p
p
I
I ≅
,I
p2≅ I
p4 (3-92 式) 其中1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 G 的指數值在期貨及加權股價指數資料的取樣過程中,本研究將兩個參考點 O 及參考點 G 彼此之間的差距設為 100,而在權值股資料的取樣過程中,將數值差距設為 2,亦即 p1、p5 兩筆資料彼此之間的數值差距須介於 0 到 100 或 0 到 2 之間,p2、p4 亦同,
可公式化為:
c I I I
I
p−
p≅
p−
p<
≤
5 1 4 20
(3-93 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 G 的指數值在 3-92 式與 3-93 式成立的情況下,亦可進一步推得 3-94 式與 3-95 式之關係成 立。
c I I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
4 5 2 1 (3-94 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p 、I
p4代表參考點 G 的指數值c I
I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
3 4 3 2 (3-95 式)其中
c 為常數
2
I
p、
I
p4代表參考點 G 的指數值3
I
p代表參考點 2G 的指數值 茲將參考點PG的選取規則整理如下:
5
1 p
p
I
I ≅
,I
p2≅ I
p4 (3-96 式)c
I I I
I − ≅ − <
≤
0
c I
I I
I
p−
p−
p−
p<
≤ ( ) ( )
0
3 4 3 2 (3-99 式)其中
c 為常數
1
I
p 、I
p5代表參考點 O 的指數值2
I
p、
I
p4代表參考點 G 的指數值3
I
p代表參考點 2G 的指數值 第四節 資料探勘技術-關聯規則分析
本研究採用 Apriori 演算法(Agrawal and Srikant, 1994)進行關聯規則分析,其過程 分為兩個階段,第一階段是從資料集中找出所有≥ 最小支持度(minimum support)的頻 繁項目集(frequent itemsets),第二階段再根據所得到的頻繁項目集產生關聯規則,關 聯規則必須達到最小信賴度(minimum confidence)的門檻值。支持度與信賴度的計算 方式如下:
Support(A, B)=(包含項目 A、B 的資料筆數)/所有資料筆數 (3-100 式) Confidence(A→B)
=(包含項目 A、B 的資料筆數)/所有包含 A 的資料筆數
(3-101 式)
在本研究中支持度代表規則出現之頻率,而信賴度是對規則準確度的衡量。有關 支持度的計算方式,以參考點PO之規則a.
P
(Sell P
L→P
O)>P
(Sell P
O →P
G)為例,當 PL與PO兩筆資料的平均交易量大於PO與PG之平均交易量時,規則a便視為成立,支持 度計為 1,而依據參考點PO之選取規則所取出的資料區間當中,若規則a的成立次數 為 3 次,支持度便為 3,各參考點中 4 條規則之支持度計算方式以此類推。此外,為 了避免過多的關聯規則造成計算的複雜性,本研究將最小支持度設定為 3、最小信賴 度設定為 95%,在關聯規則的探勘結果方面,亦僅針對高頻 2-項目組加以解釋,以 凸顯 個別 規則彼此之間的關聯性,並且避免過長的關聯法則造成解釋上的困難,如 {a}=>{b, c}。第肆章 實證結果與分析
根據第三章所建立之研究模型,本章針對加權股價指數、台指期貨以及台積電、
鴻海、台塑化、中華電與國泰金等 5 檔權值股進行實證結果分析,除了檢測總樣本期 間內處置效應是否存在以外,亦個別取出 2007 年 7 月以後所有符合各參考點之選取 規則的資料區間,以檢測次貸環境下投資人的交易行為是否具有售盈持虧之行為偏 誤。
第一節 加權股價指數探勘結果分析
以下分別說明總樣本期間與次貸發生期間加權股價指數之關聯規則探勘結果。
(一) 總樣本期間:
表 4-1 加權股價指數以PO 資料區間
為參考點之關聯規則結果
指數區間 成立之規則 Item set Support≥3 Association rule Confidence
90/12/20~90/12/27 5309.1~5332.98 b {a} 11 {a}=>{c} 82%
91/02/04~91/02/19 5849.85~5861.66 b {b} 16 {c}=>{a} 100%
91/04/17~91/04/23 6390.68~6390.62 a、c {c} 9 {b}=>{d} 81%
92/01/14~92/01/20 4992.42~4951.03 b、d {d} 14 {d}=>{b} 93%
92/01/22~92/01/28 4993.27~5015.16 b {a, c} 9 - -
92/07/25~92/08/14 5394.75~5436.75 b、d {b, d} 13 - -
92/10/07~92/10/14 5856.68~5938.42 b、d - - - -
93/01/06~93/01/12 6144.01~6219.71 a、c - - - -
93/03/03~93/03/09 6932.17~6973.9 b、d - - - -
94/07/19~94/07/25 6416.34~6420.45 a - - - -
95/01/10~95/01/16 6707.4~6724.18 b、d - - - -
95/04/17~95/04/21 7000.09~7093.05 b、d - - - -
95/05/05~95/05/11 7370.44~7361.45 b、d - - - -
95/12/20~95/12/28 7648.35~7732.93 a、c - - - -
96/01/08~96/01/12 7736.71~7761.71 a、c - - - -
96/03/08~96/03/14 7573.87~7570.27 b、d - - - -
96/03/23~96/03/29 7859.32~7848.33 a、c - - - -
96/04/10~96/04/14 8048.39~8045.12 b、d - - - -
96/04/13~96/04/18 8002.3~8003.31 a、c、d - - - -
96/06/07~96/06/13 8355.26~8346.39 a - - - -
97/01/22~97/01/28 7581.96~7485.79 a、c - - - -
97/03/27~97/04/02 8605.95~8605.32 b、d - - - -
97/05/06~97/05/12 8857.37~8830.05 b、d - - - -
97/07/25~97/08/12 7233.62~7293.8 b、d - - - -
表 4-1 顯示信賴度≥ 95%且為高頻 2-項目組之關聯法則有{c}=>{a},對照第三章 參考點PO
O G
O O
G
L
O O
L O
的 4 條規則得知有以下的關係存在,茲說明如下:
圖 4-1 以PO
) (
)
(
Sell P
LP
OP Sell P
GP
OP
→ > →為參考點之趨勢示意圖
與
P
(Sell P
L →P
O)>P
(Sell P
O →P
G)有所關聯,其代表意義為若指數由虧損價格PL回到購買價格PO時,投資人賣出的機率高於指數 由獲利價格PG回到購買價格PO,則可進一步得知,當指數由虧損價格PL回到購買價 格PO時,投資人賣出的機率會高於指數由購買價格PO漲到獲利價格PG
表 4-2 加權股價指數以P
。此一關聯法 則說明,當加權股價指數處於震盪整理期間,若投資人的投資績效由虧損回到接近損 益兩平時,將呈現出較為明顯的風險趨避態度,極有可能因為不願面對指數震盪所帶 來的不確定性,而選擇出售持有部位。
(二) 次貸發生期間:
O 資料區間
為參考點之關聯規則結果
指數區間 成立之規則 Item set Support
≥
3 Association rule Confidence96/07/10~96/07/16 9384.73~9417.32 b、d {a} 3 {a}=>{c} 100%
96/09/04~96/09/10 8922.98~8937.58 a、c {b} 4 {c}=>{a} 100%
97/01/14~97/01/18 8173.41~8184.65 a、c {c} 3 {b}=>{d} 100%
97/01/22~97/01/28 7581.96~7485.79 a、c {d} 4 {d}=>{b} 100%
97/03/27~97/04/02 8605.95~8605.32 b、d {a, c} 3 - -
97/05/06~97/05/12 8857.37~8830.05 b、d {b, d} 4 - -
97/07/25~97/08/12 7233.62~7293.8 b、d - - - -
表 4-2 顯示信賴度≥ 95%且為高頻 2-項目組之關聯法則有 1.{a}=>{c}、2.{c}=>{a}、
3.{b}=>{d}與 4.{d}=>{b},其中 1 與 2 的代表意義相近,3 與 4 之情況亦同,因此以 下僅針對關聯法則 1、3 加以解釋,對照第三章參考點PO
O G
O O
G
L
O O
L O
的 4 條規則得知有以下的關 係存在,茲說明如下:
圖 4-2 以PO
) (
)
(
Sell P
LP
OP Sell P
OP
GP
→ > →為參考點之趨勢示意圖
1. 與
P
(Sell P
L →P
O)>P
(Sell P
G →P
O)有所關 聯,其代表意義為若指數由虧損價格PL回到購買價格PO時,投資人賣出的機率高於 指數由購買價格PO漲到獲利價格PG,則可進一步得知,當指數由虧損價格PL回到購 買價格PO時,投資人賣出的機率會高於指數由獲利價格PG回到購買價格PO) (
)
(
Sell P
OP
LP Sell P
GP
OP
→ < →。此一關 聯法則說明,當加權股價指數處於震盪整理期間,若投資人的投資績效由虧損回到接 近損益兩平時,將呈現出較為明顯的風險趨避態度,極有可能因為不願面對指數震盪 所帶來的不確定性,而選擇出售持有部位。
3. 與
P
(Sell P
O →P
L)<P
(Sell P
O →P
G)有所關 聯,其代表意義為若指數由購買價格PO跌到虧損價格PL時,投資人賣出的機率低於 指數由獲利價格PG回到購買價格PO,則可進一步得知,當指數由購買價格PO跌到虧 損價格PL時,投資人賣出的機率會低於指數由購買價格PO漲到獲利價格PG。此一關 聯法則說明,當加權股價指數處於震盪整理期間,若投資人因虧損而不願出售持有部 位,則可預期該些投資人於獲利初期時,會具有急於實現獲利之傾向。(一) 總樣本期間:
表 4-3 加權股價指數以PL
資料區間
為參考點之關聯規則結果
指數區間 成立之規則 Item set Support≥3 Association rule Confidence
91/02/19~91/03/04 5861.66~5874.48 e、f、h {e} 6 {e}=>{f} 100%
91/04/08~91/04/12 6190.83~6182.59 e、f {f} 7 {f}=>{e} 86%
92/07/28~92/08/15 5451.8~5488.74 e、f、h {g} 4 {e}=>{h} 83%
93/02/02~93/02/06 6319.96~6353.35 e、f、h {h} 7 {h}=>{e} 71%
95/12/11~95/12/15 7612.12~7538.82 g {e, f} 6 {f}=>{h} 71%
96/01/09~96/01/15 7790.01~7783.5 g、h {e, h} 5 {h}=>{f} 71%
96/03/26~96/03/30 7877.82~7884.41 g、h {f, h} 5 {g}=>{h} 75%
96/11/26~96/11/30 8528.33~8586.4 e、f、g、h {g, h} 3 {h}=>{g} 43%
97/05/07~97/05/13 8926.34~8989.53 f {e, f, h} 5 {e}=>{f, h} 83%
97/07/24~97/08/11 7368.08~7325.62 e、f、h - - {f}=>{e, h} 71%
- - - {h}=>{e, f} 71%
- - - {e, f}=>{h} 83%
- - - {e, h}=>{f} 100%
- - - {f, h}=>{e} 100%
表 4-3 顯示信賴度≥ 95%且為高頻 2-項目組之關聯法則有{e}=>{f},對照第三章 參考點PL
O
L
2L L
O
的 4 條規則得知有以下的關係存在,茲說明如下:
圖 4-3 以PL ) (
)
(
Sell P
2LP
LP Sell P
LP
OP
→ < →為參考點之趨勢示意圖
與
P
(Sell P
L →P
2L)<P
(Sell P
O →P
L)有 所 關 聯,其代表意義為若指數由持續下跌P2L回到虧損價格PL時,投資人賣出的機率低於 指數由虧損價格PL回到購買價格PO,則可進一步得知,當指數由虧損價格PL持續下 跌到P2L時,投資人賣出的機率會低於指數由購買價格PO跌到虧損價格PL。此一關聯 法則說明,當加權股價指數處於持續下跌時期,若投資人的投資績效由虧損回到接近 損益兩平時,其賣出意願較高,則可預期該些投資人在投資持續虧損的情況下,會具 有不願實現損失之傾向。(二) 次貸發生期間:
表 4-4 加權股價指數以PL
資料區間
為參考點之關聯規則結果
指數區間 成立之規則 Item set Support≥3 Association rule Confidence
96/11/26~96/11/30 8528.33~8586.4 e、f、g、h {f} 3 - -
97/05/07~97/05/13 8926.34~8989.53 f - - - -
97/07/24~97/08/11 7368.08~7325.62 e、f、h - - - -
表 4-4 顯示並無信賴度≥ 95%且為高頻 2-項目組之關聯法則,依據參考點PL之選 取規則所取得的樣本區間資料亦僅有三筆,並不足以對投資人之投資行為作出解釋。
(一) 總樣本期間:
表 4-5 加權股價指數以PG
資料區間
為參考點之關聯規則結果
指數區間 成立之規則 Item set Support≥3 Association rule Confidence
91/04/01~91/04/08 6186.44~6190.83 i {i} 13 {i}=>{j} 62%
92/01/21~92/01/27 4945.87~4972.59 i、j {j} 10 {j}=>{i} 80%
92/06/17~92/06/23 4973.19~4921.72 i、j {k} 3 {i}=>{l} 46%
92/10/16~92/10/22 6035.74~6041.86 i、j、l {l} 9 {l}=>{i} 67%
93/02/06~93/02/12 6353.35~6436.95 i {i, j} 8 {j}=>{l} 80%
95/04/04~95/04/11 6665.6~6757.17 i、j、l {i, l} 6 {l}=>{j} 89%
95/05/04~95/05/10 7345.04~7324.71 i、j、l {j, l} 8 {k}=>{l} 100%
96/01/22~96/01/26 7842.47~7821.32 i、j、l {k, l} 3 {l}=>{k} 33%
96/03/22~96/03/28 7823.67~7788.14 i {i, j, l} 6 {i}=>{j, l} 46%
96/05/08~96/05/25 8095.84~8159.97 i、j、l - - {j}=>{i, l} 60%
96/08/01~96/08/07 8891.88~8862.31 j、k、l - - {l}=>{i, j} 67%
97/01/11~97/01/17 8029.31~8101.63 i - - {i, j}=>{l} 75%
97/05/05~97/05/09 8837.07~8792.39 j、k、l - - {i, l}=>{j} 100%
97/07/22~97/08/07 7065.65~7024.58 i、j、l - - {j, l}=>{i} 75%
98/03/16~98/03/20 4971.32~4961.62 i - - - -
98/05/20~98/05/26 6703.62~6683.11 k、l - - - -
表 4-5 顯示信賴度≥ 95%且為高頻 2-項目組之關聯法則有{k}=>{l},對照第三章 參考點PG
表 4-5 顯示信賴度≥ 95%且為高頻 2-項目組之關聯法則有{k}=>{l},對照第三章 參考點PG