• 沒有找到結果。

關聯探勘在台灣股市選股之應用

在文檔中 中 華 大 學 (頁 145-200)

第六章

第六章 第六章 關聯探勘在台灣股市選股之應用 關聯探勘在台灣股市選股之應用 關聯探勘在台灣股市選股之應用 關聯探勘在台灣股市選股之應用

6-1 前言 前言 前言 前言

本章將使用關聯探勘技術發現台灣股市在 1981~2006 年中的關聯模型,使用 的演算法為關聯分析。關聯分析是給予一組資料,每筆資料紀錄一些項目,找到 能夠以某些項目出現與否來預測其它項目出現與否的規則。

本研究將 10 個第 t 年財務報表變數以及一個第 t+1 年報酬率等 11 個變數使 用 5 分法、3 分法及 2 分法,產生 55、33 及 22 個「項目」,將每一個個股的年 資料視為一個「交易」,找出「項目」之間的關聯規則,例如:

IF 週轉率=低,BPR=高 THEN 隔年報酬率=高 (Support=120,Confidence=30%) IF 週轉率=高,ROE=低 THEN 隔年報酬率=低 (Support=210,Confidence=35%) 其中關聯探勘最重要的輸入變數是信賴度(Confidence)和支持度(Support),這兩個 變數影響關聯探勘的成效。

研究的目的有二:

(3) 發現台灣股市在 1981~2006 年中的關聯規則

(4) 從關聯規則中發現獲利大風險低的規則,做為選股依據。

本章以下共有四個小節:

第 2 節為方法。說明變數的表現方式,和資料分割的期間和筆數。

第 3 節為結果和討論。包括「二分表現法」、「三分表現法」、「五分表現法」

之結果,以及其關聯規則之異同,並歸納關聯規則的發現。

第 4 節為選股的效益與比較。為了探討所建的關聯模型是否可提高投資績 效,利用報酬平均值、報酬標準差和夏普指數等三方面來評估各種模型選股的效 益。

第 5 節為結語。闡述本章的總結論及建議。

6-2 方法 方法 方法 方法

本章所用的資料同前章,不同的是變數每一個變數(含自變數與因變數)均須 轉換成多個二元變數,圖 6-1 為二分法的資料表現方式與得到的規則。

二分表現法 (表 6-1)

當 0≦X1≦0.5,X1A=1,否則 X1A=0;

當 0.5<X1≦1.0,X1B=1,否則 X1B=0。

其餘 X2~X11 依此類推,其中 X11 即因變數 Y。

三分表現法 (表 6-2)

當 0≦X1≦1/3,X1A=1,否則 X1A=0;

當 1/3<X1≦2/3,X1B=1,否則 X1B=0;

當 2/3<X1≦1.0,X1C=1,否則 X1C=0。

其餘 X2~X11 依此類推,其中 X11 即因變數 Y。

五分表現法 (表 6-3)

當 0≦X1≦1/5,X1A=1,否則 X1A=0;

當 1/5<X1≦2/5,X1B=1,否則 X1B=0;

當 2/5<X1≦3/5,X1C=1,否則 X1C=0;

當 3/5<X1≦4/5,X1D=1,否則 X1D=0;

當 4/5<X1≦1.0,X1E=1,否則 X1E=0。

其餘 X2~X11 依此類推,其中 X11 即因變數 Y。

表 6-1

資料的表現:

二分表現法

0≦X≦1/2 1/2<X≦1 X1 第 t 年報酬率 X1A X1B

X2 ß 風險因子 X2A X2B

X3 負債權益比 X3A X3B X4 淨值報酬率 X4A X4B

X5 成交量 X5A X5B

X6 周轉率 X6A X6B

X7 市值 X7A X7B

X8 股價 X8A X8B

X9 淨值市值比 X9A X9B

X10 成長價值報酬率 X10A X10B

X11 第 t+1 年報酬率 X11A X11B

表 6-2

資料的表現:

三分表現法

0≦X≦1/3 1/3<X≦2/3 2/3<X≦1 X1 第 t 年報酬率 X1A X1B X1C

X2 ß 風險因子 X2A X2B X2C

X3 負債權益比 X3A X3B X3C X4 淨值報酬率 X4A X4B X4C

X5 成交量 X5A X5B X5C

X6 周轉率 X6A X6B X6C

X7 市值 X7A X7B X7C

X8 股價 X8A X8B X8C

X9 淨值市值比 X9A X9B X9C

X10 成長價值報酬率 X10A X10B X10C

X11 第 t+1 年報酬率 X11A X11B X11C

表 6-3

資料的表現:

五分表現法

0≦X≦1/5 1/5<X≦2/5 2/5<X≦3/5 3/5<X≦4/5 4/5<X≦1 X1 第 t 年報

酬率 X1A X1B X1C X1D X1E X2 ß 風險因

子 X2A X2B X2C X2D X2E

X3 負債權益

比 X3A X3B X3C X3D X3E

X4 淨值報酬

率 X4A X4B X4C X4D X4E

X5 成交量 X5A X5B X5C X5D X5E

X6 周轉率 X6A X6B X6C X6D X6E

X7 市值 X7A X7B X7C X7D X7E

X8 股價 X8A X8B X8C X8D X8E

X9 淨值市值

比 X9A X9B X9C X9D X9E

X10 成長價值

報酬率 X10A X10B X10C X10D X10E

X11 第 t+1 年

報酬率 X11A X11B X11C X11D X11E

表 6-4

資料的分割

時間 資料數 訓練期間 1981~1999 2792 測試期間 2000~2006 2969

圖 6-1

二分表現法的資料與得到的規則

6-3 結果與討論 結果與討論 結果與討論 結果與討論

6-3-1 二分表現法結果與討論 二分表現法結果與討論 二分表現法結果與討論 二分表現法結果與討論

關聯分析中,有兩個很重要的門檻值,即信賴度(Confidence)及支持度 (Support)。二分法的門檻值設定的原則如下:

 信賴度

因二分法原機率=1/2=50%,考慮提升 1.2 倍,採用 60%信賴度作為門檻值。

 支持度

因二分法的二項目在隨機下的 Support=(1/2)*(1/2)*data(2792)數=700 左右。

但實際上並非隨機,在相依下可能大於小於此值,故取 200~1000 間的值,本小 節選擇了 Support 值為 1000、500、300、200 這四個不同的門檻值作研究。

表 6-5 說明了支持度與關聯規則的關係,由表 6-5 可知,在 Confidence=60%,

Support=500 的門檻值下,結果端為 X11 的關聯規則數在訓練範例只有 1 個,在 Confidence=60%,Support=200 門檻值下,結果端為 X11 的關聯規則數共有 38 個,所有參數組合的執行時間都在 1 小時之內。

二分表現法在訓練期間其支持度=1000 下發現以下的關聯規則,並繪製成關 聯規則圖 6-2;而在測試期間發現的關聯規則亦繪製成關聯規則圖 6-3。

訓練期間關聯規則如下:

 影響 X1 的變數:無。

 影響 X2 的變數:無。

 影響 X3 的變數:無。

 影響 X4 的變數:X8、X10 成正比。

 影響 X5 的變數:X6 成正比。

 影響 X6 的變數:X5 成正比。

 影響 X7 的變數:無。

 影響 X8 的變數:X4 成正比、X9 成反比。

 影響 X9 的變數:X8 成反比。

 影響 X10 的變數:X4 成正比。

測試期間關聯規則如下:

 影響 X1 的變數:無。

 影響 X2 的變數:X5、X6 成正比。

 影響 X3 的變數:無。

 影響 X4 的變數:X8、X10 成正比、X9 成反比。

 影響 X5 的變數:X2、X6、X7 成正比。

 影響 X6 的變數:X2、X5 成正比。

 影響 X7 的變數:X5、X8 成正比、X9 成反比。

 影響 X8 的變數:X4、X7 成反比、X9 成反比。

 影響 X9 的變數:X7、X8 成反比。

 影響 X10 的變數:無。

而在訓練及測試期間都有出現的關聯規則如下:

 影響 X4 的變數:X8 成正比。

 影響 X5 的變數:X6 成正比。

 影響 X6 的變數:X5 成正比。

 影響 X8 的變數:X4 成正比、X9 成反比。

 影響 X9 的變數:X8 成反比。

接著本小節將探討二分表現法在訓練期間其支持度=500 之下在關聯右側出 現 X11B 的關聯規則,也就是好股票的篩選條件為何。在訓練範例中只有 1 條關

聯規則右側出現 X11B,其關聯左側為 X6A,X10B,而在測試範例中有 6 條關聯 規則右側出現 X11B,其中信賴度最高的是 X1A,X10BX11B,在訓練及測試關 聯左側皆有出現 X10B,可見 X10B 是好股票的重要篩選條件。另外,二分表現 法在訓練期間其支持度=300 之下,在訓練範例中有 8 條關聯規則右側出現 X11B,而在測試範例中有 37 條關聯規則右側出現 X11B,在訓練和測試期間裡 X2A、X4A、X5A、X6A、X7B、X9B、X10B 等變數同時都有出現,也就是說 這些變數是好股票的重要篩選條件。

圖 6-2

二分表現法之支持度

=1000

下的關聯圖:訓練期間

圖 6-3

二分表現法之支持度

=1000

下的關聯圖:測試期間

表 6-5

二分表現法之支持度與關聯規則的關係

1000 800 500 300 200 關聯規則數 14 81 530 2818 5395 結果端為 X11 的關聯規則數 0 0 1 11 38 訓練

執行時間 36s 57s 7m9s 17m 48m 關聯規則數 48 142 1381 3851 6135 結果端為 X11 的關聯規則數 0 2 15 91 181 測試

執行時間 41s 1m 8m21s 25m 57m

表 6-6

二分表現法之支持度

=1000

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序

)

Rule # Conf. % Antecedent (a)

Consequent

(c) Support(a) Support(c) Support

(a U c) Lift Ratio 7 0.726 X4A X10A 1382 1382 1003 1.466 11 0.731 X4B X10B 1410 1410 1031 1.448 8 0.726 X10A X4A 1382 1382 1003 1.466 6 0.729 X8A X4A 1386 1382 1011 1.474 12 0.731 X10B X4B 1410 1410 1031 1.448 10 0.736 X8B X4B 1406 1410 1035 1.458 13 0.716 X6B X5B 1410 1408 1010 1.420 14 0.717 X5B X6B 1408 1410 1010 1.420 5 0.732 X4A X8A 1382 1386 1011 1.474 2 0.860 X9B X8A 1402 1386 1205 1.731 9 0.734 X4B X8B 1410 1406 1035 1.458 4 0.870 X9A X8B 1390 1406 1209 1.727 3 0.860 X8B X9A 1406 1390 1209 1.727 1 0.869 X8A X9B 1386 1402 1205 1.731

表 6-7

二分表現法之支持度

=1000

下的關聯規則:測試期間

(

Consequent

Antecedent

排序

)

Rule

#

Conf.

% Antecedent (a) Consequent (c)

Support (a)

Support (c)

Support

(a U c) Lift Ratio

24 0.766 X5A X2A 1480 1479 1133 1.537

33 0.751 X6A X2A 1479 1479 1111 1.508

28 0.768 X5B X2B 1489 1490 1143 1.530

36 0.753 X6B X2B 1490 1490 1122 1.501

18 0.775 X8A X4A 1482 1481 1148 1.553

15 0.790 X8A,X9B X4A 1310 1481 1035 1.584

30 0.759 X9B X4A 1482 1481 1125 1.522

8 0.698 X9B X4A,X8A 1482 1148 1035 1.806

6 0.698 X8A X4A,X9B 1482 1125 1035 1.843

19 0.776 X8B X4B 1487 1488 1154 1.549

13 0.815 X8B,X9A X4B 1315 1488 1072 1.627

31 0.761 X9A X4B 1487 1488 1131 1.518

23 0.766 X2A X5A 1479 1480 1133 1.537

37 0.747 X6A X5A 1479 1480 1104 1.497

21 0.767 X7A X5A 1479 1480 1134 1.538

27 0.767 X2B X5B 1490 1489 1143 1.530

40 0.748 X6B X5B 1490 1489 1114 1.491

26 0.768 X7B X5B 1490 1489 1144 1.531

34 0.751 X2A X6A 1479 1479 1111 1.508

38 0.746 X5A X6A 1480 1479 1104 1.497

35 0.753 X2B X6B 1490 1490 1122 1.501

39 0.748 X5B X6B 1489 1490 1114 1.491

22 0.766 X5A X7A 1480 1479 1134 1.538

41 0.717 X8A X7A 1482 1479 1063 1.440

45 0.701 X9B X7A 1482 1479 1039 1.407

25 0.768 X5B X7B 1489 1490 1144 1.531

43 0.720 X8B X7B 1487 1490 1071 1.435

48 0.704 X9A X7B 1487 1490 1047 1.403

17 0.775 X4A X8A 1481 1482 1148 1.553

5 0.920 X4A,X9B X8A 1125 1482 1035 1.843

42 0.719 X7A X8A 1479 1482 1063 1.440

10 0.884 X9B X8A 1482 1482 1310 1.771

16 0.699 X4A X8A,X9B 1481 1310 1035 1.584

20 0.776 X4B X8B 1488 1487 1154 1.549

44 0.719 X7B X8B 1490 1487 1071 1.435

12 0.884 X9A X8B 1487 1487 1315 1.766

1 0.948 X9A,X4B X8B 1131 1487 1072 1.893

4 0.721 X9A X8B,X4B 1487 1154 1072 1.855

14 0.720 X4B X8B,X9A 1488 1315 1072 1.627

32 0.760 X4B X9A 1488 1487 1131 1.518

47 0.703 X7B X9A 1490 1487 1047 1.403

11 0.884 X8B X9A 1487 1487 1315 1.766

3 0.929 X8B,X4B X9A 1154 1487 1072 1.855

2 0.721 X8B X9A,X4B 1487 1131 1072 1.893

29 0.760 X4A X9B 1481 1482 1125 1.522

7 0.902 X4A,X8A X9B 1148 1482 1035 1.806

46 0.703 X7A X9B 1479 1482 1039 1.407

9 0.884 X8A X9B 1482 1482 1310 1.771

表 6-8

二分表現法之支持度

=500

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule # Conf. % Antecedent (a) Consequent (c) Support(a) Support(c) Support(a U c) Lift Ratio

525 0.611 X6A,X10B X11B 872 1401 533 1.218

表 6-9

二分表現法之支持度

=500

下的關聯規則:測試期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule

#

Conf.

% Antecedent (a) Consequent

(c) Support(a) Support(c) Support (a U c)

Lift Ratio 1350 0.606 X10A X11A 1479 1483 896 1.213 1358 0.606 X10B X11B 1490 1486 903 1.211 1166 0.664 X1A,X10B X11B 753 1486 500 1.327 1289 0.622 X2B,X10A X11A 807 1483 502 1.245 1251 0.632 X5B,X10A X11A 791 1483 500 1.266

1196 0.651 X6B,X10A X11A 793 1483 516 1.303 1209 0.648 X8A,X10B X11B 838 1486 543 1.295 87 0.6146 X8A,X10B X9B,X11B 838 841 515 2.170 1217 0.645 X8A,X9B,X10B X11B 798 1486 515 1.289 1230 0.641 X8B,X10A X11A 835 1483 535 1.283 1317 0.613 X8B,X1B X11A 882 1483 541 1.228 1212 0.645 X8B,X9A,X10A X11A 777 1483 501 1.291 1190 0.652 X9A,X10A X11A 909 1483 593 1.306 1344 0.607 X9A,X1B X11A 897 1483 544 1.214 1267 0.629 X9B,X10B X11B 912 1486 574 1.258

表 6-10

二分表現法之支持度

=300

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule # Conf. % Antecedent (a) Consequent (c)

Support (a)

Support (c)

Support (a U c)

Lift Ratio 2769 0.603 X4A,X6B,X10A X11A 657 1391 396 1.210 2776 0.601 X4A,X6B,X5B X11A 597 1391 359 1.207 2772 0.602 X6B,X5B,X10A X11A 605 1391 364 1.208 2662 0.620 X2A,X5A,X10B X11B 537 1401 333 1.236 2668 0.620 X2A,X6A,X10B X11B 597 1401 370 1.235 2736 0.612 X4B,X6A,X10B X11B 649 1401 397 1.219 2795 0.601 X5A,X10B X11B 721 1401 433 1.197 2744 0.611 X5A,X6A,X10B X11B 588 1401 359 1.217 2740 0.611 X6A,X10B X11B 872 1401 533 1.218 2518 0.636 X6A,X10B,X9B X11B 481 1401 306 1.268 2781 0.605 X6A,X7B,X10B X11B 526 1401 318 1.205 表 6-11

二分表現法之支持度

=300

下的關聯規則:測試期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

) Rule

#

Conf.

% Antecedent (a) Consequent (c)

Support (a)

Support (c)

Support (a U c)

Lift Ratio 3750 0.606 X10A X11A 1479 1483 896 1.213 3199 0.647 X10A,X1B X11A 753 1483 487 1.295 3821 0.601 X10A,X3A X11A 679 1483 408 1.203 3536 0.621 X10A,X4B X11A 556 1483 345 1.242 3511 0.622 X2B,X10A X11A 807 1483 502 1.245 3360 0.633 X2B,X5B,X10A X11A 640 1483 405 1.267 3685 0.610 X2B,X5B,X1B X11A 590 1483 360 1.222 3138 0.653 X2B,X6B,X10A X11A 613 1483 400 1.306 3696 0.609 X2B,X6B,X1B X11A 594 1483 362 1.220 3825 0.601 X2B,X6B,X9A X11A 686 1483 412 1.202 3402 0.630 X2B,X7B,X10A X11A 554 1483 349 1.261 3756 0.605 X2B,X7B,X1B X11A 542 1483 328 1.212 3105 0.656 X2B,X8B,X10A X11A 509 1483 334 1.314

3196 0.647 X2B,X8B,X1B X11A 496 1483 321 1.296 3089 0.658 X2B,X9A,X10A X11A 535 1483 352 1.317 3359 0.633 X2B,X9A,X1B X11A 493 1483 312 1.267 3687 0.610 X3B,X10A X11A 800 1483 488 1.221 2893 0.679 X3B,X9A,X10A X11A 442 1483 300 1.359 3370 0.632 X5B,X10A X11A 791 1483 500 1.266 3002 0.666 X5B,X6B,X10A X11A 607 1483 404 1.333 3640 0.614 X5B,X6B,X1B X11A 616 1483 378 1.229 3747 0.606 X5B,X6B,X8B X11A 650 1483 394 1.214 3602 0.616 X5B,X6B,X9A X11A 654 1483 403 1.234 3328 0.635 X5B,X7B,X10A X11A 625 1483 397 1.272 2968 0.669 X5B,X8B,X10A X11A 502 1483 336 1.340 3124 0.654 X5B,X8B,X1B X11A 515 1483 337 1.310 2938 0.673 X5B,X9A,X10A X11A 532 1483 358 1.347 3151 0.651 X5B,X9A,X1B X11A 525 1483 342 1.304 3157 0.651 X6B,X10A X11A 793 1483 516 1.303 2649 0.707 X6B,X10A,X1B X11A 437 1483 309 1.416 2977 0.669 X6B,X7B,X10A X11A 495 1483 331 1.339 3690 0.610 X6B,X7B,X1B X11A 528 1483 322 1.221 2864 0.682 X6B,X8B,X10A X11A 497 1483 339 1.366 3435 0.627 X6B,X8B,X1B X11A 558 1483 350 1.256 2781 0.690 X6B,X9A,X10A X11A 533 1483 368 1.382 3462 0.626 X6B,X9A,X1B X11A 564 1483 353 1.253 3507 0.623 X7B,X10A X11A 792 1483 493 1.246 2867 0.682 X7B,X10A,X1B X11A 465 1483 317 1.365 3232 0.644 X7B,X8B,X10A X11A 618 1483 398 1.289 3348 0.634 X7B,X8B,X1B X11A 644 1483 408 1.268 3236 0.644 X7B,X9A,X10A X11A 640 1483 412 1.289 3476 0.625 X7B,X9A,X1B X11A 640 1483 400 1.251 3272 0.641 X8B,X10A X11A 835 1483 535 1.283 2829 0.685 X8B,X10A,X1B X11A 518 1483 355 1.372 3515 0.622 X8B,X10A,X4B X11A 534 1483 332 1.245 3643 0.613 X8B,X1B X11A 882 1483 541 1.228 3733 0.607 X8B,X1B,X3A X11A 501 1483 304 1.215 3220 0.645 X8B,X9A,X10A X11A 777 1483 501 1.291 3654 0.613 X8B,X9A,X1B X11A 808 1483 495 1.227 3141 0.652 X9A,X10A X11A 909 1483 593 1.306 2882 0.680 X9A,X10A,X1B X11A 556 1483 378 1.361 3540 0.620 X9A,X10A,X4B X11A 553 1483 343 1.242 3739 0.607 X9A,X1B X11A 897 1483 544 1.214 3761 0.606 X10B X11B 1490 1486 903 1.211 3570 0.620 X10B,X7A X11B 792 1486 491 1.239 3033 0.664 X1A,X10B X11B 753 1486 500 1.327 3830 0.602 X1A,X5A,X9B X11B 522 1486 314 1.202 2809 0.688 X1A,X6A,X10B X11B 446 1486 307 1.375 3599 0.618 X1A,X6A,X9B X11B 544 1486 336 1.234 2862 0.684 X1A,X8A,X10B X11B 465 1486 318 1.366 2971 0.671 X1A,X9B,X10B X11B 516 1486 346 1.340

3589 0.618 X2A,X10B X11B 807 1486 499 1.235 3658 0.614 X2A,X10B,X7A X11B 541 1486 332 1.226 3552 0.621 X2A,X5A,X10B X11B 612 1486 380 1.241 3279 0.641 X2A,X8A,X10B X11B 513 1486 329 1.281 3406 0.631 X2A,X9B,X10B X11B 542 1486 342 1.261 3744 0.608 X3A,X10B  X11B 800 1486 486 1.214 3787 0.604 X3B,X10B  X11B 690 1486 417 1.208 3431 0.629 X4A,X10B  X11B 558 1486 351 1.257 3325 0.637 X4A,X8A,X10B  X11B 526 1486 335 1.273 3430 0.629 X4A,X9B,X10B  X11B 558 1486 351 1.257 3487 0.625 X5A,X10B  X11B 792 1486 495 1.249 3492 0.625 X5A,X10B,X7A X11B 613 1486 383 1.248 3095 0.659 X5A,X8A,X10B X11B 492 1486 324 1.316 3386 0.632 X5A,X9B,X10B X11B 533 1486 337 1.263 3482 0.626 X6A,X10B X11B 793 1486 496 1.250 3355 0.634 X6A,X10B,X7A X11B 495 1486 314 1.267 3438 0.628 X6A,X2A,X10B X11B 619 1486 389 1.256 3798 0.603 X6A,X2A,X9B X11B 668 1486 403 1.205 3449 0.628 X6A,X5A,X10B X11B 602 1486 378 1.255 3065 0.662 X6A,X8A,X10B X11B 532 1486 352 1.322 3801 0.603 X6A,X8A,X9B X11B 804 1486 485 1.205 3188 0.649 X6A,X9B,X10B X11B 564 1486 366 1.297 3200 0.648 X8A,X10B X11B 838 1486 543 1.295 3251 0.644 X8A,X10B,X7A X11B 593 1486 382 1.287 3231 0.645 X8A,X9B,X10B X11B 798 1486 515 1.289 3426 0.629 X9B,X10B X11B 912 1486 574 1.258 3401 0.631 X9B,X10B,X7A X11B 621 1486 392 1.261 111 0.617 X10A,X4B X9A,X11A 556 842 343 2.175 92 0.629 X4A,X10B X9B,X11B 558 841 351 2.221 116 0.615 X8A,X10B X9B,X11B 838 841 515 2.170

6-3-2 三分表現法結果與討論 三分表現法結果與討論 三分表現法結果與討論 三分表現法結果與討論

同 6-3-1 節的作法,本小節將探討三分法。三分法的門檻值設定的原則如下:

 信賴度

因三分法原機率=1/3=33.3%,考慮提升 1.2 倍,採用 40%信賴度做為門檻值。

 支持度

因三分法的三項目在隨機下的 Support=(1/3)*(1/3)*data(2792)數=300 左右,

但實際上並非隨機,在相依下可能大於小於此值,故取 100~500 間的值,本小節 選擇了 Support 值為 500、300、200 這三個不同的門檻值作研究。

表 6-12 說明了支持度與關聯規則的關係,由表 6-12 可知,在 Confidence=

33.3%,Support=300 的門檻值下,結果端為 X11 的關聯規則數在訓練範例有 4

個,在 Confidence=33.3%,Support=100 門檻值下,結果端為 X11 的關聯規則數 共有 166 個,所有參數組合的執行時間都在 3 小時之內。

三分表現法在訓練期間其支持度=500 之下發現以下的關聯規則,並繪製成 關聯規則圖 6-4;而在測試期間發現的關聯規則亦繪製成關聯規則圖 6-5。

訓練期間關聯規則如下:

 影響 X1 的變數:X8 成正比、X9 成反比。

 影響 X2 的變數:X5、X6 成正比。

 影響 X3 的變數:無。

 影響 X4 的變數:X8、X10 成正比、X9 成反比。

 影響 X5 的變數:X2、X6、X7 成正比。

 影響 X6 的變數:X2、X5 成正比。

 影響 X7 的變數:X5 成正比。

 影響 X8 的變數:X1、X4 成正比。X9 成反比。

 影響 X9 的變數:X1、X4、X8 成反比。

 影響 X10 的變數:X4 成正比。

測試期間關聯規則如下:

 影響 X1 的變數:無。

 影響 X2 的變數:X5、X6、X7 成正比。

 影響 X3 的變數:無。

 影響 X4 的變數:X7、X8、X10 成正比、X9 成反比。

 影響 X5 的變數:X2、X6、X7 成正比。

 影響 X6 的變數:X2、X5 成正比。

 影響 X7 的變數:X2、X4、X5、X8 成正比。

 影響 X8 的變數:X4、X7 成正比、X9 成反比。

 影響 X9 的變數:X4、X8 成反比。

 影響 X10 的變數:X4 成正比。

而在訓練及測試期間都有出現的關聯規則如下:

 影響 X2 的變數:X5、X6 成正比。

 影響 X4 的變數:X8、X10 成正比、X9 成反比。

 影響 X5 的變數:X2、X6、X7 成正比。

 影響 X6 的變數:X2、X5 成正比。

 影響 X7 的變數:X5 成正比。

 影響 X8 的變數:X1、X4 成正比、X9 成反比。

 影響 X9 的變數:X4、X8 成反比。

 影響 X10 的變數:X4 成正比。

接著本小節將探討三分表現法在訓練期間其支持度=300 之下在關聯右側出 現 X11C 的關聯規則,也就是好股票的篩選條件為何。在訓練範例中有 2 條關聯 規則右側出現 X11C,而在測試範例中有 3 條關聯規則右側出現 X11C,在訓練 和測試期間只有 X10C 同時都有出現,也就是說 X10C 是好股票的重要篩選條 件。另外,三分表現法在訓練期間其支持度=200 之下,在訓練範例中有 10 條關 聯規則右側出現 X11C,而在測試範例中有 37 條關聯規則右側出現 X11C,在訓 練和測試期間裡 X4C、X10C 這兩個變數同時都有出現,也就是說 X4C、X10C 這兩個變數是好股票的重要篩選條件。

表 6-12

三分表現法支持度與關聯規則的關係

500 400 300 200 100 關聯規則數 56 110 243 887 5709 結果端為 X11 的關聯規則數 0 0 4 16 166 訓練

執行時間 1m26s 1m54s 16m 28m 1h52m 關聯規則數 79 245 482 1876 8137 結果端為 X11 的關聯規則數 0 7 9 38 308 測試

執行時間 1m57s 3m7s 29m 31m 2h45m

圖 6-4

三分表現法之支持度

=500

下的關聯圖:訓練期間

圖 6-5

三分表現法之支持度

=500

下的關聯圖:測試期間

表 6-13

三分表現法之支持度

=500

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序

)

Rule # Conf. % Antecedent (a) Consequent

(c) Support(a) Support(c) Support(a U c) Lift Ratio

19 0.657 X4A X10A 925 925 608 1.984

33 0.606 X4C X10C 944 944 572 1.792

36 0.586 X8A X1A 926 925 543 1.770

38 0.580 X9C X1A 937 925 543 1.749

42 0.578 X4C X1C 944 944 546 1.711

32 0.615 X8C X1C 942 944 579 1.818

21 0.659 X8C,X9A X1C 769 944 507 1.950

30 0.619 X9A X1C 928 944 574 1.829

4 0.546 X9A X1C,X8C 928 579 507 2.635

6 0.538 X8C X1C,X9A 942 574 507 2.618

46 0.564 X5A X2A 929 928 524 1.697

49 0.552 X6A X2A 925 928 511 1.662

44 0.569 X5C X2C 944 934 537 1.701

55 0.540 X6C X2C 944 934 510 1.615

20 0.657 X10A X4A 925 925 608 1.984

26 0.625 X8A X4A 926 925 579 1.887

47 0.559 X9C X4A 937 925 524 1.688

34 0.606 X10C X4C 944 944 572 1.792

41 0.578 X1C X4C 944 944 546 1.711

16 0.683 X8C X4C 942 944 643 2.019

13 0.709 X8C,X9A X4C 769 944 545 2.096

27 0.636 X9A X4C 928 944 590 1.880

8 0.587 X9A X4C,X8C 928 643 545 2.550

2 0.579 X8C X4C,X9A 942 590 545 2.738

45 0.565 X2A X5A 928 929 524 1.697

24 0.641 X6A X5A 925 929 593 1.927

54 0.548 X7A X5A 925 929 507 1.647

43 0.575 X2C X5C 934 944 537 1.701

39 0.590 X6C X5C 944 944 557 1.745

51 0.560 X7C X5C 944 944 529 1.657

50 0.551 X2A X6A 928 925 511 1.662

23 0.638 X5A X6A 929 925 593 1.927

56 0.546 X2C X6C 934 944 510 1.615

40 0.590 X5C X6C 944 944 557 1.745

53 0.546 X5A X7A 929 925 507 1.647

52 0.560 X5C X7C 944 944 529 1.657

35 0.587 X1A X8A 925 926 543 1.770

25 0.626 X4A X8A 925 926 579 1.887

12 0.804 X9C X8A 937 926 753 2.423

18 0.667 X9B X8B 927 924 618 2.014

31 0.613 X1C X8C 944 942 579 1.818

5 0.883 X1C,X9A X8C 574 942 507 2.618

15 0.681 X4C X8C 944 942 643 2.019

1 0.924 X4C,X9A X8C 590 942 545 2.738

10 0.829 X9A X8C 928 942 769 2.456

22 0.537 X1C X8C,X9A 944 769 507 1.950

14 0.577 X4C X8C,X9A 944 769 545 2.096

29 0.608 X1C X9A 944 928 574 1.829

3 0.876 X1C,X8C X9A 579 928 507 2.635

28 0.625 X4C X9A 944 928 590 1.880

7 0.848 X4C,X8C X9A 643 928 545 2.550

9 0.816 X8C X9A 942 928 769 2.456

17 0.669 X8B X9B 924 927 618 2.014

37 0.587 X1A X9C 925 937 543 1.749

48 0.567 X4A X9C 925 937 524 1.688

11 0.813 X8A X9C 926 937 753 2.423

表 6-14

三分表現法之支持度

=500

下的關聯規則:測試期間

(

Consequent

Antecedent

排序

)

Rule

#

Conf.

% Antecedent (a) Consequent (c)

Support (a)

Support (c)

Support (a U c)

Lift Ratio

61 0.611 X4A X10A 988 988 604 1.837

34 0.711 X5A X2A 988 988 702 2.135

45 0.663 X6A X2A 988 988 655 1.992

23 0.796 X6A,X5A X2A 700 988 557 2.391

78 0.517 X7A X2A 988 988 511 1.554

26 0.564 X6A X2A,X5A 988 702 557 2.384

52 0.656 X5C X2C 995 995 653 1.958

54 0.655 X6C X2C 995 995 652 1.955

74 0.524 X7C X2C 995 995 521 1.562

62 0.611 X10A X4A 988 988 604 1.837

76 0.517 X7A X4A 988 988 511 1.554

47 0.655 X8A X4A 989 988 648 1.969

43 0.666 X8A,X9C X4A 814 988 542 2.001

60 0.62 X9C X4A 980 988 608 1.864

20 0.553 X9C X4A,X8A 980 648 542 2.534

10 0.548 X8A X4A,X9C 989 608 542 2.676

71 0.555 X7C X4C 995 995 552 1.655

29 0.736 X8C X4C 993 995 731 2.197

28 0.786 X8C,X9A X4C 846 995 665 2.346

31 0.719 X9A X4C 994 995 715 2.146

33 0.711 X2A X5A 988 988 702 2.135

35 0.709 X6A X5A 988 988 700 2.129

15 0.85 X6A,X2A X5A 655 988 557 2.555

42 0.667 X7A X5A 988 988 659 2.004

51 0.656 X2C X5C 995 995 653 1.958

68 0.603 X6C X5C 995 995 600 1.799

40 0.687 X7C X5C 995 995 684 2.051

46 0.663 X2A X6A 988 988 655 1.992

25 0.793 X2A,X5A X6A 702 988 557 2.384

36 0.709 X5A X6A 988 988 700 2.129

16 0.564 X5A X6A,X2A 988 655 557 2.555

24 0.564 X2A X6A,X5A 988 700 557 2.391

53 0.655 X2C X6C 995 995 652 1.955

67 0.603 X5C X6C 995 995 600 1.799

77 0.517 X2A X7A 988 988 511 1.554

75 0.517 X4A X7A 988 988 511 1.554

41 0.667 X5A X7A 988 988 659 2.004

63 0.603 X8A X7A 989 988 596 1.811

58 0.63 X8A,X9C X7A 814 988 513 1.894

69 0.585 X9C X7A 980 988 573 1.757

73 0.524 X2C X7C 995 995 521 1.562

72 0.555 X4C X7C 995 995 552 1.655

39 0.687 X5C X7C 995 995 684 2.051

56 0.643 X8C X7C 993 995 638 1.917

50 0.66 X8C,X9A X7C 846 995 558 1.968

66 0.605 X9A X7C 994 995 601 1.804

12 0.561 X9A X7C,X8C 994 638 558 2.612

4 0.562 X8C X7C,X9A 993 601 558 2.776

48 0.656 X4A X8A 988 989 648 1.969

9 0.891 X4A,X9C X8A 608 989 542 2.676

64 0.603 X7A X8A 988 989 596 1.811

22 0.831 X9C X8A 980 989 814 2.494

7 0.895 X9C,X7A X8A 573 989 513 2.688

14 0.524 X9C X8A,X7A 980 596 513 2.608

44 0.549 X4A X8A,X9C 988 814 542 2.001

57 0.519 X7A X8A,X9C 988 814 513 1.894

38 0.701 X9B X8B 995 987 697 2.107

30 0.735 X4C X8C 995 993 731 2.197

55 0.641 X7C X8C 995 993 638 1.917

3 0.929 X7C,X9A X8C 601 993 558 2.776

18 0.851 X9A X8C 994 993 846 2.545

1 0.93 X9A,X4C X8C 715 993 665 2.781

6 0.669 X9A X8C,X4C 994 731 665 2.717

27 0.668 X4C X8C,X9A 995 846 665 2.346

49 0.561 X7C X8C,X9A 995 846 558 1.968

32 0.719 X4C X9A 995 994 715 2.146

65 0.604 X7C X9A 995 994 601 1.804

11 0.875 X7C,X8C X9A 638 994 558 2.612

17 0.852 X8C X9A 993 994 846 2.545

5 0.91 X8C,X4C X9A 731 994 665 2.717

2 0.67 X8C X9A,X4C 993 715 665 2.781

37 0.706 X8B X9B 987 995 697 2.107

59 0.615 X4A X9C 988 980 608 1.864

19 0.836 X4A,X8A X9C 648 980 542 2.534

70 0.58 X7A X9C 988 980 573 1.757

21 0.823 X8A X9C 989 980 814 2.494

13 0.861 X8A,X7A X9C 596 980 513 2.608

8 0.519 X8A X9C,X7A 989 573 513 2.688

表 6-15

三分表現法之支持度

=300

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule # Conf. % Antecedent (a) Consequent (c) Support(a) Support(c) Support(a U c) Lift Ratio

213 0.424 X10A X11A 925 936 392 1.264

229 0.415 X6C X11A 944 936 392 1.239

239 0.412 X10C X11C 944 935 389 1.231

240 0.407 X6A X11C 925 935 376 1.214

表 6-16

三分表現法之支持度

=300

下的關聯規則:測試期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule # Conf. % Antecedent (a) Consequent (c) Support(a) Support(c) Support(a U c) Lift Ratio

369 0.47 X10A X11A 988 991 461 1.398

474 0.41 X1C X11A 995 991 403 1.213

458 0.41 X6C X11A 995 991 412 1.241

450 0.42 X8C X11A 993 991 420 1.267

421 0.44 X8C,X9A X11A 846 991 369 1.307

444 0.43 X9A X11A 994 991 423 1.275

371 0.47 X10C X11C 995 991 464 1.397

465 0.41 X8A,X9C X11C 814 991 334 1.229

464 0.41 X9C X11C 980 991 404 1.235

表 6-17

三分表現法之支持度

=200

下的關聯規則:訓練期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule

# Conf. % Antecedent (a) Consequent (c) Support(a) Support(c) Support(a U

c) Lift Ratio

833 0.424 X10A X11A 925 936 392 1.264

830 0.426 X4A,X10A X11A 608 936 259 1.271

855 0.415 X6C X11A 944 936 392 1.239

767 0.460 X6C,X10A X11A 461 936 212 1.372 880 0.402 X6C,X2C X11A 510 936 205 1.199 835 0.424 X6C,X5C X11A 557 936 236 1.264

868 0.412 X10C X11C 944 935 389 1.231

881 0.401 X1C,X4C X11C 546 935 219 1.198 832 0.424 X2A,X5A X11C 524 935 222 1.265 802 0.434 X2A,X6A X11C 511 935 222 1.297 823 0.427 X4C,X10C X11C 572 935 244 1.274 876 0.403 X4C,X8C X11C 643 935 259 1.203 863 0.413 X5A,X6A X11C 593 935 245 1.234 877 0.402 X5A,X7A X11C 507 935 204 1.202

873 0.407 X6A X11C 925 935 376 1.214

738 0.488 X6A,X10C X11C 430 935 210 1.458

表 6-18

三分表現法之支持度

=200

下的關聯規則:測試期間

(

Consequent

Antecedent

排序,只列出右側為

X11

的關聯規則

)

Rule # Conf. % Antecedent (a) Consequent (c) Support (a)

Support (c)

Support

(a U c) Lift Ratio 1651 0.467 X10A X11A 988 991 461 1.398 1527 0.522 X10A,X9A X11A 437 991 228 1.563 1859 0.405 X1C X11A 995 991 403 1.213 1612 0.483 X1C,X8C X11A 453 991 219 1.448 1650 0.467 X1C,X9A X11A 484 991 226 1.399 1562 0.502 X2C,X10A X11A 424 991 213 1.505 1804 0.423 X2C,X5C X11A 653 991 276 1.266 1738 0.443 X2C,X5C,X6C X11A 463 991 205 1.327 1750 0.438 X2C,X5C,X7C X11A 459 991 201 1.312 1811 0.420 X2C,X6C X11A 652 991 274 1.259 1769 0.432 X2C,X7C X11A 521 991 225 1.294 1704 0.453 X2C,X8C X11A 459 991 208 1.358 1747 0.439 X2C,X9A X11A 456 991 200 1.314 1627 0.475 X3C,X10A X11A 427 991 203 1.424 1757 0.435 X4A,X10A X11A 604 991 263 1.305 1788 0.427 X5C,X6C X11A 600 991 256 1.278 1851 0.406 X5C,X7C X11A 684 991 278 1.218 1826 0.414 X6C X11A 995 991 412 1.241 1469 0.554 X6C,X10A X11A 395 991 219 1.661 1626 0.475 X6C,X1C X11A 448 991 213 1.424 1629 0.475 X6C,X8C X11A 444 991 211 1.424 1668 0.462 X6C,X9A X11A 459 991 212 1.384 1762 0.434 X7C,X8C X11A 638 991 277 1.301 1746 0.439 X7C,X8C,X9A X11A 558 991 245 1.315 1768 0.433 X7C,X9A X11A 601 991 260 1.296 1801 0.423 X8C X11A 993 991 420 1.267 1754 0.436 X8C,X9A X11A 846 991 369 1.307 1867 0.403 X8C,X9A,X4C X11A 665 991 268 1.207 1792 0.426 X9A X11A 994 991 423 1.275 204 0.408 X7C,X9A X11A,X8C 601 420 245 2.882 1654 0.466 X10C X11C 995 991 464 1.397 1707 0.453 X10C,X4C X11C 453 991 205 1.356 1868 0.403 X8A,X7A X11C 596 991 240 1.206 1841 0.410 X8A,X9C X11C 814 991 334 1.229 1814 0.419 X8A,X9C,X7A X11C 513 991 215 1.256 1834 0.412 X9C X11C 980 991 404 1.235 1575 0.498 X9C,X10C X11C 462 991 230 1.492 1816 0.419 X9C,X7A X11C 573 991 240 1.255

6-3-3 五分表現法結果與討論 五分表現法結果與討論 五分表現法結果與討論 五分表現法結果與討論

同 6-3-1 節的作法,本小節將將探討五分法。五分法的門檻值設定的原則如 下:

 信賴度

因五分法原機率=1/5=20%,考慮提升 1.2 倍,採用 24%信賴度做為門檻值。

 支持度

因五分法的五項目在隨機下的 Support=(1/5)*(1/5)*data(2792)數=100 左右,

但實際上並非隨機,在相依下可能大於小於此值,故取 50~300 間的值,本小節 選擇了 Support 值為 300、200、100 這三個不同的門檻值作研究。

表 6-19 說明了支持度與關聯規則的關係,由表 6-12 可知,在 Confidence=

20%,Support=150 的門檻值下,結果端為 X11 的關聯規則數在訓練範例有 6 個,

在 Confidence=20%,Support=50 門檻值下,結果端為 X11 的關聯規則數共有 80 個,所有參數組合的執行時間都在 10 小時之內。

五分表現法在訓練期間其支持度=300 之下發現以下的關聯規則,並繪製成 關聯規則圖 6-6;而在測試期間發現的關聯規則亦繪製成關聯規則圖 6-7。

訓練期間關聯規則如下:

 影響 X1 的變數:X9 成反比。

 影響 X2 的變數:無。

 影響 X3 的變數:無。

 影響 X4 的變數:X8、X10 成正比、X9 成反比。

 影響 X5 的變數:X6 成正比。

 影響 X6 的變數:X5 成正比。

 影響 X7 的變數:無。

 影響 X8 的變數:X4 成正比、X9 成反比。

 影響 X9 的變數:X1、X4、X8 成反比。

 影響 X10 的變數:X4 成正比。

測試期間關聯規則如下:

 影響 X1 的變數:無。

 影響 X2 的變數:X5、X6 成正比。

在文檔中 中 華 大 學 (頁 145-200)

相關文件