股價變化之波動的若干流體動力訊號–跨天效應 - 政大學術集成

全文

(1)國立政治大學理學院應用物理研究所碩士論文 Graduate Institute of Applied Physics College of Science. National Chengchi University Master Thesis. 政治大股價變化之波動的若干流體動力訊號–跨天效應. ‧. ‧ 國. 學. 立signatures in fluctuations of stock price Some hydrodynamic changes–crossing day effect. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 吳培煜 Pei-Yu,Wu. 指導教授：馬文忠博士 Advisor: Wen-Jong Ma. 中華民國 107 年 6 月 June, 2018 DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(2) 中文. 要. 本論文探討 2004 年至 2009 年台灣市場（TWII）的股票群體報酬在不同時間尺度下，類比於多粒子系統的擴散常數 D、動力溫度 θ 及移動率 µ 等動力參數，並與 1996 年至 2001 年的美國、台灣、上海股市. 政治大酬的高頻序列，其中序列時間點的間隔固定，計算報酬所採用的時間立的數據進行比較，研究不同市場中的共同特性。我們密集計算個股報. ‧ 國. 學. 間隔時間 τ 則作為時間尺度變數。我們分析不同年份的台灣與美國市場、其交易日之間的跨天效應，發現跨天影響的重要性。我們檢視時. ‧. 間序列的交易數據，得到跨天的影響廣泛的存在於不同時間、市場的. sit. y. Nat. 股票之中，藉由區分報酬數據是否跨天的情況、計算機率密度函數分. io. er. 佈的尺度參數的變化，從中確認這兩種市場中的共同統計性質，並發現跨天會使機率密度函數分佈呈現「不對稱」的特徵。我們發現跨天. n. al. Ch. i Un. v. 的效應會使數據中地使價格差持續為正（或持續為負），在計算時間的. engchi. 統計分布中，透過盤後的等效交易時間 taf ter 可以有效量化跨天的效應。. 除了時間上的分析，本論文引入網路的概念把股票間的相關係數當作連結強度，分析股票網路在（時間序列長度）T 的維度空間中之結構，得到了股票網路中各節點（股票）的「不均質」特性，並透過一個網路模型的建構程序，對這「不均值」的特性進行定性上的研究。我們又引入時間的因素，同時考慮時間與空間上的相關性，並從中又發現跨天與跨天間有影響的訊號，此與盤後的等效交易時間 taf ter 的分析相互應，定量上確認了股票網路在時間上由跨天造成的「不均勻」. 1. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(3) 的特性。. 關鍵字：股票、網路、跨天、動力參數、盤後交易. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(4) Abstract By the analogy of a system of many particles, we study the diffusion constant D, kinetic temperature θ and mobility µ obtained from the log-returns. 政治大. over different time scales for a collections of stocks in Taiwan market, over. 立. ‧ 國. 學. 2004- 2009. The values of these hydrodynamic parameters are compared with their counterparts for stocks in Taiwan, US and Shanghai markets from. ‧. 1996 to 2001, to reveal their common properties. The sequences of returns of. y. Nat. al. er. io. sit. individual stocks are intensively evaluated, keeping the interval in between. n. the time spots of the sequences fixed and treating the time τ over which the. Ch. engchi. i Un. v. returns are calculated as the variable for time scales. We checked the time sequences of trading data and found that crossing-day effect is present in all points in time and market.By distinguishing between returns of crossing-day and those of non-crossing-day, the analysis both of scaling properties in probability functions and of the enhanced statistics of persistent time for up-trend (or down-trend) events as an effect caused by crossing-day contributions, show same features shared by Taiwan and US markets. The crossing-day effect makes the probability functions asymmetric. Such an efffect can be. 3. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(5) quantified by finding the effective after-market trading time taf ter . In interpreting the cross correlation coefficient as the strength of the bond in between two stocks, a networks of stocks with continuous values in the bonds among the sites is introduced, which, in combination with model construction, helps to capture qualitatively the main features of stock-stock heterogeneity. In the analysis to include the temporal correlation as well as the stock-stock cross correlations, the crossing-day effect displays concrete signatures, which fur-. 政治大. therly support the results revealed in the analysis of persistent time of up-trend. 立. events.. ‧ 國. 學. Key words: stock, network, crossing-day, hydrodynamic, after trading.. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 4. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(6) Contents. 要. 1. Abstract. 立. al. n. 2. 介紹. Ch. 數據特性，理論背景及分析方法 2.1. 2.2. 11. sit. io. 1. 7. y. ‧ 國 Nat. List of Tables. engchi. i Un. 5. ‧. List of Figures. 3. 學. Contents. 政治大. er. 中文. v. 1. 5. 資料來源 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.1.1. 資料採樣方法 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 2.1.2. 資料特性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 2.1.3. 跨天事件的分析方法 . . . . . . . . . . . . . . . . . . . . . . .. 8. 隨機行走與布朗運動 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 2.2.1. 一維隨機行走 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10. 2.2.2. Langevin 方程描述布朗運動 . . . . . . . . . . . . . . . . . . .. 11. 5. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(7) 2.3. 耦合隨機行走模型 (Coupled random walk model) . . . . . . . . . . . .. 14. 2.4. 萊維穩定分佈 (Lévy stable distribution) . . . . . . . . . . . . . . . . . .. 15. 2.5. 網路分析方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17. 2.5.1. 網路中的連結度與鄰接矩陣 . . . . . . . . . . . . . . . . . . .. 17. 2.5.2. 網路中心性 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 18. 2.5.3. 連續性網路的建構過程 . . . . . . . . . . . . . . . . . . . . . .. 23. 盤後交易模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 2.6. 29. 3.2. 報酬的機率密度函數的尺度不變性 . . . . . . . . . . . . . . . . . . .. 33. 學. 由均方報酬的尺度變換計算動力參數 . . . . . . . . . . . . . . . . . .. ‧ y. 44. 上升趨勢事件的持續性時間 . . . . . . . . . . . . . . . . . . . . . . .. 4.2. 以網路慨念分析股票間的交互相關性 . . . . . . . . . . . . . . . . . .. 50. 4.3. 股票交互的時間相關性 . . . . . . . . . . . . . . . . . . . . . . . . . .. 57. n. al. er. 4.1. io. 5. 44. sit. 一整群股票的價格變動分析時間的不均勻與空間的不均質. Nat. 4. 29. 3.1. ‧ 國. 3. 政治大一整群股票的報酬之時間尺度性質立. Ch. engchi. 結論與討論. i Un. v. 62. A 附錄. 70. 6. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(8) List of Figures. 2.1. 1101 (台泥) 在 2018.4.30 的五分鐘交易線。資料來源：https://. 政治大 The correlation of 386 stock for TWII for 2004y.(a)Raw data, (b)random 立. tw.stock.yahoo.com/q/ta?s=1101 . . . . . . . . . . . . . . . . . . . . . .. 學. ‧ 國. 2.2. model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. The 386 stocks in TW for each month in 2004y-2009y. Scaled mean. y. . . . . . . . . . . .. n. al. er. io. The 386 stocks in TW for each month in 2004y-2009y. (b)Scaled mean. Ch. i Un. v. square log-return < r∗2 > vs. scaled time internal τ ∗ . . . . . . . . . . . . 3.3. 30. sit. Nat. square log-return < r2 > vs. scaled time internal τ . 3.2. 25. ‧. 3.1. 7. engchi. 31. Compare the fitted kinetic parameters, θ , D and µ of Taiwan, US and Shanghai stocks over a different period (1996y-1999y) and this work Taiwan (2004y-2009y). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.4. ′. ′. ′. Scaled Raw data PDF f (r ) and scaled log-return r in TWII between 2004y-2007y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.5. 32. ′. ′. 35. ′. Scaled Raw data PDF f (r ) and scaled log-return r in TWII between 2008y-2009y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 36. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(9) 3.6. ′. ′. ′. Scaled CD PDF f (r ) and scaled log-return r in TWII between 2004y2007y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.7. ′. ′. ′. Scaled CD PDF f (r ) and scaled log-return r in TWII between 2008y2009y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.8. ′. ′. 37. ′. Scaled NOCD PDF f (r ) and scaled log-return r in TWII between 2004y2007y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.9. 36. ′. ′. 37. ′. Scaled NOCD PDF f (r ) and scaled log-return r in TWII between 2008y-. 政治大. 2009y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 立. ′. ′. 38. ′. 學. ‧ 國. 3.10 Scaled raw data PDF f (r ) and scaled log-return r in SP500 between 1996y-1999y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ′. ‧. ′. 38. ′. 3.11 Scaled CD PDF f (r ) and scaled log-return r in SP500 between 1996y-. y. Nat. ′. ′. 39. er. io. ′. sit. 1999y. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.12 Scaled NOCD PDF f (r ) and scaled log-return r in SP500 between 1996y-. n. al. 1999y. . . . . . . . .. iv n C . . . h. . . . . . . . . .U engchi . . . . .. . . . . . . . . . .. 39. 4.1. Red line is Persistent time. Blue line is hitting time. . . . . . . . . . . . .. 45. 4.2. Comparison two market TWII , SP500 with PDF vs Persistent time and log-PDF vs log-Persistent time. . . . . . . . . . . . . . . . . . . . . . . .. 46. 4.3. Log return rCD of crossing day schematic. . . . . . . . . . . . . . . . . .. 47. 4.4. PDF of Persistent time with data of real stocks and of fitted after-hours trading model in linear plots (upper panel) and log-log plots (lower panel) for TW market (left panel) and US market(right panel). . . . . . . . . . .. 8. 48. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(10) 4.5. PDF vs effective time in after-hours trading model. . . . . . . . . . . . .. 4.6. The correlation of 386 stock for TWII for 2004y.(a)Raw data, (b)random model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.7. 政治大. RCTC and ACTC at different moment for TWII for 2004y-2009y . . . .. 立. 59 60. The correlation with different τ of time sequence for TWII for 2004y-2009y. 64. ‧ 國. 學. 5.1. 53. The correlation of log-reutrn with τ = 100 calculation RCTC, SCTC, RATC, SATC for TWII for 2004y-2009y. . . . . . . . . . . . . . . . . .. 4.9. 52. The (a)correlation, (b)DV, (c)distance, (d)closeness centrality of 386 stock for TWII for 2004y-2009y. . . . . . . . . . . . . . . . . . . . . . . . . .. 4.8. 49. ‧. A.1 PDF f (r) and log-return r for TWII for 2004y-2005y and get m of α from 70. sit. y. Nat. blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. n. al. er. io. A.2 PDF f (r) and log-return r for TWII for 2006y-2007y and get m of α from. i Un. v. blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Ch. engchi. 71. A.3 PDF f (r) and log-return r for TWII for 2008y-2009y and get m of α from blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 71. A.4 PDF f (r) and log-return r of CD for TWII for 2004y-2005y . . . . . . .. 72. A.5 PDF f (r) and log-return r of CD for TWII for 2006y-2007y . . . . . . .. 72. A.6 PDF f (r) and log-return r of CD for TWII for 2008y-2009y . . . . . . .. 73. A.7 PDF f (r) and log-return r of NOCD for TWII for 2004y-2005y and get m of α from blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 73. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(11) A.8 PDF f (r) and log-return r of NOCD for TWII for 2006y-2007y and get m of α from blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 74. A.9 PDF f (r) and log-return r of NOCD for TWII for 2008y-2009y and get m of α from blue line. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 74. A.10 PDF f (r) and log-return r for SP500 for Raw data 1996y-1997y. . . . . .. 75. A.11 PDF f (r) and log-return r for SP500 for Raw data 1996y-1997y . . . . .. 75. A.12 PDF f (r) and log-return r for SP500 for CD 1996-1997y . . . . . . . . .. 76. 政治大. A.13 PDF f (r) and log-return r for SP500 for CD 1998y-1999y . . . . . . . .. 立. A.14 PDF f (r) and log-return r for SP500 for NOCD 1996y-1997y . . . . . .. ‧ 國. 學. 77. ‧. 78 79. A.16 Comparison raw data, CD, NOCD for TWII for 2006y-2009y. . . . . . .. Nat. n. er. io. sit. A.17 Comparison raw data, CD, NOCD for SP500 for 2006y-2009y. . . . . . .. al. 77. y. A.15 PDF f (r) and log-return r for SP500 for NOCD 1998y-1999y . . . . . .. 76. Ch. engchi. 10. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(12) List of Tables. 3.1. Comparison of fitted parameters θ , D , µ for different markets in different. 政治大 Comparison of parameters α for TWII,SP500 for different time,data. . . . 立. time. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 學. ‧ 國. 3.2. Comparison of parameters α for TWII,SP500 for different time, data. . .. 4.1. Comparison of after trading effective time taf ter for TWII,SP500 for dif-. Nat. 41. 49. er. io. sit. y. ferent time, data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Comparison of parameters α for TWII,SP500 for CD,NOCD. . . . . . . .. al. n. 5.1. 40. ‧. 3.3. 32. Ch. n U engchi. 11. iv. 63. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(13) Chapter 1 介紹治政大金融領域是個十分複雜的一個系統，個體與個體間彼此關聯，市場與市場彼此立 ‧ 國. 學. 的關連，隨著時間、地點、事件等不同而產生變化。隨著物理學家進入金融領域這個複雜系統，多粒子模型、隨機矩陣等等研究方法開始進入人們的視野，從另. ‧. 一個角度研究金融問題。. y. Nat. al. er. io. sit. 我們總是希望能從市場中找到一些特徵，幫助我們判斷市場的狀態。從 1999. v. n. 年開始，Laloux 等人 [1] 發表的論文，與 Plerou 等人 [2] 發表的論文中，分析了. Ch. engchi. i Un. Correlation Matrix 中的 Eigenvalue 分佈，並以隨機矩陣理論 Random Matrix theoy （RMT）進行模擬比對，得到 Eigenvalue 分佈並不相同，並且最大特徵值也比 RMT 的計算結果大得多 (最大特徵值也被稱為 Market Mode ，描述市場趨勢 [2])，從中知道金融市場並不是簡單的隨機模型 2000 年時，Noh [3] 發表的論文中提出了一個簡單隨機模型，解釋了 Laloux 和 Plerou 論文中所提及的現象，最後我們知道因為隨機模型中個體的變化互相獨立的，忽略了彼此影響，省略了相關性的結果。2004 年，Ma、Hu 和 Amritkar [4] 的論文中，提出了耦合隨機模型 (coupled random walk) ，模擬個股在時間序列上的. 1. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(14) 價格變化，產生類似於真實數據中個體間的關聯性，能模擬出股票間的平均相關係數（cross correlation）。經濟學家 Engle [5] 認為應該探討個體間價格變動的相關性，但在其中遭遇到了難題，隨著個體數越多，需要引進多變量分析方法來進行解釋，但是這其中是不是很容易的。但是物理系統的多體問題的分析方法就給出了一條單純的思路，不再是分析個體與個體間的相互影響，而是分析整體的行為，透過群體模式的迭代，希望能藉此弭平個體的獨特性。. 政治大. 2013 年在 Ma、Wang、Chen 和 Hu 論文 [6] 中把透過表述股票的方均對數報酬. 立. (mean square log-return，簡稱 MSLR) 中，類比於多體系統中粒子位移，並在其中. ‧ 國. 學. 發現長時間「系統」呈現隨機擴散的情況，但是在短時間內的擴散是遲滯的，我. ‧. 們稱之為亞擴散 (subdiffusion) 區段，而在 2013 年 Huang [7] 嘗試著引入並修改 W.. y. Nat. io. sit. J. Ma, C. K. Hu, R. E. Amritkar (2004) [4] 的耦合模型來描述亞擴散的現象。. er. 本文這次分析的數據分別是 1996y - 1999y 美國股市（SP500），以及 2004y - 2009. al. n. iv n C 台灣股市（TWII）個股數據，這兩批數據分別橫跨了 h e n g c h i U1998 年亞洲的金融風暴，以及 2007 年四月的次貸危機所造成的 2018 年金融危機。在 1998 年 Steven Radelet 和 Jeffrey Sachs 的論文中指出 [8]，亞洲金融危機的核心是大規模的外國資本流入，造成金融體系的恐慌，再加上政策的錯誤、公司不透明、貪腐等等的原因。雖然在外資金進入時產生一時的金融榮景、高生產力等等現象，但是在外資撤走後，這榮景ㄧ停止之後，亞洲金融結構的脆弱面立刻展現出來，種種問題產生了亞洲金融危機。引起 2008 年的金融風暴的原因是來自於 2007 年四月的次級房貸危機，根據 John. 2. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(15) V. Duca 的文章 [9] 指出，起因是因為在美國信用水平不夠的人，無法從銀行貸款購買房屋，轉而向次級市場中貸款，然後被金融機構包裝成高槓桿的金融商品售出，買入這些金融衍生商品的金融機構再包裝轉賣，當時這些金融商品並沒有很好的法律規範，又這些證卷的信用等級被評為高級別，讓大量持有者認為他們可以規避風險，當次級房貸的問題浮出檯面時，使這些證卷顯得毫無價值，最後產生次貸危機。根據 2007 年 Yuliya Demyanyk, Otto Van Hemert 所發表的論文 [10] ，在 2003 以後，. 政治大. 次級房貸的貸款人拖欠債務的比例開始增高（從 8% 至 20%），並在 2006 到 2007. 立. 年間次級房貸的數量異常龐大，並短短數個月就出欠拖欠問題。雖然那時的房價. ‧ 國. 學. 持續上升，這些問題都被隱藏在榮景之下，但當利率回升，房價開始走迭，大量. ‧. 的次級房貸拖欠債務問題開始顯現，大量業者破產，最後引發金融海嘯。. y. Nat. io. sit. 這兩個金融風暴都有一個特徵 - ” 金融市場的榮景掩蓋了真正金融市場下的問題”，. er. 我們總是後知後覺，往往無法在事前找到真正的問題發生點，但是我們希望能透. al. n. iv n C 過一些方法了解金融市場的特性，透過了解特性，當問題發生時能使傷害降到最 hengchi U 小。為了瞭解金融風暴的前中後金融市場的數據，本文根據 Ma、Wang、Chen 和 Hu 論文 [6] 計算台灣股市（TWII）個股股價變動或報酬（return）的動力學參數，以及從 Vasiliki Plerou, Luis A. Martin Meyer, H. Eugene Stanley. [11] 計算股價 return 的機率分佈（truncated Lévy distribution）入手分析，進而分析整個金融市場中個股間的空間與時間狀況，並從中得到股票間的「不均質」，以及跨天事件（Crossing day event）所造成的時間不均勻等現象。而我們從 Shwu-Jane Shieh, Shlomo Havlin, H.. 3. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(16) Eugene Stanley [12] 的論文中也看到類似的結論–「跨天確實會對市場產生影響」。 Shwu-Jane Shieh, Shlomo Havlin, H. Eugene Stanley 的論文把跨天事件稱呼為 overnight，非跨天事件稱呼為 daytime（與本次工作的跨天事件 Crossing day event、非跨天事件 non-crossing day event 意義是一樣的），數據範圍與數據目標為 1998y 2007y New York 2215 Stocks，探討 overnight 和 daytime 對市場產生的影響，並以「一天」為單位表現其結果，而本工作是以「每 36 秒」為單位，探討跨天對金融市場細微結構產生的影響。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 4. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(17) Chapter 2 數據特性，理論背景及分析方法治政大本次分析著重在探討台灣市場（TWII）與美國市場（SP500）股票資料的特立 ‧ 國. 學. 性、空間關係、時間關係，我們透過 Langevin equation、Lévy 穩定分佈、Network 等等方法來使我們理解這些特性，而本節將簡單介紹數據的特性以及本文用到的. ‧. 分析工具的推導過程。. sit. n. al. er. io. 資料來源. y. Nat. 2.1. Ch. engchi. i Un. v. 台灣市場 (TWII) 個股數據，我們取自於政治大學商學院圖書館「台灣新報」資料庫，裡面記錄了台灣上市上櫃公司時間序列的交易行為，本次工作是取自於台灣上市公司，並經兩個篩選原則，有 386 間公司符合以下篩選： 1.2004y-2009y 年持續存活的公司（股價 > 0）。 2. 不可一天之中未有交易成功。美國數據（SP500）是取自 Ma、Wang、Chen 和 Hu [6] 論文中的資料，資料來源是政治大學商學院圖書館「TAQ」資料庫，總共 345 家公司。. 5. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(18) 2.1.1. 資料採樣方法. 在物理的世界，當我們獲得粒子隨時間變動的位置紀錄 x(t) 時，我們很自然的會想要知道其位移 ∆x，是故當我們獲得股票隨時間變動的股價 P (t)，也自然地想要了解其變動的情況，為了增加獲取的資料數量，在此次作業我們用重疊取樣（Overlapping）的方式來取得股價的變動 r(t)，而根據 1953 年 Maurice Kendall 的文章 [13]，對數報酬 R = lnP (t + τ ) − lnP (t) 的行為呈現一維隨機行走，而本文就沿用了該論文的模式，訂出對數報酬 r(t) 的形式為. 立. 政治大. ‧ 國. 學. r(t) = logP (t + τ ) − logP (t). ‧. 重疊取樣（Overlapping）：當資料的間隔小於資料採樣的間隔時（∆t ≡ tn − tn−1 <. sit. y. Nat. τ ），我們稱之為「重疊取樣」，為跨資料的方式來計算資料的變動。可以獲得較多. n. al. er. io. 的資料量，但資料的特性可能會重複計算。. Ch. engchi. i Un. v. 非重疊取樣（Non-overlapping）：當資料的間隔等於資料採樣的間隔時（∆t ≡ tn − tn−1 ≥ τ ），我們稱之為「非重疊取樣」，為一般計算資料變動的方式。本次工作我們透過重疊取樣來增加樣本數，而重疊造成的效應需要仔細的檢查。. 6. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(19) 2.1.2. 資料特性. 我們在這次研究表明，市場的交易行為具有不連續的特性（non-continual of. 政治大. market），無論公司大小、所處市場，在觀測時間範圍中（TWII：2004y-2018y、. 立. SP500：1996y-1999y）皆有這種情況。. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. Figure 2.1: 1101 (台泥) 在 2018.4.30 的五分鐘交易線。資料來源：https:// tw.stock.yahoo.com/q/ta?s=1101. 根據圖 (2.1)，我們得到在 2018.4.30 收盤價格至 2018.5.01 開盤價格時 1101（台泥）公司的價格之間有很明顯的差距，而這不連續的現象不是只存在 1101（台泥）. 7. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(20) 公司，而是普遍存在於整個金融市場的個股交易行為以及整個交易時間之中。在 Shwu-Jane Shieh, Shlomo Havlin, H. Eugene Stanley [12] 的論文中稱呼這種「對數報酬跨過一天的狀況」為 Overnight，「對數報酬沒有跨天的狀況」稱呼為 Daytime，本次工作把這種「對數報酬跨過一天的狀況」稱呼為 Crossing day event （CD），「對數報酬沒有跨天的狀況」稱呼為 Non-Crossing day event（NOCD），在這次分析中發現 CD 的交易行為不可忽視，跨天和跨天是有訊號的，NOCD 的交易行為則沒有訊號。. 政治大. 立跨天事件的分析方法. ‧ 國. 學. 2.1.3. ‧. 由於金融市場個股的交易行為呈現不連續的特性，在計算數據的時候，不連續. sit. y. Nat. 的特性會對結果產生影響，所以在計算的時候，必須把不連續的部分（CD）從資. n. al. er. io. 料中分離出來做獨立計算。. Ch. engchi. i Un. v. 以上圖為例，我們用以下步驟定義 CD 或 NOCD。 1. 台灣股市一天交易 4.5hr ，以 36s 記為一點，總共有 450 個數據點。 2. 列出對數報酬的時間序列 r(t) = logP (t + τ ) − logP (t) , 1 < τ < 450. 8. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(21) 3.P (t) ∈ Day1 ∧ P (t + τ ) ∈ Day2 則為跨天問題（crossing day event），記為 CD 4.P (t) , P (t + τ ) ∈ the same day (Day1 or Day2 ) 則為非跨天問題（non-crossing day event），記為 NOCD。 5.τ ≥ 450，必為 CD。註：若計算美國數據則一天交易 6.5hr ，以 36s 記為一點，總共有 650 個數據點）。. 2.2. 隨機行走與布朗運動. 立. 政治大. 在 1827 年，科學家發現水中的花粉粒子會呈現不規則的運動，經過許多的實. ‧ 國. 學. 驗與探討，得到這現象的原因是「微小粒子在單位時間內受到周圍液體分子不均. ‧. 勻撞擊」所造成的結果。這種移動被稱之為布朗運動 (Brownian motion) ，而布朗. y. Nat. io. sit. 運動具有下列特性：(1) 粒子的運動永不停止；(2) 溫度的改變會影響粒子的運動；. er. (3) 粒子的運動沒有固定的軌跡，其運動軌跡呈鋸齒狀；(4) 粒子的大小影響粒子. al. n. iv n C 的運動速度；(5) 粒子的成份或密度不會影響粒子的運動 hengchi U. 1900 年法國數學學家 Louis Bachelier，他認為股票、債券的價格波動以及它們的基本因素結構都是隨機變化 [14]，1905 年 Albert Einstein 利用隨機行走模型（random model）來對布朗運動的運動形式提出物理解釋 [15]，其後物理與金融各自使用相同的概念解釋布朗運動與股票、債卷價格的波動形式直到 econophysics 的跨領域研究成為一門學問。. 9. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(22) 2.2.1. 一維隨機行走. 由於布朗運中的粒子在移動的過程中十分相像一維度隨機模型，所以我們用簡單的二項分布的隨機行走模型來描述布朗運動。首先我們可以知道二項分配的定義    ( )   N n N −n   n p q , . RWN (n) =. n = 0, 1, 2, ..., N (2.1).       0 , . others. 治政大在這個二項次分佈配的試驗裡，有以下性質：立 ‧ 國. 學. (1) N 次獨立且完全相同的試驗組成。 (2) 每次試驗只有”YES”,”NO” 兩種結果。. ‧. (3)”YES” 的機率為 p (0 < p < 1) ，”NO” 的機率為 q (q = 1 − p) 。. y. Nat. er. io. al. sit. (4)n 為 N 次獨立試驗中”YES” 的次數。. v. n. 定義每次移動的長度為 l ，當走了 N 步時，其中有 n 步是向右，則某次試驗結果. Ch. engchi. i Un. 布朗粒子離原點的距離為：x = [n − (N − n)]l 且平均距離 < x > 為（n=0-N 的所有可能性相加）：. < x >=. N ∑. RWN (n)[n − (N − n)]l =. n=0. n=0. < x(N ) >=. RWN (n)(2n − N )l. n=0 N ∑. N ∑. N ∑. RWN (n) =. N ∑ n=0. (. RWN (n)(2n − N )l =. n=0. ). N n N −n p q n N ∑ n=0. 10. (. ). N n N −n p q (2n − N )l n. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(23) 整理為 < x(N ) >= 2pN l − N l = N l(2p − 1) = N l(p − q) 由於 p = q = 12 ，故可得 < x(N ) >= 0。對於方均位移 < X 2 >. N ∑. X 2 RWN (n) =. n=0. =. N ∑. (4n2 − 4nl + N 2 )l2. N! pn q N −n n!(N − n)!. 學. < x2 >= N l2 [(N − 1)(p − q)2 + 1]. 當在隨機行走的過程中，p = q =. 1 2. ‧. ‧ 國. N! pn q N −n n!(N − n)!. 政治大. 立. 經過整理可得. 時，< X 2 >= N l2 ，則 X 2 ∝ N ，並且 N 代表. io. sit. y. Nat. a. n. 2.2.2. (2n − N )2 l2. n=0. n=0. 著實驗總時間。. N ∑. Langevin 方程描述布朗運動 l. Ch. engchi. er. < x2 >=. i Un. v. 在西元 1908 年，Paul Langevin 發表了可描述單一布朗粒子運動軌跡的方程，我們現在稱之為 Langevin Equation。、外力 F (t) 、隨我們考慮一個粒子在流體內運動時，會受到流體的黏滯阻力 ζ dx dt 機作用力 ξ(t) 影響，則具體方程式可以寫成。. m. d2 x dx =ζ + F (t) + ξ(t) 2 dt dt. 11. (2.2). DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(24) 當外力 F (t) = 0 時， m. d2 x dx + ξ(t) =ζ 2 dt dt. (2.3). (2.3) 式經過簡單計算，我們可以得到其粒子的運動速度：. ⃗v (t) = ⃗v (0)e−t/τ +. ∫. t. du e−(t−u)/τ. 0. ⃗ ξ(u) m. τ 為 relaxation time，右式第一項表示粒子起始速度隨時間呈指數衰減，而第二項表達 random force ξ⃗ 的影響。在長時間看來，< v 2 (t) >∼. τ 。我們又能從氣體分 2m2. 政治大子動力論知道當達熱平衡時，所對應的 < v (t) >= 3k T /m，k 立 2. B. 為波茲曼常數，. ‧ 國. 學. T 為溫度。. B. ‧. 接下來我們要用 Langevine equation 來描述布朗運動隨著時間的位移狀態，對 (2.3). er. io. sit. y. Nat. 式左右兩邊同乘 x，得. n. aml d2x2 x = −ζ dx x + xξ(t) i v dt dt n Ch U engchi. 2. 由 x ddt2x = x¨ x=. d x) (x¨ dt. 2. − x˙ 2 =. 1 d2 2 x 2 dt2. (2.4). − x˙ 2 帶入 (2.4) 式，則。. 2. 2. 左式：m ddt2x x = m[ 12 dtd 2 x2 − x˙ 2 ] = 21 m dtd 2 x2 − mx˙ 2 右式：ζ dx x + xξ(t) = −ζ 12 dtd x2 x + xξ(t) dt 2. 得 21 m dtd 2 x2 − mx˙ 2 = −ζ 1s dtd x2 + xξ(t) 並對粒子求平均. 1 d2 1d 2 < m 2 x2 − mx˙ 2 >=< −ζ x + xξ(t) > 2 dt 2 dt. 12. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(25) 1 d2 1d < x2 > + < xξ(t) > ⇒ m 2 < x2 > −m < x˙ 2 >= −ζ 2 dt 2 dt. (2.5). 並且我們知道 1.< xξ(t) >= 0 2. 熱平衡時，依能量均分定理， 12 m < ( dx )2 >= 21 kB T dt 帶入上 (2.5) 式. 政治大. 1 d2 1d m 2 < x2 > −m < x˙ 2 >= −ζ < x2 > + < xξ(t) > 2 dt 2 dt. 立. ‧ 國. 學. 1 d2 1d ⇒ m 2 < x2 > +ζ < x2 > −m < x˙ 2 >= 0 2 dt 2 dt ζ d 2kB T d2 < x2 > + < x2 > − =0 2 dt m dt m. ‧. ⇒. y. Nat. n. al. er. io. sit. 我們可以解得 < x2 > 為. v C h2kmζB T [t − ζ1 (1 − eU−ζtn)]i engchi. < x2 >=. (2.6). 已知 x. e =. ∞ ∑ xn n=0. n!. (1) 若 t ≪ ζ −1 ，則 (2.6) 式為. < x2 >≈. 1 2kB T {t − [1 − (1 − ζt + (−ζt)2 + ...)]} mζ ζ. 13. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(26) ≈. 2kB T 2kB T 2 {ζt2 + ...} ≈ t mζ m. (2.7). ⇒< x2 >∝ t2 (2) 若 t ≫ ζ −1 ，則 (2.6) 式可改寫為. < x2 >≈. 2kB T t mζ. (2.8). 政治大. ⇒< x2 >∝ t. 立. 根據愛因斯坦的 random walk 模型，我們可以知道愛因斯坦擴散係數 D =. ‧ 國. 學. 耦合隨機行走模型 (Coupled random walk model). ‧. 2.3. kB T mζ. y. Nat. al. er. io. sit. 我們嘗試透過隨機模型模擬真實的股票市場數據，然而過去的研究讓我們知道. n. 股票價格隨時間的演變並非全然的無序，Huang 的論文 [7] 中引入了股票間的關聯. Ch. engchi. i Un. v. 性來產生隨機模型，而這模型被稱之為：耦合隨機行走模型 (Couple random walk model)。假設有 N 個股票（行走者，Walkers），第 i 個行走者在時間為 t 的時候假設他的股價（位置）在 xi (t) ，若彼此沒有關聯性的情況下為一個簡單的隨機過程。. xi (t + 1) = xi (t) + ξi (t). (2.9). 但是真實的市場數據往往無法用隨機的過程來描述，在 W. J. Ma, C. K. Hu, R. E. Amritkar (2004) 的論文 [4] 中考慮一個與整體有關聯的耦合隨機行走來描述真實市. 14. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(27) 場的數據，其定義為：. xi (t + 1) = xi (t) + ξi (t) + ε · ∆(xi (t) + ξi (t))). ri (t + 1) = xi (t + 1) − xi (t) = ξi (t) + ε · ∆(xi (t) + ξi (t))) xi ：為 N 個股票（行走者）的價格（位置）。 ri ：為 N 個股票（行走者）的價格變動（位移）。 ξi ：為未調整的價格變動，隨機噪音 (random noise)。. 立. ε：耦合常數 (coupling constant)。. 政治大. ‧ 國. 學. ∆：相當於拉普拉斯算子的對稱矩陣，其作用在引導調整以消除由隨機噪音 ξi 所. ‧. 產生的不平衡。而所謂股票間的關聯性即是由 ∆ 背後隱藏的抽象網路所定義的連. sit. y. Nat. 結來表現它的效應。. n. al. er. io. 而在之後 Huang [7] 對 W. J. Ma, C. K. Hu, R. E. Amritkar (2004) [4] 的公式進行修改以圖更符合真實數據。. 2.4. Ch. i Un. engchi. v. 萊維穩定分佈 (Lévy stable distribution). 在金融領域之中，不同時間尺度下會有不同的價格變化，我們可以用萊維穩定分佈 (Lévy stable distribution) 來有效探討價格變化的意義。萊維穩定分佈 (Lévy stable distribution) 是一個連續的機率分佈，而本次工作透過特徵函數的連續分佈 1 ∫ F (r) = φ(k)e−irk dk 2π φα,c (k) = Aα,c e−c|k| 15. (2.10). α. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(28) 其中，α 為描述後尾分佈的特徵參數，範圍為 0 < α ≤ 2，當 α = 1 時為 Lorenz distribution，α = 2 時為 Gaussian distribution。當 r=0 的時候，我們可以把式子寫為. F (0) =. 1 ∫ α Aα,c e−c|k| dk 2π. (2.11). 我們令 c−1/α k = k ′ ，則 (2.11) 式可以寫成 ∫ c−1/α ′ α F (0) = Aα,c e−|k | dk ′ 2π. 政治大. 立. (2.12). ‧ 國. 學. 根據 (2.12) 式中的變化，我們可以知道 c 為尺度因子，我們可以透過計算 logF (0) − logc 的冪次變化，來決定 α。. ‧. 根據 R. N. Mantegna 和 H. E. Stanley 在 1994 年的研究 [16]，美國 SP500 股價指數. sit. y. Nat. io. n. al. er. 的報酬機率密度分布，在機率分布中央為 Lévy 穩定機率分布，當股價指數報酬趨. v. 向無限大時，機率密度就隨之遞減，顯示變異數為有限值。他們稱這種機率分布. Ch. 叫做 Truncated Lévy flight (TLF)。. engchi. i Un. TLF 的定義為：         0        . P (x) =. x>l. hP L(x)               0. −1<x<l x < −l. 這裡的 PL (x) 是對稱的 Lévy distribution，h 為標準化的常數。TLF 分布是不穩定的，變異數是有限值，收斂至高斯分佈。若隨機變數為穩定分布，相加後其機率 16. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(29) 分布仍為穩定分布。. 2.5. 網路分析方法. 在以往，在討論物體間的關係時，無論線性與非線性，我們有很多既有的數學模型去做描述；在討論一個系統時，物理界也提供了很多分析方法，簡化了外在因素以便於了解整體的性質；而當我們要仔細去了解一個系統中個體間的相互關係時，或是個體在系統中扮演著什麼樣的角色這種細緻的問題時，簡單的線性、. 政治大. 非線性、物理模型卻無法幫助我們，我們引進了「Network」的概念 [17]，藉助. 立. Network 中的鄰接矩陣、中心性等觀念來做描述其關係。. ‧. ‧ 國. 學. 網路中的連結度與鄰接矩陣. sit. y. Nat. 2.5.1. n. al. er. io. 非連續性網路（通稱「網路」），指的是網路中節點間的連接關係用”1”（有連. i Un. v. 結）與”0”（無連結）表示。在 Network [17] 一書中清楚的說明，我們把網路中各. Ch. engchi. 節點間的連結方式，用一個矩陣 A 表示，稱之為鄰接矩陣（Adjacency Matrix），而每一個節點 i 與節點 j 的連結數狀態記為 Aij ，有連結為”1” ，沒有連結則為”0”。在網路中，常使用連結度來描述個體在網路中的影響，表示點 i 的總連結數。[17]. Degreei =. N ∑. Aij. j=1. 17. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(30) 1 4. 2 3 上圖是一個簡單網路，各個點的連結度可以表示為： Degree1 = 2 Degree2 = 3. 立. Degree3 = 3. ‧. ‧ 國. 學. Degree4 = 2. 政治大. n. Ch. engchi. sit. io. 0 1 1 0           1 0 1 1    A=       1 1 0 1        . er. Nat. . . al. y. 並且用鄰接矩陣 A 來描述網路。. i Un. v. 0 1 1 0. 2.5.2. 網路中心性. 除了用鄰接矩陣 A 來直觀的了解網路，我們也好奇在網路中哪些個體是「獨特」的，此時我們可以用中心性（Centrality）來做分析。在 Network [17] 一書中列舉出數個中心性的計算方式：點度中心性（Degree Centrality），本徵向量徵中心性（Eigenvector Centrality），距離中心性（Closeness. 18. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(31) Centrality），介中心性（Betweeness Centrality）等等。而本次工作中用股票間的相關係數來定義連結，因此股票網路為完全網路（Complete Network），完全網路的定義為「網路中每一節點接相鄰」，所以沒有考慮使用介中心性，因介中心性為計算兩節點 i , j 通過點 k 的最短距離路徑數目，是故股票網路中每一股票節點的介中心性直接為 0，不具備判別性。以下列舉出各種中心性的計算方式： 1. 點度中心性：記為 XD ，最直觀的中心性，定義為計算該點的 Degree，意義為計算指向該點的總聯結數。. 立. 政治大. 點度中心性可以很直觀的描述該點的中心性，表示該點在網路中的「份量」，被廣. ‧ 國. 學. 泛地使用在各個網路上，例如社交網路、論文網路... 等等。. ‧. 在社交網路、論文網路中，人、論文的點度中心性越高，代表著該人與人的連結. y. Nat. er. io. 要性」。[17]. sit. 數、論文的被引用數是高的，所以點度中心性往往也代表著該點在網路中的「重. al. n. iv n C 2. 本徵向量中心性：記為 XEig ，是點度中心性的延伸，本徵向量中心性的意義是 hengchi U 周圍的點貢獻中心性，經由不停的迭代所產生的中心性，其結果好像點 i 周圍每個點 j 的中心性，經由不同的「加權」所集合起來的結果。我們先假設所有點 i 的中心性 Xi = 1 ，並且依照定義，本徵向量中心性是周圍的點貢獻中心性所產生的結果，故可令. Xi′ =. ∑. Aij Xj. j. 19. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(32) 用矩陣表示則為 X ′ = AX. 當 t → ∞ 時，特徵中心性不再變化，趨於” 穩定”，則. XEig (t) = At XEig (0). 現在我們可以把 XEig (0) 寫成多個本徵向量 vi 的集合. 政 ∑治c v 大. XEig (0) =. XEig (t) = At. ∑. ci vi =. i. ∑. ci kit vi = k1t. ∑. i. ci [. i. < 1，當 t → ∞ ， kk1i → 0，得. Nat. XEig (t) = c1 k1t v1. n. al. Ch. engchi. er. io. sit. y. ki k1. ‧. ki 是 A 的本徵值，k1 是最大本徵值，是故. ki t ] vi k1. 學. ‧ 國. 立. i i. i. i Un. v. 換句話說，我們計算在 t → ∞ 時，鄰接矩陣 A 對 XEig (0) 的本徵值及本徵向量，只需計算最大本徵值 k1 及其本徵向量 v1 ，得到本徵向量中心性 XEig 與本徵向量 v1 成比例關系。因當 t → ∞ 時，本徵向量中心性 XEig 與本徵向量 v1 成比例關系，所以我們計算 XEig (t) 時可以寫成. AXEig (t) = k1 XEig (t) ⇒ XEig (t) = k1−1 AXEig (t) 20. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(33) 而當我們計算每個節點 i 的本徵向量中心性 XEig,i (t) 時，為節點 i 周圍的點所貢獻中心性的總和 XEig,i (t) = k1−1. ∑. Aij XEig,j (t). j. 因此得到每個點 i 的本徵向量中心性 XEig,i 。如果我們把該節點在網路的中心性，理解成該節點在網路的重要性的話，本徵向量中心性提供了一個思路：「一個節點（人、論文、網站）的重要性取自於與他相關節點（人、論文、網站）的重要性。」[17] 但不全然適用。. 治政大當我們認識一位名人，會讓我們很有名嗎？不一定，也許我們只是恰好與他共立 ‧ 國. 學. 事。但是當一篇論文 A 被另一篇重量級的論文 B（被引用的次數多）引用，我們不敢說論文 A 也是重量級論文，但是其重要性確實是不容忽視的。. ‧. 是故本徵向量中心性的使用時機我們要謹慎地思考。. y. Nat. n. al. er. io. 性」。. sit. 3. 距離中心性：記為 XC ，意義為計算網路中任一點 i 到任一點 j 的「幾何中心. Ch. engchi. 距離中心性比較特別，有兩種定義：. i Un. v. n j dij. def1 : XC,i = ∑. ∗ def2 : XC,i =. n ∑ 1 1 n − 1 j=1,j̸=i dij. dij 為點 i 到 j 的最短距離，如果透過定義一來計算距離中心性，我們會從過程中發現定義一會有兩個問題 [17]： 1. 因為網路大小不同，而有可能產生 XC,small network > XC,large network 的情況。 2. 距離點 i 的點最短為 1，最長為 n，然而距離越長的點往往比較多，會使點 i 產 21. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(34) 生比較大的中心性，就產生” 點 i 至網路任一點平均距離沒有最近，但產生較高中心性” 的狀況，使其中心性分佈看不出差異。而定義二則迴避掉了定義一產生的問題，是故在計算距離中心性往往使用定義二來進行計算。在計算過程中我們會發現距離中心性的意義在計算「在網路中與其他點的平均距離」，這個意義讓我們對距離中心性有著最直觀的認識，但是距離中心性也有其缺陷性。. 政治大. 我們可以很直觀的了解在生活中，「距離」是一個很重要的因素，我們往往常去家. 立. 附近的便利商店（Convenience store）勝過於十公里遠的 Shopping mall（十公里在. ‧ 國. 學. 台灣，對於當地人而言不是一個很方便的距離），距離中心性的意義在於「在網路. Nat. y. ‧. 中與其他點的平均距離」，越小則數值越大。. io. sit. 但是距離中心性也有其缺陷性 –「極值範圍往往在同一數量級」。根據 Network [17]. er. 一書描述的一個電影演員網路中，距離中心性的數值範圍落在 2 – 9 之間，最大的. al. n. iv n C 數值為 8.6681 ，最小則為 2.4138，這很容易隨著新點添加進網路而有所改變。但 hengchi U 是這個現象往往不會在點度中心性和本徵向量中心性中看到，因為這兩個中心性極值得範圍往往比距離中心性還要來得大。在本次工作中是計算股票間的相關性網路的距離中心性，而使用距離中心性有以下幾個原因：. 因股票間的相關性網路是 Complete Network（網路中各節點彼此皆互相連結）的關係，所以點度中心性、本徵向量中心性、距離中心性都擁有了「極值皆在同一數量級」的特性，容易變化，隨著年份的變化，中心性最高的股票也往往不是唯. 22. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(35) 一。而在本次工作中，我們能透過把相關係數轉換成在 T 維空間的距離（轉換方法見4.2小節），所以我們選擇最直觀的距離中心性。但是在第4.2小節裡的距離會有一個不直觀的結果：「距離最遠不是毫無關係，而是完全反相關 C=-1」，這與我們的認知不太一樣，我們在常理認為，越遠越無相關，並不是反相關。所以我們這裡透過計算距離所產生的距離中心性，並不是要探討其「節點在網路中的幾何關係」，而是單純觀察網路中節點「是否均質」。. 立. 連續性網路的建構過程. ‧ 國. 學. 2.5.3. 政治大. ‧. 連續性網路 Continuous Network Design Problem（CNDP）[18] [19] [20] 的建構與. sit. y. Nat. 非連續性網路的設計問題 Discrete Network Design Problem （DNDP）[18] [19] [20]. n. al. er. io. 有很大不同，非連續性網路（DNDP）任兩點間是否連結是十分清楚的，然而在. i Un. v. 現實世界中我們常常要處理的是連續性網路的模型（CNDP），更甚至是透過混合. Ch. engchi. 式模型 Mixed Network Design Problem （MNDP）[18] [19] [20] 來處理問題，然而混合式模型（MNDP）處理起來是十分複雜的，現階段往往是處理及分析連續性網路的問題（CNDP）。目前非連續性網路（DNDP）已知有數個典型的模型：Scale free network、small world network ... 等等，也擁有其相對應的數學建構辦法。對比於連續性網路（CNDP），雖然已有論文在著手對其進行分析，但是對於連續性網路（CNDP）從無到有建構過程的探討，仍是十分缺乏。我們希望能借鑑非連續性網路（DNDP）的建構過程，建立一個連續性網路（CNDP）的建構模型，處理非單純 23. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(36) 「是」、「否」連結的問題。對於連續性網路（CNDP）建構的過程中，每個點之間的連結以數值大小 C 表示，為了探討一個連續性網路（CNDP）的建構過程，我們假設連續性網路中，新添加的點 j 與舊的點 i 的連結數值大小 Cij ，與舊的點 j 的平均連結數值 < Ci > 和整體網路的平均連結數值 < Ct > 有關。我們假設一開始網路有兩點，給予兩點間的初始連結數值（上標為 0）並歸一化。. 治政 0<C <1 大 0 12. 立. ‧. ‧ 國. 學. 我們新添加點 j 進入網路，並給與新點 j 與網路任一點 i 數值並歸一化. 0 < Cij0 < 1 , (i = 1, 2, 3, ..., n). sit. y. Nat. n. al. er. io. 因為我們假設連續性網路中，舊的點 i 當下的平均連結數值 < Ci >，以及整體網. i Un. v. 路當下的平均連結數值 < CT >，會影響新的點 j 與舊的點 i 的連結數值 Cij 。. Ch. engchi. 我們計算網路任一點 i 的平均連結數，與網路整體的平均連結數。. < Ci >=. N 1 ∑ C0 N k=1 ik. N ∑ N ∑ 2 0 < CT >= Cik N (N + 1) i=1 k=i. 計算新添加點 j 與 < Ci > 的差值，與新添加點 j 與 < CT > 的差值. ∆i,j =< Ci > −Cij0. 24. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(37) ∆i,net =< CT > −Cij0 調整新添加點 j 與網路任一點 i 的連結數值。. Cij = Cij0 + f (∆i,j ) + g(∆i,net ) 舊的點 i 影響新的點 j 的關係，用函數 f (∆i,j ) 表示，整體網路影響新的點 j 的關係，用函數 g(∆i,net ) 表示。. 政治大. 由於本次工作是分析股票市場的相關係數網路，其數值介於 0 與 1 之間。一開始. 立. 我們透過隨機辦法，得到與真實市場一致的相關係數平均分佈，進而得到隨機的. ‧ 國. 學. 相關係數網路，並與真實市場做比較。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. (a). i Un. v. (b). Figure 2.2: The correlation of 386 stock for TWII for 2004y.(a)Raw data, (b)random model. 我們可以從圖中找到最圓滑的黃色線，其代表市場的平均相關係數的分佈，而其他線代表著各股間彼此的相關係數分佈，在相關係數網路中代表的意義為「真實市場個股彼此是存在差異的，而隨機模型則忽視這差異性」，與事實不符。我們發現我們無法用隨機辦法產生的隨機網路來描述真實市場，但是透過連續性 25. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(38) 網路的建構過程，其結果與隨機模型網路相比來得更好。（見 4.2 節的計算過程。）. 2.6. 盤後交易模型. 隨著人類科技的發達，區域性的市場從封閉轉向開放，國外市場的交易行為，很有可能會影響到國內市場，並在次日的交易行為中表現出來。這樣子的現象，我們稱為「盤後交易影響」（After-hours trading effect），這裡的「盤後交易」並不是狹隘的「收盤後的股市交易行為」（台灣股市 2004 年之後的盤. 政治大. 後交易時間為 15:00 至隔天 05:00 ，美國股市為 16:00 至 20:30 ），而是廣義的「收. 立. 盤後無法觀測的交易行為」。. ‧ 國. 學. 收盤後無法觀測的交易行為產生的影響，會在隔天的開盤中表現出來。例如台灣. ‧. 股市收盤後，在美國的 A 公司所公布的決策，會影響台灣 B 公司的決策，進而影. y. Nat. er. io. 「資料不連續特性」。. sit. 響台灣股市，並且會在台灣股市開盤時一次表現出來，而產生 2.1.2 小節所說的. al. n. iv n C 為了模擬盤後交易，根據 Ma、Wang、Chen U 的論文，我們可以知道在長 h e n g c和hHui [6] 時間來看（t ≫ ζ −1 ），股市的交易行為可以被視為一種隨機的擴散模型，所以用隨機擴散模型來模擬盤後的交易行為。. x(t) = x(t − 1) + ξ(t). x(t) = x(0) +. t ∑. ξ(t′ ). (2.13). t′ =1. 26. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(39) x(t) 為股票的隨時間變動的價格序列，ξ(t′ ) 為股票在時間為 t’ 的時候的隨機亂數。我們開始把盤後交易對價格序列產生的影響考慮進來，我們假設一天盤中交易（intraday trading）時間長為 ttra ，每天盤後交易（after-hours trading）時間長為 taf ter ，我們假設一天的完整交易時間 ttotal. ttotal = ttra + taf ter. 政治大. 並且觀測總時間長為 T ，我們可以寫出這中間已發生交易天數 Day（天）：. 立. ‧ 國. ]. ttotal. ‧. 取整數。. sit. y. Nat. T ttotal. T. 學. Day 為. [. Day =. io. al. n. 影響為：. er. 我們可以改寫一下隨機模型 (2.13) 式，可以知道一個完整交易時間對序列產生的. C t h ∑ tra. e n gt ∑c hξ(ti′) af ter. ξ(t′ ) +. t′ =1. i Un. v. t′ =1. 並且加總已發生天數的影響：. Day ttra ∑ ∑. (. ξi (t′ ) +. i=0 t′ =1. taf ter. ∑. ξi (t′ )). t′ =1. 而剩下的影響則為觀測時間長 T 減去已發生天數產生的影響： T −Day·t ∑ total. ξDay+1 (t′ ). t′ =1. 27. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(40) 最後考慮以上所有影響，則我們可以得到一個包含盤後交易的價格序列 x(t). x(t) = x(0) +. Day ttra ∑ ∑. (. ′. ξi (t ) +. t′ =1. i=0. taf ter. ∑. ξi (t′ )) +. t′ =1. T −Day·t ∑ total. ξDay+1 (t′ ). t′ =1. 而盤後交易模型在後面第4.1小節得到很好地表現，並且很好的解釋了跨天產生的影響。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 28. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(41) Chapter 3 一整群股票的報酬之時間尺度性質. 學. ‧ 國. 3.1. 政治大由均方報酬的尺度變換計算動力參數立. 根據 Ma、Wang、Chen 和 Hu 論文 [6] 以及 J. J. Chen、L.Tan、W. J. Ma 和 C. K.. ‧. Hu 的計算結果我們可以知道 1996y-1999y 的美國、台灣數據以及 1999y-2003y 上. sit. y. Nat. 海數據的動力學性質，發現其中一個動力學參數頗為一致，為此我們也分析台灣. n. al. er. io. 2004y-2009y 數據中的動力學參數，與上述工作比較，試圖了解在不同時間、地點. Ch. 之下，市場的特性會不會有所不同。. engchi. i Un. v. 我們計算台灣金融市場 (TWII) 2004y-2009y 股票的數據，每一步以 36s 作為間隔，紀錄未作移動平均的股票的價格 Pi ，並計算每個股票 i 以不同時間間隔為 τ 的 rτ,i (t). rτ,i (t) = logPi (t + τ ) − logPi (t). (3.1). 並對所有的個股 i 及時間點 t 做平均，平均結果 < r2 > 對 τ 做 log–log 圖，在圖 (3.1) 中，數據分成兩段，前半段斜率為 2，後半段斜率為 1。. 29. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(42) 立. 政治大. ‧ 國. 學. Figure 3.1: The 386 stocks in TW for each month in 2004y-2009y. Scaled mean square. ‧. log-return < r2 > vs. scaled time internal τ .. sit. y. Nat. io. al. n. τ ≪ ζ −1 時. er. 從 (2.6) 式中可知. Ch. engchi. < r2 >≈ θτ 2. i Un. v. τ ≫ ζ −1 時 < r2 >≈ Dτ. 而我們知道，當時間間隔很短時，< r2 > 跟溫度 θ 成正比；時間間隔長時， < r2 > 跟擴散係數 D 成正比。最後我們可以從圖形的前半段來看出 log < r2 > 與 logτ 的斜率為 2。圖形的後半段來看出 log < r2 > 與 logτ 的斜率為 1。溫度 θ 為圖 (3.1,3.2) 中數線前半段的截. 30. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(43) 立. 政治大. ‧ 國. 學. Figure 3.2: The 386 stocks in TW for each month in 2004y-2009y. (b)Scaled mean square. ‧. log-return < r∗2 > vs. scaled time internal τ ∗ .. y. Nat. n. al. er. io. 我們把圖形經過尺度變換. sit. 距。擴散係數 D 為圖 (3.1,3.2) 中數線後半段的截距。. Ch. engchi. i Un. v. < r∗2 >= τ ∗ + e−τ − 1. < r∗2 >= 2θ < r2 >. and. τ∗ =. (3.2). 2θ τ D. 我們得到圖 (3.2) ，其中有四個月的 MSLR 與 Langevin 方程的理論值沒有很好重疊在一起，分別是 2005 年 12 月、2008 年 9 月、2009 年 7 月及 11 月，這四個月之外曲線皆與 Langevin 方程的理論值有很好重疊的結果。透過 Langevin 方程式很方便擬合市場數據，並獲得市場個股的動力參數。並且我們想要知道，在不同時間時，TWII 的溫度 θ、擴散係數 D 、比值. 31. θ D. 的變化。. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(44) 我們把比值. θ D. 記為 µ，並且我們從公式 (2.3)(2.7)(2.8) 中可以知道 µ 為阻泥系數 ζ. 的倒數。最後以時間先後順序畫出不同時間點的溫度 θ、擴散係數 D、µ，並與 SP500 （1996.1-1999.12）、上海（1999.8-2003.6）個股數據擬合的結果拿出來做比較。. 政治大. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. Figure 3.3: Compare the fitted kinetic parameters, θ , D and µ of Taiwan, US and Shanghai stocks over a different period (1996y-1999y) and this work Taiwan (2004y-2009y).. Market. θ. D. µ. New York(1996.1-1999.12) [6]. 9.8 × 10−13. 2 × 10−8. 1.8 × 104. Taipei(1996.1-1999.12) [6]. 6.6 × 10−12. 9.5 × 10−8. 1.5 × 104. Shanghai(1999.8-2003.6) [21]. 2 × 10−12. 4 × 10−8. 1.8 × 104. Taipei (2004.1-2009.12). 4.8 × 10−13. 1.0 × 10−8. 2.0 × 104. Table 3.1: Comparison of fitted parameters θ , D , µ for different markets in different time.. 32. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(45) 我們比較了 TWII（2004y - 2009y）個股數據，與先前數據的 θ、D、µ 的數值，發現不同市場在不同時間、地點中，µ 值的數量級在 2 × 104 左右，這似乎在暗示金融市場在不同時間、地點都擁有某些共同的特性。. 3.2. 報酬的機率密度函數的尺度不變性 θ ，不會因為時間地點 D. 在上一章我們可以知道，金融市場的動力學參數 µ =. 政治大. 而有所改變，那我們也十分好奇台灣市場（TWII）對數報酬 r(t) 的機率密度函數. 立. （PDF）分佈，與歷年來美國（SP500）對數報酬 r(t) 的 PDF 分佈是否不同？如果. ‧ 國. 學. 不同，透過掌握對數報酬 r(t) 的 PDF 分佈，可以直觀的了解台灣市場與美國市場. ‧. 的差異。. y. Nat. 數報酬的 PDF 分佈 f (r) 會不會有所改變。. n. al. er. io. sit. 為了了解其差異，我們在不同的時間尺度 τ 下，計算台灣金融市場（TWII）的對. ni Ch 在 (3.1 ) 式，不同時間尺度 τ 的對數報酬我們記為 U engchi. v. rτ,i (t) = logPi (t + τ ) − logPi (t) 為了比較不同時間尺度 τ 下的 PDF fτ (r) ，我們從 (2.12) 式中知道，透過 fτ (0) 對 τ 的斜率 m （見圖 (A.1 - A.15)），可計算 Lévy 分佈的 α =. 1 。從圖 m. (A.1 - A.15) 中. 我們得到當 τ > 1152s 時，fτ (0) 對 τ 的雙對數圖呈現冪次分佈，斜率 m 可用於計算 α。. 33. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(46) 在本次工作中發現，斜率 m 在跨天（CD）與非跨天（NOCD）的情況下是不一致的，並且我們發現在跨天（CD）的情況下，從 fτ (0) 對 τ 的雙對數圖 (A.4,A.5,A.6,A.12,A.13) 中得到，當 τ > 288s 時，斜率 m 為固定常數；而非跨天（NOCD）的情況下，fτ (0) 對 τ 的雙對數圖 (A.7,A.8,A.9,A.14,A.15) 中得到，中間段（τ = 288s − 720s）的斜率隨 τ 變化，直到當 τ > 1152s 斜率 m 為固定常數，因此本次在對 fτ (r) 對 r 做尺度變換時，採用 τ = 1152s − 3240s , (τ = 32(×36s) − 90(×36s)) 範圍之間的斜率。. 立. (3.3). 學. 1 log f (r90 (0)) − log f (r32 (0)) , m= m log r90 (0) − log r32 (0). ‧ 國. α=. 政治大. 我們可以根據 (2.12) 式，fτ (r) 對 r 的尺度變換的公式為：. sit. io. n. al. −1 α. (3.4). er. 1. y. ‧. Nat. r′ = rτ α , fτ′ (r′ ) = fτ (r)τ. i Un. v. 經由 (3.4) 式做尺度變換後，我們得到台灣市場 TWII（2004y-2009y）的分佈. Ch. engchi. （圖 (3.4)-(3.9)）與美國市場 SP500（1996y-1999y）的分佈（圖 (3.10)-(3.12)），從圖中得到尺度變換後的分佈在 t=0 時，不同 τ 的 fτ′ (r′ ) 對 r′ 曲線都分別重疊在一起。. 因原始數據受到跨天影響（見 2.1.2 小節），所以我們為了把跨天的效應分離出來，我們分別對數據 TWII 與 SP500 做跨天 (CD) 與非跨天 (NOCD) 的處理，在對跨天數據做 fτ (r) 對 r 進行尺度變換（見 (3.4) 式），得到 CD 圖 (3.6,3.7) 與 NOCD 圖 (3.11)。我們分別紀錄原始數據、跨天、非跨天情況下的 fτ (r) 對 r 的 α 值，製成表 (3.2) 34. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(47) 政治大 ′. 學. ‧ 國. 立. ′. ′. Figure 3.4: Scaled Raw data PDF f (r ) and scaled log-return r in TWII between 2004y-. sit. y. Nat. 進行比較。. ‧. 2007y.. n. al. er. io. 我們得到跨天 fτ (r) 對 r 分佈的 α 值皆比原始數據與非跨天的 α 值還要來的. i Un. v. 大（TWII α > 6，SP500 α > 4），並且在圖 (3.6,3.7,3.11) 中的分佈呈現不對稱的情. Ch. engchi. 況，而非跨天 fτ (r) 對 r 分佈的 α 值在 3-4 之間，且圖 (3.12,3.8,3.9) 中的分佈呈現對稱的情況。. 35. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(48) 政治大 ′. 學. ‧ 國. 立. ′. ′. Figure 3.5: Scaled Raw data PDF f (r ) and scaled log-return r in TWII between 2008y-. ‧. 2009y.. n. er. io. sit. y. Nat. al. ′. Ch. engchi. ′. i Un. v. ′. Figure 3.6: Scaled CD PDF f (r ) and scaled log-return r in TWII between 2004y-2007y.. 36. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(49) 政治大. ′. ′. 學. ‧ 國. 立. ′. Figure 3.7: Scaled CD PDF f (r ) and scaled log-return r in TWII between 2008y-2009y.. ‧. n. er. io. sit. y. Nat. al. Ch. ′. engchi. ′. i Un. v. ′. Figure 3.8: Scaled NOCD PDF f (r ) and scaled log-return r in TWII between 2004y2007y.. 37. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(50) 政治大 ′. 學. ‧ 國. 立 ′. ′. Figure 3.9: Scaled NOCD PDF f (r ) and scaled log-return r in TWII between 2008y-. ‧. 2009y.. n. er. io. sit. y. Nat. al. Ch. ′. engchi. ′. i Un. v. ′. Figure 3.10: Scaled raw data PDF f (r ) and scaled log-return r in SP500 between 1996y1999y.. 38. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(51) 政治大. ′. ′. ′. 學. ‧ 國. 立. Figure 3.11: Scaled CD PDF f (r ) and scaled log-return r in SP500 between 1996y-. ‧. 1999y.. n. er. io. sit. y. Nat. al. Ch. ′. engchi. ′. i Un. v. ′. Figure 3.12: Scaled NOCD PDF f (r ) and scaled log-return r in SP500 between 1996y1999y.. 39. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(52) Market Year. Raw Data. CD. NOCD. TW 2004y. 3.008. 10.423. 3.943. TW 2005y. 2.784. 9.078. 3.266. TW 2006y. 2.682. 7.669. 3.192. TW 2007y. 2.598. 10.855. 3.122. TW 2008y. 2.422. 6.728. 3.027. TW 2009y. 2.514. 10.348. 3.029. 範圍. 2.422 - 3.008. 6.728 - 10.855. 3.027 - 3.943. SP500 1996y. 3.138. 5.766. 3.494. SP500 1997y. 2.937. 5.052. 3.283. SP500 1998y. 2.840. 4.791. 3.170. 4.898 政治大 2.840 - 3.138 4.791 - 5.766 立. SP500 1999y. 2.984. 範圍. 3.363 3.170 - 3.494. ‧. ‧ 國. 學. Table 3.2: Comparison of parameters α for TWII,SP500 for different time,data.. 我們從表3.2 以及以上圖形得到 TWII 2004y-2009y 以及 SP500 1996y-1999y. Nat. sit. n. al. er. io. 行比較。. y. fτ′ (r′ ) 對 r′ 的分佈曲線皆重疊在一起，在這裡彙整前人的論文數據成表 (3.3) 並進. Ch. engchi. 40. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(53) Work. α. Note. TWII 大盤指數 (2000y) [22]. α = 1.57 − 1.66. 分析 r = 0 大盤指數的 α 值. SP500(1984y-1989y) [16]. α = 1.40 ± 0.025. 分析 r = 0 大盤指數的 α 值. SP500(1926y-1996y) [11]. α = 2.5 − 4.3. 用累計法計算大盤指數 α (α of cumulative distribution). α = 3.8. 整體股價計算法 (NOMA)（僅計算 1996.2）. α = 1.02. 整體股價計算法 (1hrMA)（僅計算 1996.2）. α = 1.6. 市場平均計算法 (NOMA)（僅計算 1996.2）. α = 1.05. 市場平均計算法 (1hrMA)（僅計算 1996.2）. Raw data. α = 2.4219 − 3.008. τ = 1152s − 3240s. CD. α = 6.728 − 10.855. τ = 1152s − 3240s. SP500(1996y-1999y) [23]. TWII 2004y-2009y. 立. NOCD. τ = 1152s − 3240s. 學. ‧ 國. SP500 1996y-1999y. 政治大 α = 3.027 − 3.943 α = 2.840 − 3.138. CD. α = 4.791 − 5.766. τ = 1152s − 3240s. α = 3.170 − 3.494. τ = 1152s − 3240s. NOCD. τ = 1152s − 3240s. ‧. Raw data. Nat. n. al. er. io. sit. y. Table 3.3: Comparison of parameters α for TWII,SP500 for different time, data.. v. 從表 (3.3) 中我們得到美國市場 SP500 的 α ≈ 3 ，並且本次工作中美國市場的. Ch. engchi. i Un. 數據範圍（1996y-1999y），與前人論文 [23] 在同樣的數據範圍內，發現其計算結果與本次有所差異。從論文 [23] 中得到一個結論「計算方法會對 α 產生影響」，本次工作使用了論文 [23] 中的「整體股價計算法」，統計 SP500 中 345 家股票整體對數報酬 r 的機率密度 f (r) 分佈。除了計算方法會對 α 產生影響，另外數據採樣範圍也會對 α 產生影響，論文 [23] 中僅計算 1996 年 2 月 fτ′ (r′ ) 對 r′ 的 α 數值，而本次工作認為僅以 1996 年 2 月計算得到的 α 數值來代表 1996 年到 1999 年的美國市場數據，誤差值可能會十分劇烈，是故本次工作在計算 α 數值是以一年為單位而進行的計算，. 41. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(54) 得到的 α ≈ 3。除了優化論文 [23] 的計算結果外，本次工作發現台灣市場 TWII 股票數據 fτ′ (r′ ) 對 r′ 分佈的 α 值與論文 [22] 的結果有所出入，進而了解發現論文 [22] 所計算數據是 TWII 市場指數，並非股票數據本身，這個有很大的出入。TWII 市場指數是以 TWII 中的股票經由加權平均後所得到的金融指數，其意義與論文 [23] 中的「市場平均計算法」相似，所以論文 [22] 所計算的 α 數值與本次工作計算的 α 數值是不能直接比較的，因為計算方法不一樣。. 政治大. 同樣的，論文 [16] [11] 也是計算市場指數，並非市場中的股票數據，計算資料. 立. 樣本分別為 SP500 1984y-1989y [16] 以及 SP500 1926y-1996y [11]。論文 [16] 透過. ‧ 國. 學. 計算 r = 0 處的斜率 m 變化來計算 α ，其數值 α = 1.40 ± 0.025；而論文 [11] 是. ‧. 透過累計 fτ′ (r′ ) 的方法來得到 fτ′ (r′ ) 對 r′ 的 α 數值，其數值 α = 2.5 − 4.3。從論. Nat. 市場指數相似於論文 [23] 中的「平均股價計算法」。. al. er. io. sit. y. 文 [23] [11] 中知道市場指數 r = 0 處 α ≈ 1.5 （TWII 以及 SP500），其原因是因為. n. iv n C 本次工作除了確認 2004y-2009y 台灣股票數據，對數報酬具有時間尺度的不變性 hengchi U 之外，進一步用不同時間尺度 τ 及數據採樣（跨天與非跨天）的方式探討跨天所造成的影響性。. 最後對本小節進行小結，本次工作分析 TWII 與 SP500 股票數據中 fτ (r) 對 r 分佈的 α 數值，α = 2.4219 − 3.008 (Raw data) T W II , α = 2.840 − 3.138 (Raw data) SP 500 ，以 (2.12), (3.4) 式中得到，TWII 及 SP500 股票數據 fτ′ (r′ ) 對 r′ 的分佈，在 r′ = 0 的附近其曲線皆重合的很好。. 42. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(55) 並且發現 CD 的 fτ′ (r′ ) 對 r′ 的分佈的 α，其數值大於 Raw data 與 NOCD 的 α 數值，並且在遠離 r = 0 的地方，CD 的 fτ′ (r′ ) 分佈呈現不對稱的情況，而 NOCD 的 fτ′ (r′ ) 分佈基本上呈現對稱的情況。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 43. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(56) Chapter 4 一整群股票的價格變動分析時間的不均勻與空間的不均質政治大立 ‧ 國. 學. 4.1. 上升趨勢事件的持續性時間. ‧. 「極端事件」，往往是人們感興趣但尚未深入了解的領域，我們在上一章掌握. y. Nat. al. er. io. sit. 了台灣數據中 rτ (t) 的機率 PDF 分佈，並對其有充分的了解後，也開始試著掌. n. 握「當股票市場發生極值時，對股票市場本身的影響」。根據 Yi-Fu Shih [24] 討. Ch. engchi. i Un. v. 論：「對時間間隔為 τ 的對數報酬 rτ (t) 發生極值並持續的時間（在該文中定義為「持續性時間 Persistent time」）機率。」的結果有兩個。 1. 在對數報酬 rτ (t) 發生極值的持續時間恰好為 τ 處有較大的機率。 2. 在對數報酬 rτ (t) 發生極值的持續時間恰好為 τ 處之後成冪次分佈。. 這是一個很有趣的現象，但是文章 [24] 中並沒有對這兩個結果作出解釋。我們很好奇其中當股價持續上升（下跌）的現象，我們想要了解這中間的統計性質，而這一章則根據 Yi-Fu Shih [24] 的討論，對台灣市場 TWII 以及美國市場 SP500 的. 44. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(57) 股價持續上升（下跌）現象做量化的分析，了解其中持續性時間（Persistent time）以及發生時機，並對其作出解釋。由於股價持續上升（下跌）的現象發生時，往往被人們認為是一個「極端事件」的發生，但「極端事件」的是一個模糊的名詞，在開始分析前，先定義相關名詞，讓接續分析的人有明確的認識。. 首先我們定義，當對數報酬 r(t) > 0 時，我們定義為正向事件；當 r(t) < 0 時，我們定義為負向事件。持續性時間（Persistent time）是指時間序列中，在超. 政治大. 過一定的門檻值（n 個標準差，本次工作使用 n = 1）後所維持的時間，在超過一. 立. 定的門檻值後所維持的時間區內，這區間內發生的所有正向事件的整體，我們稱. ‧ 國. 學. 之為上升趨勢事件（effective up-trend event），而有上升趨勢事件也就有「下跌趨. ‧. 勢事件」（effective down-trend event），而在接連發生兩個上升（下跌）趨勢事件. y. Nat. er. io. sit. 之中所維持的時間稱之為 hitting time，而本次工作為計算上升趨勢事件 Persistent time，並且詳細說明計算過程。. n. al. Ch. engchi. i Un. v. Figure 4.1: Red line is Persistent time. Blue line is hitting time.. 1. 我們從 TWII 中 N=386 家中，取得平均對數報酬 r¯(t)。. r¯(t) =. rave =. N 1 ∑ ri (t) N i=1 T 1∑ r¯(t) T t=1. 45. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(58) 2. 當 (¯ r(t) > 0) 時為正向事件，並取得正向事件的一倍標準差 σ。. v u T u1 ∑ σ=t (¯ r(t) − rave )2. T. (4.1). t=1. 3. 統計所有上升趨勢事件（超過一倍標準差）持續時間（Persistent time）的機率，如 Shih 論文 [24] 4.1.1-4.1.4 節中所分析一日交易開收盤間的時間不均勻性。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. Figure 4.2: Comparison two market TWII , SP500 with PDF vs Persistent time and logPDF vs log-Persistent time.. 我們分析當 τ = 3600s 時，對數報酬 r(t) 序列中，超過 1 個標準差的上升趨勢事件的持續性時間，並畫出 Persistent time 的 PDF 圖，以及改變不同 τ ，畫出其 log − P ersistent time 對 log − P DF 圖，得到圖 (4.2)。從圖 (4.2) 中，我們得到不管 τ 怎麼改變，P ersistent time PDF 的雙對數圖皆呈 46. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(59) 現冪次分佈，轉折點在 τ 處，並且上升趨勢事件的 PDF 在 τ 處會有很大的突起，我們發現這突起的原因是因為跨天效應的緣故，因為跨天所造成的價差，往往會大過門檻，所以當對數報酬的 τ 數值不論為何，持續性時間為 τ 的機率都會增大（見圖4.3）。. 立. 政治大. ‧ 國. 學. Figure 4.3: Log return rCD of crossing day schematic.. ‧. 圖4.3 解釋了當跨天發生時產生的價差 rCD ，很容易出現使對數報酬 r(t) 持續. y. Nat. al. er. io. sit. > σ (或 < σ) ，使上升（下跌）趨勢事件發生的機率較大的情況。為了模擬這個跨. v. n. 天產生的現象，我們透過盤後交易模型（見2.6小節）來進行模擬。. Ch. engchi. i Un. 我們可以從盤後交易模型中得到一個包含盤後交易影響的價格序列 x(t)：. x(t) = x(0) +. Day ttra ∑ ∑. (. i=0 t′ =1. ξi (t′ ) +. taf ter. ∑. t′ =1. ξi (t′ )) +. T −Day·t ∑ total. ξDay+1 (t′ ). t′ =1. 透過上述分析上升趨勢事件的持續性時間的方法，來分析盤後交易模型的價格序列 x(t)，並對畫出當時間間隔 τ = 3600s 時，持續性時間 Persistent time 的 P DF 圖，與其雙對數圖，我們分析不同的每日盤後交易時間 taf ter ，找出突起處 P DF 的高度（見圖 (4.4)）。 47. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(60) 政治大. 立. ‧. ‧ 國. 學 y. Nat. sit. Figure 4.4: PDF of Persistent time with data of real stocks and of fitted after-hours trading. n. al. er. io. model in linear plots (upper panel) and log-log plots (lower panel) for TW market (left panel) and US market(right panel).. Ch. engchi. 48. i Un. v. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(61) 立. 政治大. ‧ 國. 學. Figure 4.5: PDF vs effective time in after-hours trading model.. (taf ter + ttra )/24 hr. 0.0311. taf ter ≈ 490 (×36s). y. 0.392. 0.0455. taf ter ≈ 695 (×36s). 0.477. taf ter ≈ 580 (×36s). sit. ‧. TW 2005y. 等效盤後交易時間 taf ter. Nat. TW 2004y. τ 處 PDF 值. io. Market Year. 0.0374. TW 2007y. 0.0594. TW 2008y. 0.0762. TW 2009y. 0.0328. taf ter ≈ 520 (×36s). 0.404. SP500 1996y. 0.0206. taf ter ≈ 340 (×36s). 0.4125. SP500 1997y. 0.0206. taf ter ≈ 340 (×36s). 0.4125. SP500 1998y. 0.0359. taf ter ≈ 565 (×36s). 0.506. SP500 1999y. 0.0125. taf ter ≈ 235 (×36s). 0.369. n. al. er. TW 2006y. ni C htaf ter ≈ 870 (×36s) U i tafetern≈g1050 c h(×36s). v. 0.429 0.55 0.625. Table 4.1: Comparison of after trading effective time taf ter for TWII,SP500 for different time, data.. 圖 (4.4) 顯示我們在 τ 處看到 PDF 有突起，並且持續性時間與其機率呈現冪次分佈，轉折點在 τ 處，與實際數據的狀況一致，而隨著改變每日盤後交易時間. 49. DOI:10.6814/THE.NCCU.AP.001.2018.B04.

(62) 長度 taf ter ，發現在 τ 處的突起高度與 taf ter 成遞增關係（見圖4.5）。透過盤後交易模型，我們把 TWII 和 SP500 每年的等效盤後交易時間 Effective time taf ter 列成表4.1進行比較，我們可以發現在 TWII 2008y 和 SP500 1996y 處於金融風暴時期的盤後交易時間較為高，這可能與金融風暴有較大的波動，所以盤後交易的效應被放大了。從盤後交易模型中我們透過持續性時間來計算 taf ter ，而 taf ter 長短是否與盤後交易的強弱有關係，我們值得再做探討。. 以網路慨念分析股票間的交互相關性立. 學. ‧ 國. 4.2. 政治大. 從 3.1章中透過把股票當成粒子，從 Langevin equation 中算得整體的性質，溫. ‧. 度 θ、擴散係數 D 等等，也從 4.1章中得到上升趨勢事件的發生機率在跨天的時候. y. Nat. io. sit. 會提高，為了更深入了解股票市場的特型，本章引入網路的觀念，我們將股票間. er. 的相關係數當作網路連結的強弱，參考離散網路中不同節點的距離中心性的觀念，. n. al. ni Ch 對股票市場進行分析，抓出股票與股票間的差異。 U engchi. v. 首先建立相關係數網路來分析 N 個股票的 T 維空間（T：時間序列長度）中的距離、中心性以及各種分布的偏離，分析股票網路空間的結構，以及計算不同時間點的相關係數變化，來了解市場中不同時間點的關係。為了分析股票市場中的空間結構，我們得先從建立股票的相關係數網路著手。. 50. DOI:10.6814/THE.NCCU.AP.001.2018.B04.