穩定分布(stable distribution) - 理論背景與方法 - 1996-1999年美國股票群的收益以高頻日移動平均計算之統計與動力性質分析

第二章理論背景與方法

2.3 穩定分布(stable distribution)

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

2.3 穩定分布 (stable distribution)

在金融市場當中，不同的金融商品諸如股票、期貨、基金…等等，在不同交易時間尺度之下會有不同的價格變化，例如蘋果公司的股票價格，每日的價格變化會不同於每週的價格變化，所以如何有效地探討價格變化背後的意義，我們即採用在不同時間尺度下，討論各種價格變化的機率分布的方式。所以選擇何種機率分布來描述股票價格是非常重要的，以下我們使用穩定分布來討論不同時間尺度之下的股票價格報酬的機率分布。

穩定分布，又稱為 Lévy 穩定分布 (Lévy stable distribution)，是一種連續機率分布。[3]Lévy 和 Khintchine 解決了這個如何決定所有穩定分布應該遵守的函數型式的問題，他們發現最一般的表示式是經由特徵函數 𝜑 來表達，包含四個參數：α、β、γ 與 μ，其中參數 α 是描述機率密度函數的厚尾分布，可稱為特徵指數，範圍是 α ≤ ；γ 是尺度因子(scale factor)且為正數，並與標準差有關；μ 為實數且為正數，與平均值有關，β 為不對稱參數(asymmetry parameter)，

又稱偏態係數，範圍在 [ 1 1] 之間，當分别為正值、0或負值時，分布分别右偏、對稱或左偏。

Lévy 穩定分布只有以下三種已知的解析解形式(analytic form)：

(1) α = ½, β = 1 (Lévy -Smirnov distribution) (2) α = 1, β = 0 (Lorentz distribution)

(3) α = 2 (Gaussian distribution)

當特徵參數從 2 降到 0 時，分布的尾部會變得越來越”肥” 。特别是當參數且 𝛽 時，特徵函數會變為常態(高斯)分布的特徵函數之型式

𝜑 ^{𝑖𝑢𝑞 𝛾𝑞}²，此時平均值為 𝑢，標準差為 𝛾。因此，常態分布是 Lévy 分布的一個特例。

Lévy 分布有兩個基本的重要性質：

(1)當 𝜶 𝟐 時，Lévy 分布不存在變異數。

‧

一組隨機變數的分布是 Lévy stable distribution，機率密度函數的特徵函數如 .3 式 𝜑 ^𝛾|𝑞|^𝛼 所定義，則將 n 組隨機變數相加，得到的另一個隨機

‧

2.4 截尾Lévy機率分布 (The Truncated Levy Flight)

如果股價指數報酬的時間序列是 Lévy 穩定機率分布，在股價報酬的個數趨向

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

∑ _𝑡 ̅_𝑡 _𝑡+ ̅_𝑡+

√∑ _𝑡 ̅_𝑡 ∑ _𝑡+ ̅_𝑡+

推廣到 k 階自相關係數 _𝑘 為

𝑘

∑ _𝑡 ̅_𝑡 _𝑡+𝑘 ̅_𝑡+𝑘

√∑ _𝑡 ̅_𝑡 ∑ _𝑡+𝑘 ̅_𝑡+𝑘

其中 C 介於 [-1,1]， ≤ 1 表示正相關， 1 ≤ 表示負相關， 1 代表完全正(負)相關，表示不相關。C 值越靠近 1 表示正相關性越高，

越靠近 -1 表示負相關性越高，接近零則表示時間序列上的數值前後越不相關。

H. Eugene Stanley, Yanhui Liu 等人研究報酬的自我相關行為，在 1999 年發表

的文章[14]指出，在開盤和收盤時間附近會有較活躍的交易為了消除這些干擾，

他們找出所謂當天之內圖形(intraday pattern)，定義為 ( _𝑑) ≡∑| _𝑑 |

其中， _𝑑 為每天第 j 家公司在當天某個時刻的股價指數報酬，N 為選取 時間序列的全部天數。對原本的資料重新定義後，得到

𝑔 ≡ ( _𝑑) ( _𝑑)

( _𝑑) 為當日某時刻的報酬，𝑔 為在 t 時刻標準化過後的價格變化的絕對值，藉此使自相關函數能消除在一天之中所受的外在影響。研究的結果顯示，在半小時內會呈指數式地衰減到零，其行式為

^𝑡^𝜏

其中 𝜏 為特徵時間，約為 4 分鐘，接著遞減大約在 20 分鐘左右至零附近。而我們在討論自相關時所採用的 HF1MA 方式，目的也在於一天之內的移動平均下，

可以消除日內所受的干擾。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章實證分析

基於上述理論與統計性質，我們選取的研究對象為 S&P 500 股價指數當中，在 1996 年至 1999 年之間交易較為頻繁的 345 家公司[10]的股票價格，每筆價格為每隔 36 秒記錄一次交易，我們將其對不同的時間尺度下作對數報酬(價格取對數之後再相減)的計算，再以所得到的時間序列做分析與探討。

股市每天交易時間為 AM9:00 PM4:30，共 6.5 個小時(23400s) ，一年交易的時間有 240 天(5156000s)。股票交易視為連續，這裡只考慮股市交易的時候，移除晚上，週末或假日…等股市沒有交易的情形。也就是說，當次收盤與下一次開盤視為連續。

本章前兩節先定義移動平均和對數報酬，以及如何在資料上選取時間尺度，其餘小節則介紹所作的研究及成果，在 3.3 節由股價對數報酬計算 MSLR 來實證朗之萬理論的描述；在 3.4 節詳細探討如何應用 Lévy 機率分布的理論在股價報酬的分析；在 3.5 節則引用新的自相關函數討論有無移動平均的影響。

3.1 高頻一天移動平均線的定義 (definition of High frequency One-day moving average, HF1MA)

所謂高頻是指記錄一次交易的時間為 36 秒，在此我們利用股票技術分析上的

「移動平均」(MA)的概念，本研究採用算數移動平均 (Arithmetic Moving Average, AMA)，指的是某序列之前 n 個數值的未作加權算術平均。例如，成交量 (Volume) 的 5 日簡單移動平均是指之前 5 日成交量的算術平均數，性質為圖形上的一點。

假設 n 天的成交量為 𝑣 至 𝑣 ，則 n 日簡單移動平均方程式為：

AMA 𝑣 𝑣 ⋯ 𝑣

所謂線是指由無數個點所構成，然而在實際股票數據上並不可能無限地分割，

所以線的稠密性將視所選取資料的時間尺度有關。例如，在一段固定的時間裡，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

續地計算出 AMA 的數值，並將其連接起來即可得到所謂的「移動平均線」，簡稱均線。其計算方法為，從一開始的 AMA 算起，標記為AMA ，之後每隔一個相同的時間區間 T (time interval) 就有一個新的數值加入，同時最舊的那個數值剔除，由此得到新的移動平均，標記為AMA ：

AMA 𝑣 𝑣 ⋯ 𝑣 AMA 𝑣 𝑣₃ ⋯ 𝑣₊

𝑣 𝑣 ⋯ 𝑣 𝑣 𝑣₊

AMA 𝑣₊ 𝑣

AMA_𝑖 AMA ∑^𝑖_𝑘𝑣_+𝑘 ∑^𝑖_𝑘𝑣_𝑘

再將AMA 視為初始值，重覆以上式計算後可得各個時間尺度之下的 AMA。

利用上述方法，我們選取 S&P 500 的每個月的價格為總資料長度，由於資料的時間序列屬於高頻的特性，先對資料做 1 天 (即 650 個資料點) 的移動平均 (1MA 或 HF1MA)，經過 1MA 方式調整過後的資料較為平滑，資料點較原始資料點少 649 個，並且曲線可視為連續的路徑。

圖 3.1 1996 年 1 月 APPLE 公司的股價變動趨勢圖(藍線)以及經過 1 天的移動平 均(紅線)，橫軸為記錄交易的時間間隔 t (36 秒/格)，縱軸為股價(USD)。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

3.2 (對數)報酬 log–return R(t)的定義與不同的交易時間尺度 time scale 𝝉

我們定義對數報酬 t (或稱價格變化率)，其形式如下：

t ≡ t 𝜏 t ≅ t 𝜏 t t ≈

其中，為該時間點的價格指數，𝜏 為交易的時間尺度， ^𝑝_𝑝 為報酬率的百分比。設 𝜏 36s，最初開盤的指數為， |_s t 1 ，則 36s 後的指數為， |_36s t 36s 1 1。則取對數 (natural log) 後， ≅ 6.9 7755 ; ≅ 6.9 8754， . 999。

接著選取不同的交易時間尺度 𝜏，相當於隨機漫步中的步數，例如選取 𝜏 3

min (6 × 3 ÷ 36 5 個資料點)，代表依序每 3 分鐘 (5 步之後) 把取對數後的

收盤價減去 3 分鐘前取對數後的開盤價，而得到一組對數報酬(log–return)。

另外，log – return 的計算皆採取 overlapping 的方式，如下圖所示：

𝐭 𝐭 𝝉

0 3 min 6 min 9 min 12 min

𝐭 𝐭 𝝉

0 1 2 3 4 5 6 7 8

圖 3.2 資料選取的方式：Overlapping & non-overlapping

則考慮在不同交易時間尺度 (time scale 𝜏) 之下的對數報酬，(3.2A)式可改寫為如下形式，其中為該時間點的價格：

𝜏 t ≡ 𝜏 t 3.

Non-overlapping

overlapping

𝝉

‧

式[11]來找出一條主曲線(master curve)，將不同月份的 MSLR 做尺度變換後，發現除了少數月份之外，其餘月份皆可以主曲線來適當地描述。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

需時間為 1)，可得。下圖為模擬的結果並選取最大步數 (最長的時間) 做比較，結果顯示在相同的步數(時間)下，組數越多越吻合隨機行走的分布(常態分布)。另一方面，我們也可驗證在相同的組數之下，所行走的步數越多圖形越低擴，因為步數相當於時間，在公式裡時間越長則圖形越低擴，由圖中可看出資料點恰當地落在公式曲線上。

圖 3.3.1A 隨機亂數模擬隨機行走，結果顯示吻合隨機行走的機率分布。

圖 3.3.1B 隨機亂數模擬隨機行走，左圖結果顯示在相同的步數(時間)下，組數越多越吻合隨機行走的分布，右圖結果顯示在相同的組數(試驗次數)下，步數越多越吻合隨機行走的分布

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

(2) 主曲線(master curve)的 fitting

我們也可以在不同時間的隨機行走找到一條主曲線，使各個時間點曲線消去時間的影響並適當地落在主曲線上，這裡採用方式是變數變換法，對於 3.3.1B 式，

由於 ∫ 𝑑 _∞^∞ 1，可以找到一個 ∫ A 𝑑 _∞^∞ 1，其中 A 為歸一化常數。令 _4𝐷𝑡^𝑥² ( )，可得 ^𝑥

√4𝐷𝑡 且 𝑑 ^𝑑𝑥

√4𝐷𝑡，代入並計算後可得 A √ ，則為主曲線其值為

𝐏 1

√𝜋

所以我們將原本的函數值做變數變換(即 ^𝑥

√4𝐷𝑡)之後再作圖，即可得到所有圖均恰當地分布在主曲線上。

圖 3.3.1C 以隨機亂數模擬隨機行走，左圖為 100000 組隨機試驗次數，右圖為 10000 組隨機試驗次數，結果顯示兩個不同組數的隨機試驗皆落在主曲線上，且組數(試驗次數)越多分布越吻合。

‧

取平均，我們稱這一個數為均對數報酬(Mean Square Log Return, MSLR)，記為

〈 〉。按此步骤，對所有可能的 𝜏 都按上述方式計算，得到的整體市場的 MSLR

Monday Tuesday Wednesday Thursday Friday

A 10 11 12 13 14

B 10 9 8 7 6

C 4 7 10 7 4

假設 𝜏 1 天，則 _{𝑓 𝜏} _𝑓 ≡ 𝑔 _𝑓 1 𝑔 _𝑓 ，可表示如下

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在 𝜏 𝜏_𝑐 時，斜率不固定，並不符合朗之萬理論的描述。

圖 3.3.3A 1996 年 1 月 S&P500 其中 345 家公司，在 noMA (或 NO1MA)下所有可能 𝜏 (交易時間) 之下所得到的整體市場的平均之 MSLR 分布圖。長 τ 部份：

位移平方正比於時間，圖上截距相當於擴散係數 D 的對數值；短 τ 部份：受粒子(股價)在所處環境(市場)的影響，斜率不固定。

針對這個情形，我們認為可能的原因是，基於朗之萬理論的假設，粒子移動的軌跡是連續的，而原始數據是離散的形式，所以我們以沒有移動平均的報酬來計算，其所得到的圖形會與理論上有所差異，因此我們採用有經過一天的移動平均 (HF1MA)的報酬來計算。針對以上假設，我們改先對股票價格做 HF1MA 之後，

再按先前的方法算出 MSLR 之後作圖，可得到的結果如圖 3.3.3B 所示。由圖形可得知，經過 HF1MA 後，所得到的圖形較符合我們將報酬對應於朗之萬理論所預期的結果。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 3.3.3B 1996 年 1 月，有 HF1MA (即 1MA) 在所有可能 𝜏 之下所得到的 MSLR 分布圖。短 τ 部份：microscopic，位移平方正比於時間的平方；長 τ 部份：位移平方正比於時間的一次方。

圖 3.3.3C HF1MA 與 noMA 的圖形比較，由圖形可知在長時間兩者的斜率近乎

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 3.3.4A HF1MA 在不同時間尺度下的圖形比較，由圖形可知在長時間的斜率近乎相同，在短時間的部份斜率則有差異。

圖 3.3.4B 不同移動平均的時間長度下的圖形比較，移動平均的時間長度從 1 天的移動平均(1MA)到 5 天的移動平均(5MA)，由圖形可知 MA 的長度對轉折時間 τ 有影響，末端的掉落受限資料長度所致，統計性較差。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

另一方面，由實證可知 MSLR 〈 〉 的解有指數形式[11]，

〈 〉 {𝜃𝜏 𝑤 ≈ 𝑓 𝜏 𝜏 𝑤 ≈ 1 𝑓 𝑔 𝜏

其中 𝜃 𝜏⁄ 與相當於朗之萬方程的解之中的溫度與擴散係數，由於在短 𝜏 中的誤差值很小，所以可經由對數尺度下求得 𝜃，而在長 𝜏 時的誤差較大，在對數尺度下的誤差也大，所以改在線性尺度下直接找一條線： ∗ 𝜏 𝑏 來 fitting 長 𝜏 的部份以找出，經由 𝜃 與可以找出特徵時間 𝜏 的值。

由朗之萬方程所求得的 MSD 公式形式如下

𝑀𝑆 ≡ 〈[ 𝜏 ] 〉 [𝜏 𝜏 1 ^{𝜏 𝜏}^⁄ ⁰] 我們可以找到一條主曲線(master curve)[11]

〈 ^∗〉 𝜏^∗ 1 ^𝜏^∗

來 fitting 實證資料經過尺度化之後的 MSLR 〈 ^∗〉 〈 〉/ 𝜏 對應於尺度化後的時間 𝜏^∗ 𝜏 𝜏⁄ ，這裡我們對 1996 年的數據採用以每 4 週當作一個月的資料作圖，發現除了幾個較特別的月份之外，每一條 MSLR 幾乎都落在主曲線上。

在文檔中 1996-1999年美國股票群的收益以高頻日移動平均計算之統計與動力性質分析 - 政大學術集成 (頁 22-0)

穩定分布(stable distribution)

第二章 理論背景與方法

2.3 穩定分布(stable distribution)

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

2.3 穩定分布 (stable distribution)

‧

‧

2.4 截尾Lévy機率分布 (The Truncated Levy Flight)

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

H. Eugene Stanley, Yanhui Liu 等人研究報酬的自我相關行為，在 1999 年發表

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章 實證分析

3.1 高頻一天移動平均線的定義 (definition of High frequency One-day moving average, HF1MA)

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.2 (對數)報酬 log–return R(t)的定義與不同的交易時間尺度 time scale 𝝉

min (6 × 3 ÷ 36 5 個資料點)，代表依序每 3 分鐘 (5 步之後) 把取對數後的

0 3 min 6 min 9 min 12 min

0 1 2 3 4 5 6 7 8

Non-overlapping

overlapping

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章理論背景與方法

立政治大學

立政治大學

立政治大學

第三章實證分析

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學