• 沒有找到結果。

第二章 理論背景與方法

2.3 穩定分布(stable distribution)

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

2.3 穩定分布 (stable distribution)

在金融市場當中,不同的金融商品諸如股票、期貨、基金…等等,在不同交易 時間尺度之下會有不同的價格變化,例如蘋果公司的股票價格,每日的價格變化 會不同於每週的價格變化,所以如何有效地探討價格變化背後的意義,我們即採 用在不同時間尺度下,討論各種價格變化的機率分布的方式。所以選擇何種機率 分布來描述股票價格是非常重要的,以下我們使用穩定分布來討論不同時間尺度 之下的股票價格報酬的機率分布。

穩定分布,又稱為 Lévy 穩定分布 (Lévy stable distribution),是一種連續機率 分布。[3]Lévy 和 Khintchine 解決了這個如何決定所有穩定分布應該遵守的函 數型式的問題,他們發現最一般的表示式是經由特徵函數 𝜑 來表達,包含四 個參數:α、β、γ 與 μ,其中參數 α 是描述機率密度函數的厚尾分布,可稱為 特徵指數,範圍是 α ≤ ;γ 是尺度因子(scale factor)且為正數,並與標準差 有關;μ 為實數且為正數,與平均值有關,β 為不對稱參數(asymmetry parameter),

又稱偏態係數,範圍在 [ 1 1] 之間,當分别為正值、0或負值時,分布分别右 偏、對稱或左偏。

Lévy 穩定分布只有以下三種已知的解析解形式(analytic form):

(1) α = ½, β = 1 (Lévy -Smirnov distribution) (2) α = 1, β = 0 (Lorentz distribution)

(3) α = 2 (Gaussian distribution)

當特徵參數 從 2 降到 0 時,分布的尾部會變得越來越”肥” 。特别是當參數 且 𝛽 時,特徵函數會變為常態(高斯)分布的特徵函數之型式

𝜑 𝑖𝑢𝑞 𝛾𝑞2,此時平均值為 𝑢,標準差為 𝛾。因此,常態分布是 Lévy 分 布的一個特例。

Lévy 分布有兩個基本的重要性質:

(1)當 𝜶 𝟐 時,Lévy 分布不存在變異數。

一組隨機變數的分布是 Lévy stable distribution,機率密度函數的特徵函數如 .3 式 𝜑 𝛾|𝑞|𝛼 所定義,則將 n 組隨機變數相加,得到的另一個隨機

2.4 截尾Lévy機率分布 (The Truncated Levy Flight)

如果股價指數報酬的時間序列是 Lévy 穩定機率分布,在股價報酬的個數趨向

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

𝑡 ̅𝑡 𝑡+ ̅𝑡+

√∑ 𝑡 ̅𝑡 𝑡+ ̅𝑡+

推廣到 k 階自相關係數 𝑘

𝑘

𝑡 ̅𝑡 𝑡+𝑘 ̅𝑡+𝑘

√∑ 𝑡 ̅𝑡 𝑡+𝑘 ̅𝑡+𝑘

其中 C 介於 [-1,1], ≤ 1 表示正相關, 1 ≤ 表示負相關, 1 代表完全正(負)相關, 表示不相關。C 值越靠近 1 表示正相關性越高,

越靠近 -1 表示負相關性越高,接近零則表示時間序列上的數值前後越不相關。

H. Eugene Stanley, Yanhui Liu 等人研究報酬的自我相關行為,在 1999 年發表

的文章[14]指出,在開盤和收盤時間附近會有較活躍的交易為了消除這些干擾,

他們找出所謂當天之內圖形(intraday pattern),定義為 ( 𝑑 ) ≡∑ | 𝑑 |

其中, 𝑑 為每天第 j 家公司在當天某個時刻的股價指數報酬,N 為選取 時間序列的全部天數。對原本的資料重新定義後,得到

𝑔 ≡ ( 𝑑 ) ( 𝑑 )

( 𝑑 ) 為當日某時刻的報酬,𝑔 為在 t 時刻標準化過後的價格變化的絕對 值,藉此使自相關函數能消除在一天之中所受的外在影響。研究的結果顯示,在 半小時內會呈指數式地衰減到零,其行式為

𝑡𝜏

其中 𝜏 為特徵時間,約為 4 分鐘,接著遞減大約在 20 分鐘左右至零附近。而我 們在討論自相關時所採用的 HF1MA 方式,目的也在於一天之內的移動平均下,

可以消除日內所受的干擾。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第三章 實證分析

基於上述理論與統計性質,我們選取的研究對象為 S&P 500 股價指數當中,在 1996 年至 1999 年之間交易較為頻繁的 345 家公司[10]的股票價格,每筆價格為 每隔 36 秒記錄一次交易,我們將其對不同的時間尺度下作對數報酬(價格取對 數之後再相減)的計算,再以所得到的時間序列做分析與探討。

股市每天交易時間為 AM9:00 PM4:30,共 6.5 個小時(23400s) ,一年交易的 時間有 240 天(5156000s)。股票交易視為連續,這裡只考慮股市交易的時候,移 除晚上,週末或假日…等股市沒有交易的情形。也就是說,當次收盤與下一次開 盤視為連續。

本章前兩節先定義移動平均和對數報酬,以及如何在資料上選取時間尺度,其 餘小節則介紹所作的研究及成果,在 3.3 節由股價對數報酬計算 MSLR 來實證朗 之萬理論的描述;在 3.4 節詳細探討如何應用 Lévy 機率分布的理論在股價報酬 的分析;在 3.5 節則引用新的自相關函數討論有無移動平均的影響。

3.1 高頻一天移動平均線的定義 (definition of High frequency One-day moving average, HF1MA)

所謂高頻是指記錄一次交易的時間為 36 秒,在此我們利用股票技術分析上的

「移動平均」(MA)的概念,本研究採用算數移動平均 (Arithmetic Moving Average, AMA),指的是某序列之前 n 個數值的未作加權算術平均。例如,成交量 (Volume) 的 5 日簡單移動平均是指之前 5 日成交量的算術平均數,性質為圖形上的一點。

假設 n 天的成交量為 𝑣 至 𝑣 ,則 n 日簡單移動平均方程式為:

AMA 𝑣 𝑣 ⋯ 𝑣

所謂線是指由無數個點所構成,然而在實際股票數據上並不可能無限地分割,

所以線的稠密性將視所選取資料的時間尺度有關。例如,在一段固定的時間裡,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

續地計算出 AMA 的數值,並將其連接起來即可得到所謂的「移動平均線」,簡 稱均線。其計算方法為,從一開始的 AMA 算起,標記為AMA ,之後每隔一個 相同的時間區間 T (time interval) 就有一個新的數值加入,同時最舊的那個數 值剔除,由此得到新的移動平均,標記為AMA :

AMA 𝑣 𝑣 ⋯ 𝑣 AMA 𝑣 𝑣3 ⋯ 𝑣 +

𝑣 𝑣 ⋯ 𝑣 𝑣 𝑣 +

AMA 𝑣 + 𝑣

AMA𝑖 AMA ∑𝑖𝑘 𝑣 +𝑘𝑖𝑘 𝑣𝑘

再將AMA 視為初始值,重覆以上式計算後可得各個時間尺度之下的 AMA。

利用上述方法,我們選取 S&P 500 的每個月的價格為總資料長度,由於資料的 時間序列屬於高頻的特性,先對資料做 1 天 (即 650 個資料點) 的移動平均 (1MA 或 HF1MA),經過 1MA 方式調整過後的資料較為平滑,資料點較原始資 料點少 649 個,並且曲線可視為連續的路徑。

圖 3.1 1996 年 1 月 APPLE 公司的股價變動趨勢圖(藍線)以及經過 1 天的移動平 均(紅線),橫軸為記錄交易的時間間隔 t (36 秒/格),縱軸為股價(USD)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3.2 (對數)報酬 log–return R(t)的定義與不同的交易時間尺度 time scale 𝝉

我們定義對數報酬 t (或稱價格變化率),其形式如下:

t ≡ t 𝜏 t ≅ t 𝜏 t t ≈

3.

其中, 為該時間點的價格指數,𝜏 為交易的時間尺度, 𝑝𝑝 為報酬率的百分 比。設 𝜏 36s,最初開盤的指數為 , | s t 1 ,則 36s 後的指數為 , | 36s t 36s 1 1。則取對數 (natural log) 後, ≅ 6.9 7755 ; ≅ 6.9 8754, . 999。

接著選取不同的交易時間尺度 𝜏,相當於隨機漫步中的步數,例如選取 𝜏 3

min (6 × 3 ÷ 36 5 個資料點),代表依序每 3 分鐘 (5 步之後) 把取對數後的

收盤價減去 3 分鐘前取對數後的開盤價,而得到一組對數報酬(log–return)。

另外,log – return 的計算皆採取 overlapping 的方式,如下圖所示:

𝐭 𝐭 𝝉

0 3 min 6 min 9 min 12 min

𝐭 𝐭 𝝉

0 1 2 3 4 5 6 7 8

圖 3.2 資料選取的方式:Overlapping & non-overlapping

則考慮在不同交易時間尺度 (time scale 𝜏) 之下的對數報酬,(3.2A)式可改寫 為如下形式,其中 為該時間點的價格:

𝜏 t ≡ 𝜏 t 3.

Non-overlapping

overlapping

𝝉

𝝉

式[11]來找出一條主曲線(master curve),將不同月份的 MSLR 做尺度變換後,發 現除了少數月份之外,其餘月份皆可以主曲線來適當地描述。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

需時間為 1),可得 。下圖為模擬的結果並選取最大步數 (最長的時間) 做 比較,結果顯示在相同的步數(時間)下,組數越多越吻合隨機行走的分布(常態分 布)。另一方面,我們也可驗證在相同的組數之下,所行走的步數越多圖形越低 擴,因為步數相當於時間,在公式裡時間越長則圖形越低擴,由圖中可看出資料 點恰當地落在公式曲線上。

圖 3.3.1A 隨機亂數模擬隨機行走,結果顯示吻合隨機行走的機率分布。

圖 3.3.1B 隨機亂數模擬隨機行走,左圖結果顯示在相同的步數(時間)下,組數 越多越吻合隨機行走的分布,右圖結果顯示在相同的組數(試驗次數)下,步數越 多越吻合隨機行走的分布

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(2) 主曲線(master curve)的 fitting

我們也可以在不同時間的隨機行走找到一條主曲線,使各個時間點曲線消去時間 的影響並適當地落在主曲線上,這裡採用方式是變數變換法,對於 3.3.1B 式,

由於 ∫ 𝑑 1,可以找到一個 ∫ A 𝑑 1,其中 A 為歸一化 常數。令 4𝐷𝑡𝑥2 ( ),可得 𝑥

√4𝐷𝑡 且 𝑑 𝑑𝑥

√4𝐷𝑡,代入並計算後可得 A √ ,則 為主曲線其值為

𝐏 1

√𝜋

2

所以我們將原本的函數值做變數變換(即 𝑥

√4𝐷𝑡)之後再作圖,即可得到所有圖 均恰當地分布在主曲線上。

圖 3.3.1C 以隨機亂數模擬隨機行走,左圖為 100000 組隨機試驗次數,右圖為 10000 組隨機試驗次數,結果顯示兩個不同組數的隨機試驗皆落在主曲線上,且 組數(試驗次數)越多分布越吻合。

取平均,我們稱這一個數為均對數報酬(Mean Square Log Return, MSLR),記為

〈 〉。按此步骤,對所有可能的 𝜏 都按上述方式計算,得到的整體市場的 MSLR

Monday Tuesday Wednesday Thursday Friday

A 10 11 12 13 14

B 10 9 8 7 6

C 4 7 10 7 4

假設 𝜏 1 天,則 𝑓 𝜏 𝑓 ≡ 𝑔 𝑓 1 𝑔 𝑓 ,可表示如下

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

在 𝜏 𝜏𝑐 時,斜率不固定,並不符合朗之萬理論的描述。

圖 3.3.3A 1996 年 1 月 S&P500 其中 345 家公司,在 noMA (或 NO1MA)下所有 可能 𝜏 (交易時間) 之下所得到的整體市場的平均之 MSLR 分布圖。長 τ 部份:

位移平方正比於時間,圖上截距相當於擴散係數 D 的對數值;短 τ 部份:受粒 子(股價)在所處環境(市場)的影響,斜率不固定。

針對這個情形,我們認為可能的原因是,基於朗之萬理論的假設,粒子移動的 軌跡是連續的,而原始數據是離散的形式,所以我們以沒有移動平均的報酬來計 算,其所得到的圖形會與理論上有所差異,因此我們採用有經過一天的移動平均 (HF1MA)的報酬來計算。針對以上假設,我們改先對股票價格做 HF1MA 之後,

再按先前的方法算出 MSLR 之後作圖,可得到的結果如圖 3.3.3B 所示。由圖形 可得知,經過 HF1MA 後,所得到的圖形較符合我們將報酬對應於朗之萬理論所 預期的結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3.3.3B 1996 年 1 月,有 HF1MA (即 1MA) 在所有可能 𝜏 之下所得到的 MSLR 分布圖。短 τ 部份:microscopic,位移平方正比於時間的平方;長 τ 部份:位 移平方正比於時間的一次方。

圖 3.3.3C HF1MA 與 noMA 的圖形比較,由圖形可知在長時間兩者的斜率近乎

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 3.3.4A HF1MA 在不同時間尺度下的圖形比較,由圖形可知在長時間的斜率 近乎相同,在短時間的部份斜率則有差異。

圖 3.3.4B 不同移動平均的時間長度下的圖形比較,移動平均的時間長度從 1 天 的移動平均(1MA)到 5 天的移動平均(5MA),由圖形可知 MA 的長度對轉折時間 τ 有影響,末端的掉落受限資料長度所致,統計性較差。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

另一方面,由實證可知 MSLR 〈 〉 的解有指數形式[11],

〈 〉 {𝜃𝜏 𝑤 ≈ 𝑓 𝜏 𝜏 𝑤 ≈ 1 𝑓 𝑔 𝜏

其中 𝜃 𝜏⁄ 與 相當於朗之萬方程的解之中的溫度與擴散係數,由於在 短 𝜏 中的 誤差值很小,所以可經由對數尺度下求得 𝜃,而在長 𝜏 時的 誤 差較大,在對數尺度下 的誤差也大,所以改在線性尺度下直接找一條線 : ∗ 𝜏 𝑏 來 fitting 長 𝜏 的部份以找出 ,經由 𝜃 與 可以找出特 徵時間 𝜏 的值。

由朗之萬方程所求得的 MSD 公式形式如下

𝑀𝑆 ≡ 〈[ 𝜏 ] 〉 [𝜏 𝜏 1 𝜏 𝜏 0] 我們可以找到一條主曲線(master curve)[11]

〉 𝜏 1 𝜏

來 fitting 實證資料經過尺度化之後的 MSLR 〈 〉 〈 〉/ 𝜏 對應於尺度化 後的時間 𝜏 𝜏 𝜏⁄ ,這裡我們對 1996 年的數據採用以每 4 週當作一個月的資 料作圖,發現除了幾個較特別的月份之外,每一條 MSLR 幾乎都落在主曲線上。

來 fitting 實證資料經過尺度化之後的 MSLR 〈 〉 〈 〉/ 𝜏 對應於尺度化 後的時間 𝜏 𝜏 𝜏⁄ ,這裡我們對 1996 年的數據採用以每 4 週當作一個月的資 料作圖,發現除了幾個較特別的月份之外,每一條 MSLR 幾乎都落在主曲線上。