普松分佈的推廣
Generalization of Poisson Distribution
楊效適
摘要. “統計表徵” (statistical token) 是一個由 “統計表徵產生器” (statistical token generator) 所產生的隨機數。 所謂的 “統計表徵產生器” 是一個不均勻 (non- uniform) 的隨機數產生器。 當使用者以統計表徵作為通訊系統擷取頻道 (channel access) 之依據時, 此系統具有隨機性, 而且發生 “碰撞” (collision) 的或然率較低,
“統計表徵產生器” 具有可調變的特性, 可產生出不同的統計表徵分佈, 當我們以或 然率理論推導統計表徵分佈時, 我們可發現一個較普松分佈廣義的新分佈。
Abstract: Statistical token is a random number generated from statistical token generator which is a non-uniform random number generator, when users use the statistical token as the medium access control technology of communication system, a contention protocol with lower collision rate than CSMA/CD protocol can be built.
By using probability theory, a very concise formula was derived to de- scribe the distribution of statistical token model.
1. 緒言
競爭型通訊協定 (contention protocol) 是一種數據通訊 (data communication) 系統 常使用的通訊協定。 由於數據通訊中的資料流 (data flow) 具有隨機性, 使得適用於隨機性資料 流的競爭型通訊協定廣泛被採用。 分析數據通訊系統與競爭型通訊協定常使用或然率理論。 經 過多年的分析與研究, 對於一些較初始 (primary) 競爭型通訊協定可以傳統隨機分佈 (普松分 佈) 描述。
開發較優良的競爭型通訊協定是通訊系統研究項目之一, 相對於一種新通訊協定的提出, 新隨機模型也應建立。 如此方能對於新通訊協定有深入的了解。 本文提出一種新競爭型通訊協
17
定與其對應的隨機分佈。 新競爭型通訊協定較初始競爭型通訊協定有更多的控制因素, 其對應 的隨機分佈也較普松分佈更為廣義。
2. ALOHA 通訊協定
ALOHA 通訊協定是美國夏威夷大學所發展出來的一種競爭型通訊協定。 也是最早的一 種競爭型通訊協定 (1970年代)。 其架構也成為後來以太網路 (Ethernet) 的基本架構。
所謂 ALOHA 通訊協定是指: 通訊頻道區分為固定長度的時槽 (time slot), 同時資料框 的長度也固定。 每個時槽的長度足以正確的傳輸此一資料框, 同時使用者必需在時槽的起點開 始傳送, 不得任意傳送 (參考圖一)。
圖一. ALOHA 通訊協定
現假設有 M 個使用者, 且每個使用者平均在 n 個時槽的時間內送出一個資料框。
為了模擬 ALOHA 通訊協定, 我們可假設每個使用者有一範圍為 (0, n − 1) 且平均分佈 的隨機數產生器, 其產生之隨機數 i (出現機率 = p), 即代表這個使用者在時槽 i 送出資料框。
我們現在想知道; 在某一時槽內有 k 個使用者送出資料框或然率 P0(k)。 從上面的假設我 們可看出 P0(k) 就是一個二項式分佈:
P0(k) = C(M, k) · pk· (1 − p)M −k (2.1) P (k) =µk
k! · e−µ (2.2)
當 M → ∞, Mp = M/n = µ 時, P0(k) 近似於 P (k)。
其中 K ≥ 2是表示: 同一時槽內有二個或二個以上的使用者送出資料框而發生碰撞。
而 K = 0 是表示: 此一時槽沒有任何使用者送出資料框。 我們最感興趣的是 K = 1 的 情況, 此一情況表示: 資料框成功的送出, 而 K = 1 的或然率 (或百分比), 就是此一通道的效 能 (throughput)。
3. 統計表徵 (statistical token)
上一節中對於 ALOHA 通訊協定的分析所使用的模型: 每個使用者有一個均勻的隨機數 產生器。 每個使用者依照所得到的隨機數做為送出資料框的時槽指標 (time slot index)。 這個 隨機數產生器決定了這個模型的隨機性, 同時也決定了此一模型 (或通訊協定) 效能的極限: 普 松分佈。
當我們設想此一模型內可以改變的因素時, 我們很直覺的就可發現: 均勻的隨機數產生 器是一個可改變的因素。 而此一因素有可能導致此一模型分佈的改變。
我們將每個使用者的隨機數產生器調整成一種不均勻的分佈, 而且每個使用者的隨機數產 生器在某一特定的出現或然率較高。 如在圖二中出現 i 的或然率為 p, 其餘各點的或然率為 r, 且 p 大於 r。
1 2 3 4
0
圖二. 不均勻隨機數產生器
現在假設有 n 個使用者, 其代號 id 介於 0 與 n − 1 之間。 而其隨機數產生器出現 p 點 的位置與其代號 id 相同。 當此一模型成立時, 我們可發現: 每個使用者所得到的隨機數 i 並不 是平均分佈在 0 與 n − 1 的範圍中, 而是較集中於自己的代號 id 的一種分佈 (如圖三)。
User A User B User C
圖三. 統計表徵分佈圖
3.1. 統計表徵模型的分佈
現在我們要推導 “統計表徵” 模型的分佈, 如果推導出來的分佈在 k = 1 處是有較普松 分佈為高的或然率。 那麼, 我們可以確定; 以此種模型為基礎的通訊協定具有隨機性, 而且有較 高的效能。
為了使數學推導的過程更明瞭, 圖四是用來說明假設。 假設如下:
(1) 有 M 個使用者, n 個時槽, 且 M ≤ n。
(2) 每個使用者平均在 n 個時槽的時間內送出一個資料框。
(3) M 個使用者的隨機數產生器分佈如圖三, 其在某一 “特定點” 出現或然率為 p, 其餘為 r。
(4) 這些 “特定點” 並不重複, 且 p > r。
現今令 Pst(k) 為此一模型的或然率分佈, 而 Pst(k) 可表為:
Pst(k) = u · Pp(k) + (1 − u) · Pr(k)
其中 µ = M/n, Pp(k) 為某一時槽內有對應之高或然率 (p) 時, 出現 k 個資料框的或然 率。 Pr(k) 為某一時槽內沒有對應之高或然率時, 出現 k 個資料框的或然率。
User 2
User User 1
圖四. 統計表徵時槽
Pst(k)
= µ · Pp(k) + (1 − µ) · Pr(k)
= µ · ((1−p) · C(M −1, k) · rk· (1−r)M −K−1+p · C(M −1, k−1) · rK−1· (1−r)M −k +(1 − µ) · C(M, k) · rk· (1 − r)M −k
= µ · (1−p) · (M −1)!
(M−k−1)! · k!· rk· (1−r)M −k−1+p · (M −1)!
(M−k)! · (k−1)! · rk−1· (1−r)M −k
!
+(1 − µ) · M!
(M − k)! · k! · rk· (1 − r)M −k 當 M → ∞, 由 Stirling Formula: n! ≈√
2 · π · n · nn· e−n Pst(k)
= µ · (1−p) ·
q2 · π · (M − 1)
q2 · π · (M−k−1)· (M − 1)M −1
(M−k−1)M −k−1· e−(M −1) e−(M −k−1)· 1
k!· rk· (1−r)M −k−1
+p ·
q2 · π · (M − 1)
q2 · π · (M − k) · (M − 1)M −1
(M − k)M −k · e−(M −1)
e−(M −k) · 1
(k − 1)! · r(k−1)· (1 − r)M −k
!
+(1 − µ) ·
√2 · π · M
q2 · π · (M − k) · MM
(M − k)M −k · e−M e−(M −k) · 1
k!· rk· (1 − r)M −k
= µ · (1 − p) ·
M − 1 M − k − 1
M −k−0.5
· (M − 1)k· rk· e−k
k! · (1 − r)M −k−1 +p ·
M − 1 M − k
M −k−0.5
· (M − 1)k−1· rk−1· e−(k−1)
(k − 1)! · (1 − r)M −k
!
+(1 − µ) ·
M M − k
M −k−0.5
· Mk· rk·e−k
k! · (1 − r)M −k. (3.1) 3.1 式中 r = 1 − p
n − 1, µ = M
n , 則 3.1 式各項可化簡如下:
(1) (M − 1)k· rk =M −1n−1 · (1 − p)k≈Mn · (1 − p)k = (µ · (1 − p))k. (2) (M − 1)k−1· rk−1 = (µ · (1 − p))k−1.
(3) (1 − r)M −k−1=1 − n−11−pM −k−1=1 − n−1M ·1−pM
M −k−1
.
令 M >> k ⇒ M ≈ M − k − 1, 則 (3) ≈1 − µ · 1−pM M ≈ e−µ·(1−p).
(4) (1 − r)M −k ≈ e−µ·(1−p).
(5) M −k−1M −1 M −k−0.5=1 + M −k−1k M −k−0.5≈ ek. (6) M −1M −kM −k+0.5 =1 + M −kk−1 M −k+0.5≈ e(k−1). (7) M −kM M −k+0.5 =1 + M −kk M −k+0.5≈ ek
故 3.1 式可化簡如下:
Pst(k) = µ · (1 − p) · ek· (µ · (1 − p))k· e−k· e−µ·(1−p)· 1 k!
+p · e(k−1)· (µ · (1 − p))k−1· e−(k−1)· e−µ·(1−p)· 1 (k − 1)!
!
+(1 − µ) ·
ek· (µ · (1 − p))k· e−k· e−µ·(1−p)· 1 k!
= 1
k!· (µ · (1 − p))k· e−µ·(1−p)· 1 − µ · p + p 1 − p· k
!
(3.2) 上面 (3.2) 式就是推導出當 M ≤ n 時 “統計表徵” 的分佈公式。 當我們令 p = 1/n 且 n >> 1, 使得 p 趨近於 0 時。 (3.2) 式成為:
Pst(k) = µk
k! · e−µ (3.3)
我們發現: (3.3) 式就是我們在 2節中所推導出的普松分佈。 至此, 我們可確定: (3.2) 式是一個 較普松分佈更為廣義的隨機分佈。
表一 µ = 1
K p = 0.1 0.2 0.3 0.4
0 0.365913 0.359463 0.347610 0.329287 1 0.369978 0.377436 0.392302 0.417097 2 0.184786 0.186921 0.189447 0.190986 3 0.060924 0.059431 0.056371 0.051369 4 0.014943 0.013803 0.011994 0.009681 5 0.002912 0.062515 0.001977 0.001399 6 0.000470 0.000376 0.000265 0.000164 7 0.000065 0.000048 0.000030 0.000016 8 0.000008 0.000005 0.000003 0.000001 9 0.000001 0.000001 0.000000 0.000000
表二 µ = 0.8
K p = 0.1 0.2 0.3 0.4
0 0.447812 0.442926 0.434119 0.420773 1 0.361365 0.367839 0.380197 0.399982 2 0.144110 0.144706 0.144840 0.143518 3 0.037951 0.036630 0.034202 0.030567 4 0.007437 0.006782 0.005791 0.004580 5 0.001158 0.000986 0.000761 0.000527 6 0.000149 0.000118 0.000082 0.000049 7 0.000016 0.000012 0.000007 0.000004 8 0.000002 0.000001 0.000001 0.000000 9 0.000000 0.000000 0.000000 0.000000
3.2. 統計表徵分佈之數值計算
表一、 表二分別為從 (3.2) 式所計算出的數值。 µ = 1 時, Pst(k = 1) > e−1 = P (k = 1)。 µ = 0.8 時, Pst(k = 1) > 0.8 · e−0.8 = P (k = 1)。 由此可見: 以統計表徵 (statistical token) 為通訊協定的系統有較低的碰撞機率。
4. 結論
本文由一種通訊協定的設計而導引出一個新型隨機分佈, 經由數學證明; 此新型隨機分佈 可視為一廣義的普松分佈, 此一新型隨機分佈具有二個控制因素: µ 與 p。 較普松分佈多出一個 p 控制因素, 使此一新型分佈有較好的適應性。
本文並未討論 µ 大於1與更複雜統計表徵產生器 (不均勻隨機數產生器) 的影響, 筆者相 信此一 (類) 新型分佈將對通訊協定 (communication protocol)、 編碼技術 (coding tech- nology)、 訊務工程 (traffic engineering) 等領域具有適用性。
參考文獻
1. S. S. Lam, L. Kleinrock, Packet Switching in a Multiaccess Broadcast Channel :Performance Evaluation, IEEE Transactions on Communication, APRIL 1975.
2. M. D. Vose, A Linear Algorithm for Generating Random Number With a Given Distribution, IEEE Transactions on Software Engineering, Sept. 1991
3. W. Stalling, Local Networks: An Introduction.
—本文作者曾為中華電信研究所副研究員—