• 沒有找到結果。

普松分佈的推廣

N/A
N/A
Protected

Academic year: 2022

Share "普松分佈的推廣"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

普松分佈的推廣

Generalization of Poisson Distribution

楊效適

摘要. “統計表徵” (statistical token) 是一個由 “統計表徵產生器” (statistical token generator) 所產生的隨機數。 所謂的 “統計表徵產生器” 是一個不均勻 (non- uniform) 的隨機數產生器。 當使用者以統計表徵作為通訊系統擷取頻道 (channel access) 之依據時, 此系統具有隨機性, 而且發生 “碰撞” (collision) 的或然率較低,

“統計表徵產生器” 具有可調變的特性, 可產生出不同的統計表徵分佈, 當我們以或 然率理論推導統計表徵分佈時, 我們可發現一個較普松分佈廣義的新分佈。

Abstract: Statistical token is a random number generated from statistical token generator which is a non-uniform random number generator, when users use the statistical token as the medium access control technology of communication system, a contention protocol with lower collision rate than CSMA/CD protocol can be built.

By using probability theory, a very concise formula was derived to de- scribe the distribution of statistical token model.

1. 緒言

競爭型通訊協定 (contention protocol) 是一種數據通訊 (data communication) 系統 常使用的通訊協定。 由於數據通訊中的資料流 (data flow) 具有隨機性, 使得適用於隨機性資料 流的競爭型通訊協定廣泛被採用。 分析數據通訊系統與競爭型通訊協定常使用或然率理論。 經 過多年的分析與研究, 對於一些較初始 (primary) 競爭型通訊協定可以傳統隨機分佈 (普松分 佈) 描述。

開發較優良的競爭型通訊協定是通訊系統研究項目之一, 相對於一種新通訊協定的提出, 新隨機模型也應建立。 如此方能對於新通訊協定有深入的了解。 本文提出一種新競爭型通訊協

17

(2)

定與其對應的隨機分佈。 新競爭型通訊協定較初始競爭型通訊協定有更多的控制因素, 其對應 的隨機分佈也較普松分佈更為廣義。

2. ALOHA 通訊協定

ALOHA 通訊協定是美國夏威夷大學所發展出來的一種競爭型通訊協定。 也是最早的一 種競爭型通訊協定 (1970年代)。 其架構也成為後來以太網路 (Ethernet) 的基本架構。

所謂 ALOHA 通訊協定是指: 通訊頻道區分為固定長度的時槽 (time slot), 同時資料框 的長度也固定。 每個時槽的長度足以正確的傳輸此一資料框, 同時使用者必需在時槽的起點開 始傳送, 不得任意傳送 (參考圖一)。

圖一. ALOHA 通訊協定

現假設有 M 個使用者, 且每個使用者平均在 n 個時槽的時間內送出一個資料框。

為了模擬 ALOHA 通訊協定, 我們可假設每個使用者有一範圍為 (0, n − 1) 且平均分佈 的隨機數產生器, 其產生之隨機數 i (出現機率 = p), 即代表這個使用者在時槽 i 送出資料框。

我們現在想知道; 在某一時槽內有 k 個使用者送出資料框或然率 P0(k)。 從上面的假設我 們可看出 P0(k) 就是一個二項式分佈:

P0(k) = C(M, k) · pk· (1 − p)M −k (2.1) P (k) =µk

k! · e−µ (2.2)

當 M → ∞, Mp = M/n = µ 時, P0(k) 近似於 P (k)。

(3)

其中 K ≥ 2是表示: 同一時槽內有二個或二個以上的使用者送出資料框而發生碰撞。

而 K = 0 是表示: 此一時槽沒有任何使用者送出資料框。 我們最感興趣的是 K = 1 的 情況, 此一情況表示: 資料框成功的送出, 而 K = 1 的或然率 (或百分比), 就是此一通道的效 能 (throughput)。

3. 統計表徵 (statistical token)

上一節中對於 ALOHA 通訊協定的分析所使用的模型: 每個使用者有一個均勻的隨機數 產生器。 每個使用者依照所得到的隨機數做為送出資料框的時槽指標 (time slot index)。 這個 隨機數產生器決定了這個模型的隨機性, 同時也決定了此一模型 (或通訊協定) 效能的極限: 普 松分佈。

當我們設想此一模型內可以改變的因素時, 我們很直覺的就可發現: 均勻的隨機數產生 器是一個可改變的因素。 而此一因素有可能導致此一模型分佈的改變。

我們將每個使用者的隨機數產生器調整成一種不均勻的分佈, 而且每個使用者的隨機數產 生器在某一特定的出現或然率較高。 如在圖二中出現 i 的或然率為 p, 其餘各點的或然率為 r, 且 p 大於 r。

1 2 3 4

0

圖二. 不均勻隨機數產生器

現在假設有 n 個使用者, 其代號 id 介於 0 與 n − 1 之間。 而其隨機數產生器出現 p 點 的位置與其代號 id 相同。 當此一模型成立時, 我們可發現: 每個使用者所得到的隨機數 i 並不 是平均分佈在 0 與 n − 1 的範圍中, 而是較集中於自己的代號 id 的一種分佈 (如圖三)。

(4)

User A User B User C

圖三. 統計表徵分佈圖

3.1. 統計表徵模型的分佈

現在我們要推導 “統計表徵” 模型的分佈, 如果推導出來的分佈在 k = 1 處是有較普松 分佈為高的或然率。 那麼, 我們可以確定; 以此種模型為基礎的通訊協定具有隨機性, 而且有較 高的效能。

為了使數學推導的過程更明瞭, 圖四是用來說明假設。 假設如下:

(1) 有 M 個使用者, n 個時槽, 且 M ≤ n。

(2) 每個使用者平均在 n 個時槽的時間內送出一個資料框。

(3) M 個使用者的隨機數產生器分佈如圖三, 其在某一 “特定點” 出現或然率為 p, 其餘為 r。

(4) 這些 “特定點” 並不重複, 且 p > r。

現今令 Pst(k) 為此一模型的或然率分佈, 而 Pst(k) 可表為:

Pst(k) = u · Pp(k) + (1 − u) · Pr(k)

其中 µ = M/n, Pp(k) 為某一時槽內有對應之高或然率 (p) 時, 出現 k 個資料框的或然 率。 Pr(k) 為某一時槽內沒有對應之高或然率時, 出現 k 個資料框的或然率。

User 2

User User 1

圖四. 統計表徵時槽

(5)

Pst(k)

= µ · Pp(k) + (1 − µ) · Pr(k)

= µ · ((1−p) · C(M −1, k) · rk· (1−r)M −K−1+p · C(M −1, k−1) · rK−1· (1−r)M −k +(1 − µ) · C(M, k) · rk· (1 − r)M −k

= µ · (1−p) · (M −1)!

(M−k−1)! · k!· rk· (1−r)M −k−1+p · (M −1)!

(M−k)! · (k−1)! · rk−1· (1−r)M −k

!

+(1 − µ) · M!

(M − k)! · k! · rk· (1 − r)M −k 當 M → ∞, 由 Stirling Formula: n! ≈√

2 · π · n · nn· e−n Pst(k)

= µ · (1−p) ·

q2 · π · (M − 1)

q2 · π · (M−k−1)· (M − 1)M −1

(M−k−1)M −k−1· e−(M −1) e−(M −k−1)· 1

k!· rk· (1−r)M −k−1

+p ·

q2 · π · (M − 1)

q2 · π · (M − k) · (M − 1)M −1

(M − k)M −k · e−(M −1)

e−(M −k) · 1

(k − 1)! · r(k−1)· (1 − r)M −k

!

+(1 − µ) ·

√2 · π · M

q2 · π · (M − k) · MM

(M − k)M −k · e−M e−(M −k) · 1

k!· rk· (1 − r)M −k

= µ · (1 − p) ·

 M − 1 M − k − 1

M −k−0.5

· (M − 1)k· rk· e−k

k! · (1 − r)M −k−1 +p ·

M − 1 M − k

M −k−0.5

· (M − 1)k−1· rk−1· e−(k−1)

(k − 1)! · (1 − r)M −k

!

+(1 − µ) ·

 M M − k

M −k−0.5

· Mk· rk·e−k

k! · (1 − r)M −k. (3.1) 3.1 式中 r = 1 − p

n − 1, µ = M

n , 則 3.1 式各項可化簡如下:

(1) (M − 1)k· rk =M −1n−1 · (1 − p)kMn · (1 − p)k = (µ · (1 − p))k. (2) (M − 1)k−1· rk−1 = (µ · (1 − p))k−1.

(3) (1 − r)M −k−1=1 − n−11−pM −k−1=1 − n−1M ·1−pM

M −k−1

.

令 M >> k ⇒ M ≈ M − k − 1, 則 (3) ≈1 − µ · 1−pM M ≈ e−µ·(1−p).

(6)

(4) (1 − r)M −k ≈ e−µ·(1−p).

(5) M −k−1M −1 M −k−0.5=1 + M −k−1k M −k−0.5≈ ek. (6) M −1M −kM −k+0.5 =1 + M −kk−1 M −k+0.5≈ e(k−1). (7) M −kM M −k+0.5 =1 + M −kk M −k+0.5≈ ek

故 3.1 式可化簡如下:

Pst(k) = µ · (1 − p) · ek· (µ · (1 − p))k· e−k· e−µ·(1−p)· 1 k!

+p · e(k−1)· (µ · (1 − p))k−1· e−(k−1)· e−µ·(1−p)· 1 (k − 1)!

!

+(1 − µ) ·



ek· (µ · (1 − p))k· e−k· e−µ·(1−p)· 1 k!



= 1

k!· (µ · (1 − p))k· e−µ·(1−p)· 1 − µ · p + p 1 − p· k

!

(3.2) 上面 (3.2) 式就是推導出當 M ≤ n 時 “統計表徵” 的分佈公式。 當我們令 p = 1/n 且 n >> 1, 使得 p 趨近於 0 時。 (3.2) 式成為:

Pst(k) = µk

k! · e−µ (3.3)

我們發現: (3.3) 式就是我們在 2節中所推導出的普松分佈。 至此, 我們可確定: (3.2) 式是一個 較普松分佈更為廣義的隨機分佈。

表一 µ = 1

K p = 0.1 0.2 0.3 0.4

0 0.365913 0.359463 0.347610 0.329287 1 0.369978 0.377436 0.392302 0.417097 2 0.184786 0.186921 0.189447 0.190986 3 0.060924 0.059431 0.056371 0.051369 4 0.014943 0.013803 0.011994 0.009681 5 0.002912 0.062515 0.001977 0.001399 6 0.000470 0.000376 0.000265 0.000164 7 0.000065 0.000048 0.000030 0.000016 8 0.000008 0.000005 0.000003 0.000001 9 0.000001 0.000001 0.000000 0.000000

表二 µ = 0.8

K p = 0.1 0.2 0.3 0.4

0 0.447812 0.442926 0.434119 0.420773 1 0.361365 0.367839 0.380197 0.399982 2 0.144110 0.144706 0.144840 0.143518 3 0.037951 0.036630 0.034202 0.030567 4 0.007437 0.006782 0.005791 0.004580 5 0.001158 0.000986 0.000761 0.000527 6 0.000149 0.000118 0.000082 0.000049 7 0.000016 0.000012 0.000007 0.000004 8 0.000002 0.000001 0.000001 0.000000 9 0.000000 0.000000 0.000000 0.000000

(7)

3.2. 統計表徵分佈之數值計算

表一、 表二分別為從 (3.2) 式所計算出的數值。 µ = 1 時, Pst(k = 1) > e−1 = P (k = 1)。 µ = 0.8 時, Pst(k = 1) > 0.8 · e−0.8 = P (k = 1)。 由此可見: 以統計表徵 (statistical token) 為通訊協定的系統有較低的碰撞機率。

4. 結論

本文由一種通訊協定的設計而導引出一個新型隨機分佈, 經由數學證明; 此新型隨機分佈 可視為一廣義的普松分佈, 此一新型隨機分佈具有二個控制因素: µ 與 p。 較普松分佈多出一個 p 控制因素, 使此一新型分佈有較好的適應性。

本文並未討論 µ 大於1與更複雜統計表徵產生器 (不均勻隨機數產生器) 的影響, 筆者相 信此一 (類) 新型分佈將對通訊協定 (communication protocol)、 編碼技術 (coding tech- nology)、 訊務工程 (traffic engineering) 等領域具有適用性。

參考文獻

1. S. S. Lam, L. Kleinrock, Packet Switching in a Multiaccess Broadcast Channel :Performance Evaluation, IEEE Transactions on Communication, APRIL 1975.

2. M. D. Vose, A Linear Algorithm for Generating Random Number With a Given Distribution, IEEE Transactions on Software Engineering, Sept. 1991

3. W. Stalling, Local Networks: An Introduction.

—本文作者曾為中華電信研究所副研究員—

參考文獻

相關文件

• Many statistical procedures are based on sta- tistical models which specify under which conditions the data are generated.... – Consider a new model of automobile which is

As an example of a situation where the mgf technique fails, consider sampling from a Cauchy distribution.. Thus, the sum of two independent Cauchy random variables is again a

(18%) Determine whether the given series converges or diverges... For what values of x does the series

The random vector (X, Y ) defined above is called a discrete random vector because it has only a countable (in this case, finite) number of possible values.. The probabilities of

D) radioactive cleavage E) radioactive merge Answer: B.. 5) The chart below shows the mass of a decaying nuclide versus time.. 47) The following is part of a

Population: the form of the distribution is assumed known, but the parameter(s) which determines the distribution is unknown.. Sample: Draw a set of random sample from the

The number of visitors to a travel fair is 230 000 when corrected to the nearest ten thousand. Which of the following numbers cannot be the actual number

The 2010/11 Statistical Project Competition (SPC) for Secondary School Students, which is organised by the Hong Kong Statistical Society, co-organised by the