『DNA序列』的統計分析及字串分佈圖象
國立中興大學物理學研究所 碩士論文
研究生:潘佳穎
指導教授:李秉政
中華民國八十七年七月
對於一個類似DNA序列的數據,我們首先需要將其以各 種方式呈現我們眼前,好能進一步地去分析它們,並且 把有用的統計特徵歸納整理出來,以便尋求生物學上可 能的解釋。
(A).
第一種方式是我們可以用不同的字串長度來作測 量,並且藉以計算
i i
i p
p H
n
ln
4
∑
1=
−
=
Shannon entropy⎟⎟⎠
⎜⎜ ⎞
⎝
⎛
= −
∑
=
n
i
q i
q p
H q
4
1
1 ln
1 Generalized entropy Rényi entropy
其中 n 為字串的長度
如果機率是平均的則
Shannon entropy4
max nln H
H = =
(B).