• 沒有找到結果。

可能性理論淺介

N/A
N/A
Protected

Academic year: 2022

Share "可能性理論淺介"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)

可能性理論淺介

楊敏生 劉 曼君

模糊理論 (fuzzy theory) 的發展和應 用, 一路行來已是 30 年。 在這 30 年中, 模 糊理論帶給工業界和工程界一番嶄新的氣象, 特別是近年來與神經網路結合, 更展現出一 種革命性的面貌。 由於根據馮紐曼 (J. von Neumann) 原理所設計的電腦在思維及學習 等方面遭遇瓶頸, 神經網路已成為電腦人腦 化的最佳途徑, 特別是與處理自然語言、 知 識表示等的最佳工具 — 模糊理論結合後, Neuro & Fuzzy 將發展成為新一代的電腦 (或許可稱之為第六代電腦)。 模糊集合不僅 跳出了傳統集合的排中律限制, 可將人類思 維和概念之過渡邊界以數學方式表達及運算;

另一方面也擴展了不確定性 (uncertainty) 的現象, 將隨機性所無法表達的另一種稱之 為模糊性 (fuzziness) 的不確定性呈現出來。

隨機性可透過機率測度來衡量, 相對地, 模糊 性卻透過所謂的可能性 (possibility) 測度來 得到, 因此, 可能性理論就成為與機率論平行 前進的另一種處理不確定性的理論。 到底什 麼是可能性? 它和我們所熟悉的機率 (prob- ability) 又有什麼不同呢? 在數學傳播十八 卷一期的 「模糊理論簡介」(參考文獻 [1]) 一 文中曾對模糊理論作了介紹, 在本文中, 我們 將再進一步探討可能性理論。

自從 Wiener 和 Shannon 利用機率統 計的概念發展出通訊理論, 無論是編碼或是

資料的傳輸和接收, 都與機率理論息息相關。

時至今日, 我們不僅要求資料能正確傳輸, 更 希望能解讀其中的涵義, 以將這些資料作更 進一步的利用。 因為許多資料是以自然語言 的方式表示並儲存, 而語言中正有其模糊性 存在, 這可說是模糊理論發展的重要因素之 一。 而所謂的可能性理論是模糊測度的主要 理論, 架構上是以模糊集為基礎; 探其背後思 想, 正與自然語言所傳達的信息有密切關係。

數學中的特徵函數 IA(x) 只有 0 和 1 兩 個值, 當 x ∈ A 時 IA(x) = 1, 當 x 6∈ A 時 IA(x) = 0。 將其一般化之後, IA(x) 擴展 為 [0,1] 區間連續函數 µA(x), 即若 x ∈ X, µA(x) ∈ [0, 1], 函數 µA(x) 就是所謂的隸 屬函數 (membership function)。 通常我們 將一種模糊的概念以隸屬函數來表示, 如: 年 輕、 美麗等, 而隸屬函數值的大小則表示隸屬 程度的不同。 模糊集合的概念最早由扎德 (L.

A. Zadeh) 在 1965 年提出, 原始的想法便是 在處理自然語言 (natural language) 上的 模糊 (不確定) 性, 希望以嚴謹的數學方式 描述模糊的現象。 但為什麼不能以機率來描 述這些不確定性呢? 主要就在於機率測度上

「可加性」(additivity) 的限制, 在自然語意的 表達與處理上是不必要的。 怎麼說呢? 例如, 在語言的表達上, 我們說這個人看起來還蠻 年輕的, 或說這個人是年輕的程度為 0.8, 如

13

(2)

14 數學傳播 203期 民859

此並沒有意味著說他 「不年輕」 甚至 「年老」

的程度是 0.2 的意思。 但如果把 「年輕」 這樣 一個概念用機率來表達的話, 就只能說他 「年 輕」 的 「機率」 是 0.8,「不年輕」 的 「機率」 必 是 0.2 了。 這和一般的語言習慣確實有出入, 可見以機率來表達語言上的模糊性是不恰當 的。

事實上, 機率和可能性都是用來處理不 確定性, 差別在於前者探討的是發生與否的 不確定, 也就是隨機性; 而後者執掌的則是 來自於模糊性的不確定。 什麼是具模糊性的 不確定呢? 就以下面兩種情況來描述。 一是 自然語言中的不確定 (例如: 年輕、 美麗、 熱 等), 另一種是因測量儀器不夠精密而產生的 不精確 (imprecision), 例如, 身高測量值為 170 公分的人, 他 「真正」 的高度可能介於 169.5 到 170.5 公分之間。 這兩種情況都是典 型具模糊性之不確定的類型。 我們可以說, 可 能性測度主要便是處理機率測度所不能測量 的另一部分不確定性。

雖說可能性的本質和機率不同, 但是, 無 可諱言的, 兩者的結構間卻有頗多共通處, 例 如: 隸屬函數不免令人聯想起機率密度函數;

而隸屬程度和機率值同樣介於 0 和 1 之間, 等 等。 下面讓我們來看看機率空間 (Ω, F, P ) 及可能性空間 (Γ, G, π) 的定義。

(1) 機率空間 (Ω, F, P ) Ω: 樣本空間

F: 所有事件所成的集合

P: 機率測度, 必須滿足以下三個性質:

(a) P (∅) = 0, P (Ω) = 1;

(b) 0 ≤ P (A) ≤ 1 其中 A ∈ F ;

(c) 若 A1, A2, . . . ∈ F 且互斥,

S

k=1Ak ∈ F , 則 P

[

k=1

Ak

!

=

X

k=1

P(Ak) (2) 可能性空間 (Γ, G, π)

Γ: 圖訊空間, 和樣本空間 Ω 一樣, 會隨 實驗不同而變動, 例如在處理字元辨識問 題時, Γ 便是所有可能符號所成的集合。

G: Γ 中所有子集所成的集合。

π: 可能性測度, 必須滿足以下兩個性質:

(a) π(∅) = 0, π(Γ) = 1;

(b) 對集合 Aα ∈ G 所成的任意 (有限、

可數或不可數) 集合, π([

α

Aα) = sup

α π(Aα);

由以上機率空間和可能性空間的比較中, 我 們可以發現, 機率測度中最重要的可加性條 件在可能性測度上不見了! 代之而起的是 sup, 限制條件明顯地放寬了。

機率有機率分配, 是經由機率空間透過 隨機變數產生。 相同地, 可能性亦有可能性分 配 (possibility distribution), 它乃是由可 能性空間透過模糊變數而產生。 什麼是模糊 變數 (fuzzy variable) 呢? 依 Zadeh[2]的 觀點, 不妨以 「模糊限制」(fuzzy restriction) 的角度來看。 我們以最簡單的敘述形式 「X 是 F 」 來說明, 並以 「小明是年輕的」 為例。

敘述中, X(如: 小明) 是變數, 在圖訊空間 Γ(如:[0,100], 表年紀) 中取值; F 就是對 X 的模糊限制 (如: 年輕)。 於是, 「X 是 F 」 就 可以轉為 「R(X) = F 」 或 「R(A(X)) =

(3)

可能性理論淺介 15

F 」 的形式, 其中 A(X) 表 X 的屬性; 而 R(X) 和 R(A(X)) 意思相同, 都是對 X 的限制。 可以這麼寫:

「小明是年輕的」→

「R(小明)=年輕」 或 「R(A(小明)) =年輕」

式中 「年紀」 就是小明的屬性,「年輕」 則是模 糊限制; 也就是說, 小明透過 「年紀」 這個 屬性和 「年輕」 這個模糊限制產生關聯。 可 能性空間 (Γ, G, π) 經過特殊的模糊限制 F 後定義出模糊變數 X, X 是一個實值函數, X : Γ → R, 在上例中就是屬性 「年紀」。 如 此便可定義出一個對模糊變數 X 的可能性 分配。 這和由機率空間 (Ω, F, P ) 經過特定 限制 (如: 擲 n 次銅板中出現正面的次數) 而 定義出隨機變數 (random variable)X, 再 由此決定 X 是何種形態之機率分配的概念 是一樣的, 其間的差別只在於可能性空間中 的限制具模糊特性 (如: 年輕), 而機率空間 則否。

那麼, 可能性分配函數 (possibility distribution function) 又是怎麼得到的 呢? 可能性分配函數和可能性測度間有什 麼關係? 回想一下模糊限制 F , 它是一個 模糊集, 那麼必可定義出一個 F 的隸屬函 數 µF(x), 用來描述 F 這個模糊概念。 我們 將可能性分配函數 rX 定義為 µF, 也就是 rX = µF。 為什麼這麼定呢? 我們在上一段 曾說明, 可能性分配是由模糊限制 F 透過模 糊變數 X 而定出來的, 因此, 把 µF 定為 X 的可能性分配函數, 似乎再自然不過了。 而可 能性分配函數和可能性測度間的關係, 就可 寫為 π({x}) = rX(x)。 因此, 我們可以得

到 π({x}) = rX(x) = µF(x) 這樣的關係。

經過這樣一個過程, 對應於 「小明是年輕的」

這個敘述的可能性分配便確定了。

假設 「年輕」 這個模糊集的隸屬函數, 定 義如下:(其中 x 表年齡)

µyoung(x)

=

1, 0 ≤ x ≤ 25

h(1 + (x−255 )2i1 25 < x ≤ 100 那麼, 在指定 「小明是年輕的」 的情況下, 關 於它的可能性分配是如何呢? 由上一段可知, 可能性分配函數 rX = µyoung。 經由計算可 得: 若 x = 20, 則 µyoung(x) = 1; 若 x = 30, 則 µyoung(x) = 0.5; 若 x = 40, 則 µyoung(x) = 0.1。 這樣的結果有什麼意義 呢? 可以這麼說: 如果我們已經知道小明是 年輕的, 那麼小明是 20 歲的 「可能性」 是 1, 也就是說 「20 歲」 和 「年輕」 之間的一致程 度 (compatibility) 是 1; 30 歲的可能性降 到 0.5,40 歲的可能性就更低了, 只剩下 0.1。

年齡愈大, 求算出的可能性值就愈小, 表示愈 大的年紀和年輕這個模糊概念的一致程度愈 低。 這樣的結果十分直觀, 似乎也很合理, 不 是嗎? 在這個例子中, 如果將 「可能性」 三 個字換成 「機率」, 似乎就十分怪異, 這一點 我們可以從兩方面來看。 就觀念上而言, 這個 例子並不是發生與否的問題, 而是一種因語 意上的不明確所產生的問題; 若就定義而言, 可能性和機率不同, 並不具可加性。 所以顯然 此時 「機率」 二字並不恰當, 「可能性」 概念的 引入就變得十分自然了。

(4)

16 數學傳播 203期 民859

下面我們再使用扎德所舉的一個十分生 動且有趣的例子來說明, 也許更能幫助我們 區分機率和可能性之間的差異。

(表一)

u 1 2 3 4 5 6 7 8

rX(u) 1 1 1 1 0.8 0.6 0.4 0.2 PX(u) 0.1 0.8 0.1 0 0 0 0 0

小明以 u 個雞蛋作為早餐, 表一中的 u 值從 1 到 8, PX(u) 表機率, rX(u) 表可能性, 例 如, 小明早餐吃兩個蛋的機率是 0.8, 吃 6 個 的可能性是 0.6。 有時候, 我們可以將可能性 視為一種 「執行上的難易程度」, 值愈大表愈 容易。 那麼, 從表中可知對小明而言, 吃 1 個 蛋到4個蛋都很容易 (此時可能性皆是最大值 1), 然後可能性值隨著蛋個數的增加而遞減, 表示蛋愈多、 吃起來愈不容易, 十分合乎常 理! 到 9 個時可能性為 0, 表示 — 小明根本 不可能吃得下 9 個蛋! 而機率這列顯示出的 訊息就不同了。 我們可以發現小明早餐吃2個 蛋的機率是 0.8, 明顯大於 1 個和 3 個的 0.1, 表示小明 「通常」 以 2 個蛋為早餐, 這也許是 基於健康上的考量或其他因素, 但至少和他 的能力無關。 值得注意的是, 機率仍謹守可加 性, 也就是三個機率值的和為 1。 可能性則無 此限制。

以上的例子, 是否有助於你更進一步了 解可能性呢? 不過, 有一點要說明的是, 上列 可能性所指的 「難易程度」 不一定是指生理上 執行的難易; 有時候, 所謂的難易程度只是一 種象徵性的意義。 從上面的例子, 我們很容易 了解 「對小明而言, 吃 9 個蛋根本是力不能及 的事」; 但是, 在 「若小明年輕, 則他是 30 歲

的可能性為 0.5」 這個例子中, 「30歲」 和 「年 輕」 間的容易程度, 就得看為是 「一致程度」

了。

電腦科技日新月異, 使各種應用科學得 以憑藉它建立更複雜的模型, 處理更龐大繁 複的資料。 這些資料常囿於儀器設備或人為 因素而顯得不夠完整, 無法以精確的形態表 之, 另方面也因為系統日趨龐大, 分析日漸 複雜, 可能性理論由是應運而生, 且恰如其份 地在這股潮流中扮演舉足輕重的腳色。 本文 從自然語言的模糊性這個觀點切入, 說明可 能性的重要; 再將其和大家所熟知的機率相 比較, 使讀者能體會兩者間的差異, 並舉例 說明。 的確, 從圖形分類、 控制過程到決策 分析、 專家系統中不確定性的管理, 無論在 理念或實務上, 可能性理論在在顯示出其必 要性。 進一步關於可能性理論的了解, 可參考 [3]、[4]、[5]、[6]。

參考文獻

1. 楊敏生, 模糊理論簡介, 數學傳播,Vol.18(1), 7-11,833月。

2. L. A. Zadeh, Fuzzy sets as a basis for a the- ory of possibility, Fuzzy Sets and Systems 1, 3-28(1978).

3. M. L. Puri and D. Ralescu, Fuzzy random variable, J. of Math. Analysis and Appli- cations 114, 409-422(1986).

4. D. Dubois and H. Prade, Possibility The- ory, Plenum Press, New York (1988).

5 G. J. Klir and B. Parviz, Probability- possibility transformations: a comparison, Int. J. of General Systems 21(3), 291- 310(1992).

5. R. R. Yager, On the completion of qualita- tive possibility measures, IEEE Trans. on Fuzzy Systems 3,184-194(1993).

—本文作者分別任教和畢業於中原大學數學 研究所

參考文獻

相關文件

33.不同於雙因子理論與期望理論(VIE 理論) ,在波特‧勞勒模式中才明確的表達出工作滿意與績效

自從扎德 (L.A. Zadeh) 教授於 1965 年提出模糊集合 (Fuzzy Sets)(參考文獻 [1]) 至今已近 30 年了。 從模糊理論發展初期 所受到的冷嘲熱諷、 排斥、 辯解等, 直到今日 的開花結果, 雖是短短 30

你實際的工作 不斷交相作用 專精理論架構

除此之外, Kaluza 對大自然的理論模型做出非常重要的貢獻 (Klein 後來參與研究, 該 理論現稱 Kaluza-Klein 理論)。 Kaluza 是一位數學家。 他在平坦的 Minkowski 四維時空上

Polya 所說的“理論上的目的”, 是指對 「啟 發法」 研究的 (一般) 模式介紹及解題心理 程序的討論。 所謂啟發法, 對 Polya 而言, 是研究 「發現」 和 「發明」 的方法和規則, 是

1964 年, 在美國奧斯丁的德克薩斯大學工作時, 彭羅斯開始提出一種觀點, 即應用扭量理 論來研究量子引力。 他在牛津大學工作時, 繼續發展了這一觀點, 他認為四維時空可以完美應 用四維複幾何理論。

但保有原來工業區風味。在 1989 年,一個規模龐大的魯爾區更新計劃開始,十. 年間完成了 120 個工業更新案和

目前數學家所採用的集合論稱為 ZFC 集合論, 這是基於 Zermelo 和 Fraenkel 在 20 世紀初發展出來的 ZF 集合論, 再加上 C 所代表「選擇公設」(axiom of