• 沒有找到結果。

计算未知或贝叶斯定律

在文檔中 中译本序 (頁 105-113)

计算未知或贝叶斯定律

我们应该为避开思维黑洞而设计路线图了。我们也许并不完 全了解这些思维黑洞,即使是专家在他自己的研究中也如此,但 是如果他们一旦知道某种思维置词,就知道得很详细。现在正是 我们对这张路线图进行概略研究的时候。大比例地图 在工程

以前面在统计学

师和建筑师的画板上见到的那种图表 、决策 论和认知科学中提到过的形式存在。到目前为止,这些路线图只 存在于几个专家的特殊领域,因此没有在公共图书馆出现。如果 我们想让情况有所变化,如果我们想让身边的人们避免这些思维 黑洞,那么现在就是我们用最简单的形式表明这些问题让外行接 受的时候了。

我们经常提到贝叶斯定律,现在更是描述它的时候,至少我 们应该给 它一个简要的 形式。人类知道 如何数数,如 何测量距 离,以及如何精确地称货物的重量已经有几个世纪了,但是直到 世纪我们才解开了下列谜团,即如何从已知数据中计算出未知 的概率;如何在过去精确的数据基础之上预测未来等等。这些谜 团自有人类以来,一直都让人们困惑难安。前面的章节虽然没有 解答这些问题,但是肯定地证明了:以人类正常的直觉为基础是 解决不了这种问题的。实际上,为了获得成功我们不得不推翻这 些直觉。

在这种情况下,贝叶斯定律(我们一会儿就会看到,它只是 一个非常简单的公式)确实是关于人类思维的重要发现之一。现 在,它不仅出现在统计学的所有论文之中,也出现在百科全书以 及归纳逻辑的手册中。本书旨在为读者朋友们提供此定律的直观

第 90 页

概念,并且告诉大家,这个定律是如何运用它的简单原理把我们 从天生的可能性推理黑洞中解放出来的。

在日常生 活中,我们经常需 要依靠一些不完全 的信息做决 定,当然我们就不得不去获得更多的数据以纠正或肯定我们做出 的决定。有这样一个典型例子:当我们要对将来会发生的一些事 情做出合理的预测时,必须去收集有关最可能出现的结果的一切 信息。对于这个过程的研究最常用的方法是某科学家首先提出一 个假设,然后用这个假设去测验他的理论,最后决定他的试验在 多大程度上证明或者否证了他的理论。他的任务就是要根据我们 所知,准确地计算一个理论或一个假设的正确率,而不仅仅是猜 测这个理论或假设可能。

这个测试直接适用于医生这个行业,在诊断过程中使用这个 测验可以帮助他取得更准确的诊断结果。它也很容易被企业总经 理接受,因为这些人总是要面对不停的决策,不停地搜集那些能 使他们的决策更加合理的更进一 步的信息(如来自于市场研究 的、工作考察的,以及来自于股票市场的信息等)。正如我们所 知这种合理的决策也应该被扩展到法庭。

为了帮助读者弄明白贝叶斯定律,在这里讲几个例子:

[ 例 医疗诊断。某病被诊断出的概率为 ,无该病误诊

,如果某地区患

有该病的概率为 该病的概率为 ,现在 随机选该区一人,诊断患有该病,求该人确实患有该病的概率。

表示“该人患有该病”

该 , 表 示 “ 该 人 诊 断 患 有 该 表示“患有该病的人被

病” ,则 诊断有该病(呈阳性)”,

表示“不患有病的人被诊断患有该病(呈阳性)”, 表示

“ 被 诊 断 患 有 该 病( 呈 阳 性 )确 实 患 有 该 病 ”。 可以计算:

第 91 页

即,从该区随机抽选一人,诊断患有该病(检验呈阳性),该 人确实患有该病的概率为

质量检验。三台

[例 自动的机器生产同样的元件,机器

生产总数的 ,机 器 机器 。平均来讲,

机器 生产的部件有 不合格,对于机器 相应为 。如果从联合生产的产品中随机抽取一个元件,发现为 不合格,则它是由机器 生产出来的概率是多少?你怎样判断该 元件是由哪台机器生产的 ?

设 分别表示“由机器 生产的元件”,

表示“不合格”。则

即 :该 不 合 格 元 件 是由 机 器 生产的概率为 。 同 理 可 知 是 由 机 器 生产的 概率 分别 为 。 由 于 明显大于 。所以,有足够大( )的 把握认为该不合格元件由机器 生 产 。

信 号 识 别

[例 。 发 别台 分 别 以 概 率 发 出 信 号

。由于通信系统受到干扰,当发出信

”和 号“ ” 时 ,

收报 台 分别 以 收 到信 号 “ ” 和 “ ,当发出信号 时 , 收 报台 分 别 以 概 率 收 到 信 号 “ ” 和

”的概率。

,发出信号

,求收到信号“ 出是“

设 分别表示发出信号“ ”和收到信号“ ,则

可以计算:

第 92 页

即 当 收到 信 号 “ ”时发出信号是“ ”的概率为 从这几个例子中可以看到:

“患 有该病” 和 “不 患该病” 是不相容 的 ;而 且 ,把这 两种 可能加到一起,就是事情的全部。见[例

“ 由 机 器 生 产 的 ” 、 “ 由 机 器 生 产 的 ” 和 “ 由 机 器 生产的”是两两不相容的,而且 ,把这三种可能加到一起,就是 事情的全部。 见[ 例

是 不 相

“发出 的信 号是 ”和“发出的信号是 容 的 ; 而 且,把这两种可能加到一起,就是事情的全部。 见[ 例

再对两个重要概念加以解释:

先验概率。事先知道的信息,或者试验之前的信息称为先验 概率。例 中 “某地区患该病的概率比例”,例 中“机器

分别生产元件的比例”和例 中“发出信号 的 比 例 ” 都是先验概率。

后验概率。事后或试验后对原来问题的新认识 ,属于后验概 率。例 中“被诊断为患该病确实患该病”的概率,例 “ 不 合格元件是机器 生产”的概率,都是后验概率。

现在该给出贝叶斯公式的一个完整形式了:

贝叶斯公式

)为一概率空间

:样本空间。

是 某些子集构成的集类 ,满足 代数条件,称为 事件域。

:是定义于 上的实值集函数 ,满足非空、规范 、可列可 加性 ,称为概率。

… 均 为 事 件 , 即

,且 … , 两 两 相 斥, 即 对

…,

第 93 页

构成 的 一 个 分( 分 割 )

, ,

其中, )表 发生的概率。

)表 发生的条件下, 发生的条件概率。

)乘法公式,由条件概率定义即得。

全概率公式,由概率性质即得。

从而

再 以[例 为例说明公式中的术语, 为三个 事件,构成全集,即

为先验概率。已知 以后计算得到的 为后验概率,即已知该元件为不合格

生产的概率

的情况下,分别由机器 。先验概率分别为

, ,

有了这样 的工具,该怎 样使用它呢 ?现在就来讲 贝叶斯程 序。

贝叶斯程序的基本原理是:

在做决定和收集进一步的信息之前,存在一系列可供选择

第 94 页

第 95 页

洁性就成了科学和艺术的高度智慧的混合物。在个别事件中,在 公式中插入合适的成分或数字是困难的。就其本质而言,在“古 老的”或者先验概率中的一个错误,就意味着这个定律的机器苦 心做出的数字(或者“答案”)是完全没有意义的。在给定的部 门,如医学等专门系统中,“基本”概率的正确计算,需要多年 的研究和成千上万种类似的情况和测试积累起来的经验,而且要 十分耐心地分析每一种情况和测试。

严重的问题是没有一个人自发地服从贝叶斯理论。我们的思 维黑洞证明:即使当我们认为自己正以一种合理的、有意识的方 式决定事情,或者在测试前后考虑直觉计算出的概率范围时,我 们也并不是服从贝叶斯。典型的例子就是诊断测试和陪审员测试

( 见 第 章,黑洞 。当然,这就意味着当我们做决定时,应该 学会有意识地想起贝叶斯定律。

第 96 页

第 97 页

在文檔中 中译本序 (頁 105-113)