计算未知或贝叶斯定律
我们应该为避开思维黑洞而设计路线图了。我们也许并不完 全了解这些思维黑洞,即使是专家在他自己的研究中也如此,但 是如果他们一旦知道某种思维置词,就知道得很详细。现在正是 我们对这张路线图进行概略研究的时候。大比例地图 在工程
以前面在统计学
师和建筑师的画板上见到的那种图表 、决策 论和认知科学中提到过的形式存在。到目前为止,这些路线图只 存在于几个专家的特殊领域,因此没有在公共图书馆出现。如果 我们想让情况有所变化,如果我们想让身边的人们避免这些思维 黑洞,那么现在就是我们用最简单的形式表明这些问题让外行接 受的时候了。
我们经常提到贝叶斯定律,现在更是描述它的时候,至少我 们应该给 它一个简要的 形式。人类知道 如何数数,如 何测量距 离,以及如何精确地称货物的重量已经有几个世纪了,但是直到 世纪我们才解开了下列谜团,即如何从已知数据中计算出未知 的概率;如何在过去精确的数据基础之上预测未来等等。这些谜 团自有人类以来,一直都让人们困惑难安。前面的章节虽然没有 解答这些问题,但是肯定地证明了:以人类正常的直觉为基础是 解决不了这种问题的。实际上,为了获得成功我们不得不推翻这 些直觉。
在这种情况下,贝叶斯定律(我们一会儿就会看到,它只是 一个非常简单的公式)确实是关于人类思维的重要发现之一。现 在,它不仅出现在统计学的所有论文之中,也出现在百科全书以 及归纳逻辑的手册中。本书旨在为读者朋友们提供此定律的直观
章
第 90 页
概念,并且告诉大家,这个定律是如何运用它的简单原理把我们 从天生的可能性推理黑洞中解放出来的。
在日常生 活中,我们经常需 要依靠一些不完全 的信息做决 定,当然我们就不得不去获得更多的数据以纠正或肯定我们做出 的决定。有这样一个典型例子:当我们要对将来会发生的一些事 情做出合理的预测时,必须去收集有关最可能出现的结果的一切 信息。对于这个过程的研究最常用的方法是某科学家首先提出一 个假设,然后用这个假设去测验他的理论,最后决定他的试验在 多大程度上证明或者否证了他的理论。他的任务就是要根据我们 所知,准确地计算一个理论或一个假设的正确率,而不仅仅是猜 测这个理论或假设可能。
这个测试直接适用于医生这个行业,在诊断过程中使用这个 测验可以帮助他取得更准确的诊断结果。它也很容易被企业总经 理接受,因为这些人总是要面对不停的决策,不停地搜集那些能 使他们的决策更加合理的更进一 步的信息(如来自于市场研究 的、工作考察的,以及来自于股票市场的信息等)。正如我们所 知这种合理的决策也应该被扩展到法庭。
为了帮助读者弄明白贝叶斯定律,在这里讲几个例子:
[ 例 医疗诊断。某病被诊断出的概率为 ,无该病误诊
,如果某地区患
有该病的概率为 该病的概率为 ,现在 随机选该区一人,诊断患有该病,求该人确实患有该病的概率。
表示“该人患有该病”
该 , 表 示 “ 该 人 诊 断 患 有 该 表示“患有该病的人被
病” ,则 诊断有该病(呈阳性)”,
表示“不患有病的人被诊断患有该病(呈阳性)”, 表示
“ 被 诊 断 患 有 该 病( 呈 阳 性 )确 实 患 有 该 病 ”。 可以计算:
第 91 页
即,从该区随机抽选一人,诊断患有该病(检验呈阳性),该 人确实患有该病的概率为
质量检验。三台
[例 自动的机器生产同样的元件,机器
为 , 为
生产总数的 ,机 器 机器 。平均来讲,
机器 生产的部件有 不合格,对于机器 和 相应为 和 。如果从联合生产的产品中随机抽取一个元件,发现为 不合格,则它是由机器 生产出来的概率是多少?你怎样判断该 元件是由哪台机器生产的 ?
设 分别表示“由机器 生产的元件”,
表示“不合格”。则
即 :该 不 合 格 元 件 是由 机 器 生产的概率为 。 同 理 可 知 是 由 机 器 生产的 概率 分别 为 。 由 于 明显大于 。所以,有足够大( )的 把握认为该不合格元件由机器 生 产 。
信 号 识 别 和
[例 。 发 别台 分 别 以 概 率 发 出 信 号
。由于通信系统受到干扰,当发出信
”和 号“ ” 时 ,
收报 台 分别 以 和 收 到信 号 “ ” 和 “ ,当发出信号 时 , 收 报台 分 别 以 概 率 和 收 到 信 号 “ ” 和
”的概率。
,发出信号
,求收到信号“ 出是“
设 分别表示发出信号“ ”和收到信号“ ,则
( ) )
)
)
可以计算:
第 92 页
即 当 收到 信 号 “ ”时发出信号是“ ”的概率为 从这几个例子中可以看到:
“患 有该病” 和 “不 患该病” 是不相容 的 ;而 且 ,把这 两种 可能加到一起,就是事情的全部。见[例
“ 由 机 器 生 产 的 ” 、 “ 由 机 器 生 产 的 ” 和 “ 由 机 器 生产的”是两两不相容的,而且 ,把这三种可能加到一起,就是 事情的全部。 见[ 例
是 不 相
“发出 的信 号是 ”和“发出的信号是 容 的 ; 而 且,把这两种可能加到一起,就是事情的全部。 见[ 例
再对两个重要概念加以解释:
先验概率。事先知道的信息,或者试验之前的信息称为先验 概率。例 中 “某地区患该病的概率比例”,例 中“机器
分别生产元件的比例”和例 中“发出信号 的 比 例 ” 都是先验概率。
后验概率。事后或试验后对原来问题的新认识 ,属于后验概 率。例 中“被诊断为患该病确实患该病”的概率,例 中“ 不 合格元件是机器 生产”的概率,都是后验概率。
现在该给出贝叶斯公式的一个完整形式了:
贝叶斯公式
)为一概率空间
:样本空间。
的
是 某些子集构成的集类 ,满足 代数条件,称为 事件域。
:是定义于 上的实值集函数 ,满足非空、规范 、可列可 加性 ,称为概率。
… 均 为 事 件 , 即
,且 … , 两 两 相 斥, 即 对
…,
第 93 页
构成 的 一 个 分( 分 割 )
, ,
则
其中, )表 发生的概率。
)表 发生的条件下, 发生的条件概率。
)乘法公式,由条件概率定义即得。
而
全概率公式,由概率性质即得。
从而
再 以[例 为例说明公式中的术语, 为三个 事件,构成全集,即
为先验概率。已知 以后计算得到的 为后验概率,即已知该元件为不合格
生产的概率
的情况下,分别由机器 。先验概率分别为
, ,
有了这样 的工具,该怎 样使用它呢 ?现在就来讲 贝叶斯程 序。
贝叶斯程序的基本原理是:
在做决定和收集进一步的信息之前,存在一系列可供选择
。
第 94 页
第 95 页
洁性就成了科学和艺术的高度智慧的混合物。在个别事件中,在 公式中插入合适的成分或数字是困难的。就其本质而言,在“古 老的”或者先验概率中的一个错误,就意味着这个定律的机器苦 心做出的数字(或者“答案”)是完全没有意义的。在给定的部 门,如医学等专门系统中,“基本”概率的正确计算,需要多年 的研究和成千上万种类似的情况和测试积累起来的经验,而且要 十分耐心地分析每一种情况和测试。
严重的问题是没有一个人自发地服从贝叶斯理论。我们的思 维黑洞证明:即使当我们认为自己正以一种合理的、有意识的方 式决定事情,或者在测试前后考虑直觉计算出的概率范围时,我 们也并不是服从贝叶斯。典型的例子就是诊断测试和陪审员测试
( 见 第 章,黑洞 。当然,这就意味着当我们做决定时,应该 学会有意识地想起贝叶斯定律。
第 96 页
第 97 页