伯努利试验及大数定律
作者 | [美国] 威廉·邓纳姆
翻译 |苏枫
来源 |摘自《数学里的那些事:伟大的问题和非凡的人》,人民邮电出版社,2022年3月。【趣味数学】经许可转载,谢谢!
首先,伯努利的审判并不是佛罗伦萨的法律程序,而是初等概率论的基础,它对我们理解不确定世界发挥着重要作用。
伯努利试验是一个有两个结果的简单实验。其结果是成功或失败、黑或白、开或关。没有中间立场,没有妥协的余地,没有优柔寡断的余地。
这样的例子太多了。我们看从一副牌中取出的一张牌。它是黑色或红色。我们生下一个婴儿,无论是女孩还是男孩。我们经历一天24小时,要么遇到流星,要么不遇到流星。在每种情况下,将一个结果指定为“成功”,将另一个结果指定为“失败”是很方便的。比如捡到黑卡、生下女儿、没有遇到流星,都可以标记为成功。不过,从概率的角度来看,选择红牌、儿子、或者遭遇流星作为成功,并没有什么区别。在这种情况下,成功这个词没有任何价值导向的含义。
一次伯努利试验没有多大意义。然而,当我们一遍又一遍地运行伯努利试验并查看这些试验中有多少是成功的、有多少是失败时,事情开始变得有意义,并且累积记录包含许多可能非常有用的信息。
我们做实验的时候,有一个关键的条件:这些重复的实验必须是相互独立的。 “独立”一词不仅有技术定义,而且还传达了适合我们目的的含义:如果一个事件的结果不影响另一个事件的结果,则两个事件是独立的。例如,史密斯生下儿子和约翰逊生下女儿是两个独立事件。再比如,抛一毛钱和抛一分钱的结果(正面或反面)也是相互独立的。一枚硬币的结果不会影响另一枚硬币的结果。
然而,如果我们研究一副牌中的两张牌,一次只抽一张,并认为黑牌是成功的,那么当在第一张牌之后抽出第二张牌时,独立性就会丧失。 。这是因为,如果第一张牌是梅花 A(成功),那么它将影响第二次抽牌的结果 - 它使得第二次抽出黑牌的可能性较小,而第二次抽出 A 的可能性也较小。性别也减少了,绝对不可能还抽到梅花A。
幸运的是,这种独立性的缺乏可以通过一个简单的对策来弥补。抽完第一张牌后kaiyun.ccm,将其放回原来的牌堆中,重新洗牌,然后再次抽牌。因为我们的第一张牌已重新混合到原始牌组中,所以它的身份不再影响第二次抽牌。从这个意义上说,独立事件需要为每次试验创建一个无痕平台,以便每次试验成功的概率保持相同。
伯努利试验最生动的例子发生在赌博游戏中,例如掷硬币或骰子。对于一枚硬币来说,每次抛掷显然都是独立的,因此每次抛掷的成功概率(例如,正面朝上的概率)是相同的。说一枚硬币是“平衡的”意味着概率恰好是 1/2。对于均匀骰子,如果我们指定掷出 3 为成功,那么成功的概率始终为 1/6。
但如果我们抛硬币五次会发生什么呢?这五次抛掷得到 3 个正面和 2 个反面的概率是多少?推而广之,如果我们抛这枚硬币 500 次,得到 247 个正面和 253 个反面的概率是多少?这是一个看似噩梦般的问题开元棋官方正版下载,但它的解决方案却出现在概率论早期杰作之一——雅各布·伯努利(Jakob Bernoulli,1654-1705)的《猜想的艺术》中。
伯努利是瑞士人。他的祖父、父亲、岳父都是富有的药剂师。他放弃了研钵和研杵,进入大学学习神学,22岁时获得了学位。然而,尽管他的家庭从事医学,他接受的是传福音教育,但他真正的兴趣却是数学。
从 1770 年代末直至去世,伯努利一直是世界上最杰出的数学家之一。他是一个天才,但性格却很烦人。他傲慢,蔑视那些没有才华的人的努力。例如,在研究了我们今天所说的“伯努利数”(以他的名字命名)之后,伯努利发现了一个非常聪明的对正整数幂求和的捷径。他说,“他花了不到七分半钟”就确定了前 1000 个正整数的 10 次方之和。也就是说,他只用了不到十分钟的时间,就确定了以下结果:
这确实是一笔巨款。但他在一篇自写的评论中自称,他的捷径“清楚地表明了布里奥特的工作是多么徒劳……他(布里奥特)只是不厌其烦地计算了上面的前六项。”权力的总和,我在一页上完成了这一切。”这个人对可怜的伊斯梅尔·布利亚杜斯没有同情心,他不仅拥有数学家非凡的洞察力,而且还异常自负。
雅各布·伯努利的巅峰时期与戈特弗里德·威廉·莱布尼茨发现微积分的时期同时发生。雅各布是推广这一丰硕成果的重要人物之一。与任何新发展的理论一样,微积分受益于那些追随其创始人脚步的人,受益于那些不如莱布尼茨才华横溢但对学科排序做出贡献的学者。是必不可少的。雅各布就是这样的贡献者之一。
[经瑞士巴塞尔 Birkhäuser Verlag AG 许可转载,摘自雅各布·伯努利全集,第 1 卷:新星,自然哲学,JO Fleckenstein 编辑,1969 年肖像]
在这项事业中,他有一个不安的盟友约翰(1667-1748),他的弟弟约翰(1667-1748)是才华横溢但爱吵架的伯努利兄弟,他的名字与他的名字缩写相同。 。事实上,雅各布担任他弟弟的数学老师。多年后,他可能后悔把约翰教得这么好,因为弟弟原来是一个和他一样优秀的数学家,甚至可能超过了他。两兄弟为了数学霸主的地位展开了激烈的竞争。当约翰解决了一个曾经困扰他兄弟的问题时,他从不掩饰自己的兴奋,尽管雅各布故意称约翰为他的“学生”,暗示约翰只是在模仿他的导师。伯努利都不是一个高贵的人。
悬链线问题引发了一场著名的冲突。悬链线是由固定在墙上两点的悬链线形成的曲线(见图B-1)。熟悉代数的人可能会猜测这条链条是沿着抛物线悬挂的,这是一个完全符合逻辑的猜测,伽利略等人早在 17 世纪初就想到了这一点。但这样悬挂的链条实际上并不是抛物线,到 1690 年,雅各布·伯努利 (Jacob Bernoulli) 非常努力地确定这条曲线的真实身份,即给出它的方程。
图B-1
事实证明,雅各布无法胜任这项任务。不难想象当约翰给出答案时雅各布的惊讶之情。后来,当约翰炫耀自己的胜利时,他说为了这个解决方案“我全心全意地研究,熬夜”。尽管约翰很擅长激怒别人,但他还是赶紧去找雅各布,告诉他沉思的兄弟问题的答案。雅各布立即垂头丧气。
然而,雅各布想要实施他的“复仇”。这次的战场就是所谓的等周问题,就是区分周长相同的曲线中哪条曲线围成的面积最大。我们将在第一章中更详细地讨论这个问题,但现在让我们看看雅各布·伯努利 (Jacob Bernoulli) 在 1697 年如何使用微积分来描述这个问题。他必须处理一个称为三阶微分方程的困难数学对象,而这项工作为现在称为变分法的数学新分支指明了道路,该分支具有广阔的研究前景。
他的弟弟约翰不同意,并说他已经用一个相对简单的二阶微分方程解决了等周问题。就像过去伯努利家族的情况一样,他们的争吵变成了对抗,只是因为缺乏“弹药”而结束。
约翰·伯努利(卡内基梅隆大学图书馆提供)
不过,这一次笑到最后的是雅各布,因为他哥哥的二阶微分方程是错误的。不幸的是,雅各布实际上并没有机会嘲笑这个问题,哪怕是轻微的嘲笑,因为他于 1705 年去世,而约翰对该问题的错误解决方案仍然神秘地封存在他位于巴黎学院的办公室里。有人猜测约翰意识到了自己的错误并设法秘密地隐藏起来,这样他就不必忍受公开的羞辱并让他的兄弟嘲笑。
这些轶事说明了兄弟之间的不和,因此接下来的事情也就不足为奇了。人们认为约翰是编辑他最近去世的兄弟论文的最合适人选,但雅各布的遗孀阻止了这一点,因为她担心怀恨在心的约翰会毁掉雅各布的数学遗产。 。 J·E·霍夫曼也许在《科学家传记词典》中对雅各布的性格进行了最好的描述:“他任性、固执、好斗、报复心强,并为自卑情结所困扰kaiyun全站网页版登录,但他仍然对自己的才能充满信心。由于他的性格,他“雅各和约翰确实是那种因为傲慢而毁了自己名声的人。 。
抛开他们兄弟之间的竞争,我们回到前面提到的概率问题:一枚偶数硬币抛掷五次,出现三个正面和两个反面的概率是多少?在《猜测的艺术》中,雅各布·伯努利给出了一个一般规则:如果我们重复n+m个独立试验(即n+m个伯努利试验),其中任何一个成功的概率为p,失败的概率为1 -p,则恰好获得 n 次成功和 m 次失败的概率由以下公式给出。
为了简化上面的公式,数学家引入了阶乘表示法:
例如,3!=3×2×1=6,5!=5×4×3×2×1=120。 (请注意,阶乘中的感叹号不需要我们大声说话。)由于这种方便的表示法,伯努利的结果被简化为:
因此,抛一枚偶数硬币 5 次后,得到 3 个正面的概率为 n = 3,m = 2,p = Prob(抛一个正面)= 1/2。所以有
同样,为了求出掷骰子 15 次并恰好得到 5 个 4 的概率,我们声明得到 4 就是“成功”并指定该值:
因此,经过 15 次独立投掷后,得到 5 个 4 的概率为
这几乎是不可能发生的。
回到之前的问题,如果你抛一枚硬币 500 次,得到 247 个正面和 253 个反面的概率是
虽然这个结果是正确的,但概率太复杂,无法手工计算,即使是高级的袖珍计算器也无法实现计算 500 这样大的数字的愿望! (对此有疑问的人可能想尝试一下)。我们将在第 N 章中看到一种近似求解该概率的技术。不过,即使不能直接这样计算,这个公式在理论上仍然是完美的。它是查找任何一系列独立伯努利试验概率的关键技术。
不幸的是,日常生活中的大多数事件实际上比抛硬币复杂得多,这几乎是一种纯粹的概率情况。确定 25 岁的人活到 70 岁以上的概率,或者下周二降雨量超过 1 英寸(25.4 毫米)的概率,或者进入十字路口的汽车右转的概率。解决这些问题绝非易事。由于现实世界的复杂性,这些事件令人困惑,正如雅各布所说:
请问,通过列举所有可能的情况,是否可以确定一个人不同部位、不同年龄所患的致命疾病的数量?换句话说,如果能够确定一种疾病比另一种疾病更致命,比如鼠疫比水肿更致命,或者水肿比发烧更致命,那么基于这个认识,我们就可以预测未来的一代。生存与死亡的关系? [6]
这样的概率超出了数学的范围吗?概率论只能归类为模拟游戏吗?
伯努利在《猜测的艺术》中对这个问题给出了非常有力的答案,这也许是他最伟大的遗产。事实上,他把这个问题称为自己的“黄金定理”,写道:“鉴于其新颖性和巨大的实用性,加上其较大的难度,这个定理的价值已经成为这个理论的缩影。 “今天所谓的伯努利定理通常被称为大数定律,它被认为是概率论的支柱之一。
为了了解其性质,再次假设我们正在进行独立的伯努利试验,其中每次试验的成功概率为 P。我们知道操作的总尝试次数,称之为 N,我们也知道成功结果的尝试次数,称之为 x。因此,分数 x/N 是我们观察到的成功比例。
例如,如果一枚均匀的硬币被抛掷 100 次,出现 47 个正面,则观察到的正面比率为 47/100=0.47。如果再抛硬币 100 次,又出现 55 次正面,则总成功率为
没有理由阻止某人再抛硬币一百次,或者一亿次,只要抛硬币的人愿意。关键问题是,长时间运行后,成功率x/N会发生什么变化?
随着试验数量的增加,没有人会惊讶地发现这一比率接近 0.5。一般来说,当N变大时,我们会看到x/N的值趋于固定数字p,这就是任何单次试验成功的真实概率。因此,这个定理的威力就在这里显现出来。当成功概率 p 未知时,成功比例 p 应该是在大量试验中更好的估计。象征性地表达,我们应该写,
,当 N 很大时(意思是“大约等于”)
添加几个重要的条件,这就成为大数定律。伯努利定理之所以如此出名,并不是因为它道出了真理,而是因为它很难用严格的论证来证明。雅各布斯本人以特有的尖刻态度承认,“即使是最愚蠢的人也应该本能地理解[大数定律]”。然而,为了给出这个定律的正确证明,他花费了二十年的努力,他给出的证明占据了《猜想的艺术》的好几页。事实证明,他的评论“这个原理的科学证明并不那么简单”是故意轻描淡写的。
我们应该谈谈上面提到的关于伯努利定理的“重要条件”。因为它本质上是一个概率陈述,所以它应该受到随时可能发生的不确定性的影响。我们不能绝对确定抛硬币 1000 次产生的正面的比例会比仅抛掷 100 次产生的正面的比例更接近 0.5。 100 次抛掷中,完全有可能得到 51 次正面,而 1000 次抛掷中,只可能得到 486 次正面。因此,这个“小样本”估计 x/N=51/100=0.51 实际上应该比“大样本”估计 x/N=486/1000=0.486 更接近抛头的真实概率。发生这样的事情是完全有可能的。
这样,如果我们再扔1000次,每次扔都出现正面也不是完全不可能的。有可能产生令人惊讶的结果。 2000 次投掷产生 1486 个正面,因此估计概率为 1486/2000=0.743。在这种情况下,大数定律似乎不再适用。
但事实并非如此。因为雅各布·伯努利证明的是,对于任何给定的小公差,例如 0.000 001,估计概率 x/N 与真实概率 p 之间的差异就是这个小公差或小于它。只需增加试验次数,概率就可以接近 1。只要我们做足够的实验,我们几乎可以肯定,或者道德上肯定用伯努利曾经用过的词,我们的估计值x/N和真实概率p之间的差异一定在0.000 001以内。当然,我们不能100%确定p和x/N的差值小于0.000 001,但是大量的实验可以让我们完全确定这个推论并不算太离谱。
在上面的例子中,抛掷偶数硬币 2000 次后出现正面的概率估计为 0.743,这可能比阅读本章时遇到流星的概率要小。另外,即使出现这样一个不可能的估计,伯努利仍然很有信心地声称,通过做大量的实验,比如2000次、200万次甚至更多,这个比值x/N肯定会趋向于0.5。
需要强调的是,即使约束如此之少,大数定律仍然是可证明的。这与我们在生活中遇到的其他著名定律不同,例如墨菲定律和万有引力定律。它们要么是普遍接受的陈词滥调(例如墨菲定律),要么是备受推崇的物理模型(例如万有引力定律),并且会根据证据进行修订。但大数定律是一个数学定理,并且已被证明在必须遵守的逻辑约束内始终成立。
另外,它还有自己的用途。保险公司用来调整精算表的生存概率是基于大量类似实验的结果(例如人类的生存和死亡)。天气预报员预测下雨的概率也是如此。
或者考虑一下 18 世纪的例子,计算女性生男孩而不是女孩的概率。如何以某种先验方式计算这个概率?遗传并发症严重破坏了之前通过任何纯理论方法确定生男孩的可能性。因此,我们被迫采用“既成事实”或事后核查,并以伯努利定律为武器来应对。
18世纪初,这个特殊的问题一直萦绕在英国人约翰·阿布斯诺特的脑海中。和他之前的其他人一样,他从人口普查记录中注意到,每年出生的男孩略多于女孩,并认为这种不平衡现象“多年来一直存在,不仅在伦敦,而且在全世界”。阿布斯诺特试图用“上帝的祝福”来解释这一现象。几年后,雅各布和约翰的侄子尼古拉斯·伯努利继承了家族的数学天赋,利用大数定律得出生男孩的概率为18/35。换句话说,大量的出生记录显示出男女比例呈显着且稳定的趋势,即18比17。伯努利定理“不仅适用于伦敦,而且适用于全世界”。
直到今天它仍然有效。一种称为蒙特卡罗方法的技术,在伯努利定理和计算机能力的帮助下,变得非常重要,因为它可以帮助科学家以概率方式模拟各种随机现象。下面是蒙特卡罗方法的一个相当简单的示例。假设我们希望找到一个不规则形状的湖泊的表面积。我们可以沿着湖边行走,或者从上面拍照,但是湖的曲率和表面不规则的边界使得很难使用任何数学公式来确定它的面积。
假设我们的湖泊呈图 B-2 中阴影图形的形状,我们在其上给出了 和 的坐标。由于我们计划在 L 章中重新讨论这个例子,因此我们选择了一个形状相对规则的湖泊,它的边界是一条抛物线,其轴和方程为 。
图B-2
我们将使用概率方法估计其面积。首先,如图所示,在矩形内圈出一个区域。其次,让计算机在这个矩形内找到任意数量的(x,y)点。例如,计算机可能能够找到如图所示的两个点A=(3.5,7.3),B=(6.0,13.7)。
现在,我们要问计算机:这些随机点是落在湖内还是湖外?在我们的例子中,这个问题很容易解决。为了检查A点,我们在抛物线方程中设置x=3.5,然后找到相应的值。这表明点 (3.5, 15.75) 位于抛物线上。那么对比A点,A点的第一个坐标是一样的,但是第二个坐标只有7.3,落在抛物线内部,也就是湖里面。
同样,当考虑B点时,我们将其第一个坐标代入抛物线方程中并得到相应的值。因此,点 (6, 12) 在抛物线上,因此点 B (6, 13.7) 落在抛物线之外并撞击干燥的地面。计算机只需要几毫秒就可以选择许多随机点并确定它们是在湖内还是湖外。
现在看根据蒙特卡罗方法的关键观察:随机选择的点落入湖中的确切概率用p表示,它是湖所占据的矩形面积的比例,即
当然,只有我们首先知道湖泊的面积(也就是我们需要的未知量),我们才能计算出这个概率。但是,我们可以根据x/N来估计该点落入湖中的概率p,即落入抛物线内部的部分所占的比例。使用长期成功率来近似真实概率本身就是大数定律的直接应用。
对于这个例子,我们的计算机在矩形内选择了 500 个点,发现其中 342 个点落入湖中。因此,我们估计
交叉相乘后,该估计为
因此,除了伯努利大数定律之外,我们无需求助于其他任何东西,就可以粗略地估算出湖泊的面积。
我们怎样才能得到更准确的估计呢?我们只是要求计算机在这个矩形内选择 5000 个点,而不是 500 个点。在这个例子中,它发现 3293 个点在湖内,所以我们得到
所以有
当然,我们也可以让计算机选择50,000个随机点,或者500,000个点,或者让它不惜一切代价选择任意数量的点。那么,我们就会更有信心估算出这个抛物线湖的面积。
这是一个基本的模拟示例,使用蒙特卡罗方法可以研究现实世界中更多奇妙的现象。另外,正如我们稍后将看到的,示例中抛物线的面积实际上可以使用积分方法精确求出。但这个例子还是让我们感受到了概率的力量。
自从雅各布·伯努利证明他的伟大定理以来,已经过去了三个多世纪。他最初的论点已被简化版本所取代,该版本更有效地反映了问题的本质,就像数学中经常出现的情况一样。今天的标准证明是基于我们在A章中见过的俄罗斯数学家切比雪夫的一个结果。这种方法,加上随机变量的期望值和标准差等一系列概念,使我们能够简化定律的证明将大量数字写在一页上,同时表明伯努利的证明确实很麻烦。然而,本着伯努利所不具备的宽容精神,我们将坚决抵制仅仅因为伯努利的证明需要一章的时间来解释,“我们只需一页工作就能做到这一点”的想法,并给他的工作贴上“无用”的标签。
这是进展的正常状态。然而,在全人类的奋斗中,我们最好记住这些前辈。正如今天的音频技术所产生的音乐远远优于 19 世纪留声机的刺耳声音一样,现代概率论也缩短并简化了伯努利大数定律的证明。尽管一系列的进步已经表明托马斯·爱迪生的原作是多么过时,但我们仍然对他怀有极大的敬佩。同样,我们也应该对他引以为傲的伯努利黄金定理给予同样的尊重。
《数学事物:伟大的问题和非凡的人》
作者:[美]威廉·邓纳姆
出版社: 人民邮电出版社
发表时间:2022-03