友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
飞读中文网 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

纳什均衡与博弈论-第35章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



。费马有一个赌博习惯,并且希望在此方面得到帕斯卡的帮助。当然帕斯卡提出的不是关于赌博罪恶的宗教说教,相反,他提出的是如何制胜的数学建议。事实上,就是在与费马就这个问题的通信过程中,帕斯卡创造出了概率论。另外,帕斯卡在进行严谨的宗教反思中,得出了概率这个概念,它在此几百年后,成为一个关键的、对博弈论的提出有重要意义的数学概念。

  帕斯卡观察到,当下注开赌的时候,仅仅知道输赢的概率是多少是远远不够的,你还必须知道什么是风险。举个例子,如果赢的概率很小,但如果赢了,回报很高。那么这时,你就可能愿意去冒险。或者你会追求安全,即使回报很低,也把赌注压在确定会赢的牌上。然而如果知道回报不高,却将赌注押在一手不那么容易赢的牌上就显得很不明智了。

  帕斯卡在其宗教著作中勾勒出了这个问题的框架,特别是关于是否存在上帝的赌博情况中。选择相信上帝就像下了个赌注,他说。如果你相信有上帝,而且这个信念最终被证明是错误的,你也不会失去什么。如果上帝的确存在,信仰上帝会使你赢得一生的无尚幸福感。纵使上帝的存在是一个低概率的神的存在,而相信他存在的回报确是那么的巨大(基本上是无限大的)。无论如何,他确实是一个很好的赌注。“让我们来衡量一下在上帝是否存在的博弈中的得失,”他写道,“让我们来判断一下这两种情况。如果你赢了,你会得到所有;如果你输了,你什么也没有失去。那么,毫不犹豫,他就是个赌博。”

  帕斯卡的推理也许是在神学上过分简单化了,但是确实在数学方面很吸引人。关于一个经济决策进行“数学期望”的计算启示了这种推理方式——你用产出的概率乘以产出本身的价值。理性的选择一定是那个计算结果给出最高期望值的决策。帕斯卡的赌博经常被引用作最早的基于数学方法的决策论的例子。

  在真实生活中,当然,人们不会总是简单地通过这种计算来做决定。并且当你的最佳决策依赖于他人是如何决策的时候,简单的决策论就不管用了——做出最佳决策便成为博弈论的一个问题(一些专家认为,决策论仅仅是博弈论的一个特例,因为在决策论中是一个参与者和自然在博弈)。而且,概率和预期收益仍然以深远且复杂的方式与博弈论有着千丝万缕的联系。

  由于这个缘故,所有的科学都和概率论有着深层次的缠结——整个观察、实验和测量过程,以及其后将这些数据和理论进行比较都是必需的。而且概率不仅发生在测量和假设检验中,也会发生在对物理现象的精确描述中,尤其是在统计物理学的范畴中。在社会科学中,当然,概率论也是不可或缺的,就像阿道夫·凯特勒在大约两百年前说的一样。因此,我敢打赌,博弈论和概率的密切联系是博弈论之所以被广泛地应用在这么多不同科学领域的原因。并且,毫无疑问,正是博弈论的这个方面使其居于一个如此战略性的位置,作为一种原动力促使社会学与统计物理学融合形成社会物理学——有些像阿西莫夫的心理史学或自然法典。

  到目前为止,策划运用社会物理学来描述社会的尝试绝大多数并不以博弈论为基础,而是以统计物理学为基础的(如阿西莫夫的小说的心理史学)。但是博弈论中混合策略/概率方程式表现出其与统计物理学中概率分布的惊人相似。事实上,为达到纳什均衡的博弈参与者所使用的混合策略正是概率分布,准确地说,正如统计物理学里定量表示气体中分子的分布情况。

  这个认识推出了一个非凡的结论——即,从某种意义上说,博弈论和统计物理学是互相的他我。意即,它们能够用相同的数学语言来表述。更确切地说,你不得不承认博弈论中某些模型与统计物理学中一些特殊公式在数学上是一致的,且其中还存在深层次的内在联系。只不过,几乎很少人意识到这一点。

  第一节 统计学和博弈

  然而,如果你全面地检索研究文献,你将会从少数已经开始研究博弈论…统计物理学关系的科学家那发现一些论文。其中,有一位名叫大卫·沃尔波特的物理数学家,供职于美国国家航空航天局的加州艾姆斯研究中心。

  沃尔波特是富有创造性思维的思想家之一,拒绝被常规的科学模式所禁锢。他顺着无定型边缘分离(或结合)物理学、数学、计算机科学和复杂性理论的方向,追寻着自己的直觉与兴趣。我第一次遇见他是在20世纪90年代初,那时他在圣达菲学院做跨学科科学的前沿探索,我们就记忆的本质和可计算性的限制等问题进行了讨论。

  2004年早期,当我留意到他在环球网络物理学版的预定本上发表的一篇论文时,沃尔波特的名字再次进入我的眼帘。他的文章论述了如何在博弈论与统计物理学之间建立一种联系(倘若顺便提一句,这也是我写这本书的重要灵感之一)。事实上,正如沃尔波特在文章中所展示的,首先引起我对这个问题的注意的是,一种特殊的研究统计物理学的方法所涉及的数学方法和研究非合作博弈所使用的数学方法是相同的。

  沃尔波特的文章提到,统计物理学中描述微粒都会尽量最小化它们的聚集能,就像参加赌博的人都会为了达到纳什均衡而试图最大化自己的效用一样。赌徒们为达到纳什均衡所使用的混合策略正是概率分布,就像统计物理学中描述的微粒间的能量分布。

  在阅读了沃尔波特的文章后,就此问题我给他写了封信,并于几个月后在波士顿郊外的一个复杂性研讨会上与他讨论,当时他于会中陈述一些相关的研究工作。当我问及是什么促使他在博弈论和统计物理学之间建立联系的,他回答说是:拒绝。

  沃尔波特一直致力于集合机器学习系统的研究,这个系统可以在各台计算机、机器人,或其他自动设备,各自具有自身个体目标的情况下,相互协调地为了整个系统达成一个目标。这个想法正是找寻一条途径在各个“因子”之间建立关联,使它们的集合行为能服务于总体目标。他注意到,他的研究与《物理评论快报》(Physical Review Letters)上发表的一篇关于纳米计算机的论文的颇为相似。因此,沃尔波特将他的其中一篇论文寄给了那个期刊。

  “事实上,编辑回信道‘呃,坦白地说,你的工作不是物理学,’”沃尔波特说,“而且我很不高兴”。所以他开始思考物理学和博弈论。毕竟,一群有着各自走向的因子,但却追寻一个共同目标,这与博弈中寻求纳什均衡的参与者颇为相似。他回忆道:“之后我说,那么我将尽全力理解这其中的奥秘,并用物理系统的语言来进行完整的诠释。”

  博弈涉及的是参与者;物理学涉及的是分子。于是沃尔波特就研究能够体现参与者策略的数学方法,就像物理学中体现分子动态一样。所有参与者策略的混合体就像统计物理学中通常描述的所有原子动态的集合。他提出的公式,在给定对参与者的有限了解的情况下,可允许你计算出在博弈中任何个体参与者策略的真实集合的接近的近似值。你可以用同样的方法来计算出所有博弈参与者的混合策略。基本上,沃尔波特展示了统计物理学中的数学方法如何最终与有着有限理性参与者的博弈中所使用的数学方法是相同的。

  “那些论题根本上是同一的,”他在他的文章中写道,“这个证明增加了将一些统计物理学中已发展得很强大的数学技术转移到分析非合作博弈理论中的潜能。”

  沃尔波特的数学图谋植根于“最大熵”理论(maximum entropy,或者叫“maxent”),一个联系标准统计物理学与信息理论的原理,用于量化发送与收到讯息的数学。最大熵的理论是由特立独行的物理学家艾德文·杰尼斯(Edwin Jaynes)在他于1957年发表的文章中创立的,此理论被很多物理学家所接受,但同时也被其他很多物理学家所忽视。当时,沃尔波特称杰尼斯的工作“多么光辉而美丽”,并且认为这才是科学家们必须为了“将博弈论带入21世纪”所需的东西。

  杰尼斯原理吸引人的同时也使人产生挫败感。它看起来本质上简单,然而却隐含着错综复杂的关系。它与物理概念——熵有着紧密的联系,但仍有着细微的不同。无论如何,它的解释需要对概率论与信息理论的本质进行简要的探寻,也就是将博弈论与统计物理学结合到一起的本质联系。

  第二节 概率和信息

  几个世纪以来,科学家与数学家都在争论概率的含义。即便今天,仍然存在着不同学派的概率思想,通常简单表示为“客观派”与“主观派”。但是那些标签隐藏了次论据与技术上的细微的差别,使概率论成为一个数学与自然科学中最充满争议和困惑的领域。

  多少有点令人吃惊,概率论的确是基于自然科学的基础,扮演着分析实验数据和理论检验过程中的核心角色。这就是科学所要做的一切。你会认为到如今他们已把问题全部解决。但是,建立科学的秩序有些类似为伊拉克建立一套宪法。研究科学的原理和方法纷繁复杂。事实上,科学(不像数学)不是建立在不可约规则的坚实基础上的。科学就像语法。语法是由使用该语言的本族人在创造词汇和联系词汇时发展出来的规律。一个真正的语法学家不会告诉人们他们应该怎么说,而是整理出人们实际上是如何说的。科学并不是烹调书,提供揭露自然奥秘的菜谱;科学源于方法的集合,成功诠释自然。这就是为什么科学不完全是实验,也不完全是理论,而是两者相互影响的复合体。

  不过,归根结底,理论和实验必须紧密结合在一起,
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!