按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
这里再讲一个关于猴子的故事:
有一群猴子被关在笼子里,在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了,这个过程重复着,猴子们发现,尽管有猴子吃到香蕉,但吃到
香蕉的猴子是少数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了。
在这个故事里,猴子间产生了“道德”。如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是“不道德的”,它们也会自动地惩罚“不道德的”猴子。
当然这只是一个故事,这个故事反映了人类的道德的产生过程。
人天生是自私的,他努力使自己的利益最大。当然这不是对现实的人的看法,而是一个抽象的假定。但现实中的人为什么有道德呢?从自私的假定中怎么推出道德的人?
上述猴子的“道德”产生的故事可以用来解释博弈论专家对道德的阐述。
人类原初的状态就是囚徒困境
人类的天性是驱利避害的,从动物状态走出来时人是自私的。自私的人在交往中每个人为了自己的利益而产生的结果正是一种囚徒困境。
英国哲学家霍布斯假设了人类的原初状态,用他的话说,自然状态中人与人之间像狼与狼一样,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有
正义或不正义,只有战争。武力与欺诈是战争中的两大基本德性。
在自然状态下,霍布斯说,是没有工业、知识、艺术、社会的一点余地的。
霍布斯对自然状态的假定,目的是要引申出他的政治主张。他认为,在这种状态下人的生活是悲惨的。为了摆脱这种状态,人们便汇聚起来,建立契约,同意确立一个权力者或权力团体,这就是利维坦,这个拥有巨大权力的利维坦对人们使用权力,以结束每个人对每个人之间的混战。这就是霍布斯的社会契约论的思想。
在“霍布斯模型”中,国家以法律条文规定对某种行为如“战争”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“战争”行动中获取的好处大于他采取“和平”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则:效率原则。
效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。但是,严格的法律对犯法者公平吗?这就涉及法律制定的第二条原则。
第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。从这个意义上讲,法律惩罚太重,对犯法者不公平;而太轻,对社会或他人不公平。
效率原则与公平原则是很难统一的,法律的制定既要考虑效率原则,又要考虑公平原则,但往往两者难以兼顾。在不同的国家以及在同一个国家的不同时期,对这两个原则的侧重点是不同的。
更为基本的道德调节
与国家一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现(当然还有国家)使得人类从囚徒困境中走出来。
道德调节的第一个特点是,道德是先于国家产生的。根据历史记载,国家的出现在人类历史上是很晚的事情,而在国家出现以前,人类已经经过很长一段历史。
在国家出现以前,以某种权力组织来调节群体是可能的,如部落的存在。然而更为基本的是道德的调节作用。道德先于国家而存在,在上面的例子中,非洲的努埃尔人没有国家,但也调节得很好,这便是道德的作用。
人的正义和非正义的概念与财产权的概念分不开,没有明确的财产权的地方是不可能有正义的,因而在人类的早期,正义的观念与财产权的观念几乎是同时产生的。
人的正义与非正义的观念产生了道德感,无论是霍布斯还是休谟都这么认为。道德的产生先于国家,而它们的作用都是区分或调节正义与非正义的行为的。
英国著名哲学家休谟在《人性论》中认为,人存在着先天的不足。狮子勇猛、敏捷,羊、牛虽不具备这些条件,但它们食量也不大,而人身体软弱但需求很大,为了弥补这个不足,只有依赖于社会。在社会中人有了力量、能力和安全。但是社会是如何合作的?休谟叙述了从两性的吸引到亲情关系,再到道德感的产生。道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。
因此只要社会形成了道德或不道德,或者正义或非正义的观念,就自动地产生了调节作用。我们说,这种调节机制是非中心化的,即它不是通过某个建立起来的中心化的组织来实施的。
道德调节无须成本,这是道德调节的第二个特点。道德感是存在于每个人心中的,它无须成本维持。对不道德行为的谴责也是不花成本的。
道德调节的第三个特点是,道德的调节存在着局限。它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德的作用便失效。捡到别人掉的东西还给失主是道德行为,一方面捡到者有道德满足感,另一方面会受到社会的表扬;如果不送回失主并被发现的话,则会受到谴责。但是如果捡到的是一大笔钱,捡到者对是否还回给失主将有所疑虑,因为他道德的满足感或可能承受的谴责小于他捡到这笔钱的获利。另外一个例子是,自古有杀人者死,伤人者刑,然而这与法律的实施相联系,在没有国家、没有组织的原始社会,我们假定这时是单个人的社会,如果有力量的人杀了人,有谁对其惩罚呢?人们可以谴责这种行为,认为它是不道德的,但没有力量对之惩罚。因此从社会发展的角度来看,社会发展到一定程度,便需要强有力的政府产生,以弥补道德调节的不足。
哪种策略更能赢?
假定我们的社会已经形成约束行动者的道德规范。如果对不道德的行为不能产生即时的惩罚,不道德的行为在社会中往往能给行为者带来好处。这表现在一次性的非合作的博弈中,行为者理性地选取对自己有利的行动。但是,如果存在重复博弈,参与者之间对不合作行为就会形成惩罚机制。
对囚徒困境进行无限次的重复博弈,什么样的策略会赢?
甲乙不合作合作不合作(1,1)(4,0)合作(0,4)(2,2)
假定第一步双方均采取合作的策略,第二步有人采取不合作策略,而对方采取合作策略,采取不合作策略的人将有支付4,采取合作策略的人将有支付0。采取合作策略的人感觉自己不合算,他在第三步也会采取不合作策略。此时双方有可能进入均采取不合作策略的重复性的囚徒困境。因此,在第二步,采取不合作策略的人会考虑这样的结果。
这里涉及参与者以什么样的态度对待对方的不合作策略。在博弈论里,有两个著名的策略。
如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略,或称冷酷策略,英文叫trigger strategy。
如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。
第二种策略是,若你采取不合作策略,我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。这叫“一报还一报”策略,或者称之为“针锋相对”,英文叫titfortat。美国密执安大学的罗伯特·埃克斯罗德(Robert Axerold)主持了一次计算机比赛,看谁写出来的程序能够赢。参加者有政治学家、数学家、经济学家、社会学家,他们都详细研究过囚徒困境。获胜者是加拿大多伦多大学的拉波波特写出的titfortat策略。这个程序非常简单:第一步采取合作,接着对方采取什么策略,他便跟着做什么。
当然有多种策略,如对方采取了不合作,但自己永远采取合作策略,这个策略可以叫做“以德报怨”策略。这个策略对行动者最为不利,因为对方知道你采取这种策略,他会永远采取不合作的策略,因而理性的人是不会采取这种“以德报怨”策略的。然而,极端道德的人是超越理性的限制的,此时他会采取“以德报怨”策略。佛说:“我不入地狱,谁入地狱?”基督说:“爱你的敌人。”他们爱一切人而不会计算他爱的行动会给他带来利益或灾难,而是希望他的行动感化众生。
如果是有限次的囚徒困境,那么情况就不同于上述无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可能性加大,如果参与人以前的所有策略均为合作策略,并且被告