• 首页
  • >
  • 社会秩序之谜(二)

社会秩序之谜(二)

  • 董志强
  • 作者于2020年1月3日在北京“资助者论坛”演讲录音

        在这里我要引入一个概念,叫作禀赋效应。这是行为经济学当中的一个概念。过去几十年行为经济学做了很多实验研究,发现人具有禀赋效应。但是经济学家都认为,禀赋效应是非理性的。所以很多时候经济学家试图告诉你,做决策的时候你要尽量排除这些非理性行为。比如说,你要做交易的时候,要考虑这个东西对你值多少钱?但是你要避免对它做出错误的评价,如果评价是错误的,你的决策结果就会比较糟糕。当然,对个人可能确实如此,但今天我要讲的,恰恰是这些非理性行为对于我们人类社会的重要性。

        究竟什么是禀赋效应呢?禀赋效应指的这样的一种心理倾向:当一件东西,它属于我的时候,我对它的评价就会变得更高;当它不属于我的时候,我对它的评价就会变得更低。经典的禀赋效应实验是对大学生的马克杯实验。你可以把杯子先分配给一些同学,然后让他们评估手中的杯子,自己愿意花多少钱把它卖掉,你会发现这些同学会评估一个比较高的价格。另外一些同学没有得到杯子,你问他们愿意花多少钱去买这个杯子,他也会有自己的评价,但是他们的评价就会比较低一点。这张图左边,是已经拥有杯子的同学对杯子的评价;右边,是没有杯子的同学对杯子的评价。由于两组学生是随机分组的,就是说这两组同学之间没有什么其他系统性的差别。倘若他们对杯子评价不同,那就只能说是由是否获得杯子的所有权引起的,不大可能是其他因素引起的。这是一个实验。另外再做另外一个实验,对一群同学我们给他们杯子,另外一群同学我们给他们巧克力,然后我们让两组同学来决定要不要跟对方交换。可以想象,如果大家认为杯子比巧克力值钱,可能杯子组就不愿意去换巧克力,巧克力组倒是很想换杯子;如果大家认为巧克力杯子值钱,可能巧克力组就不愿意换,而杯子组倒是很想换,按理应该出现这样的结果。那么真实的实验结果是什么呢?在图上你会发现,拿了杯子的人,他不愿意拿杯子去换巧克力,而拥有巧克力的人他也不愿意拿巧克力去换杯子。这说明每一方都对自己拥有的东西评价更高,对没拥有的东西评级更低。这就是禀赋效应。这是一种非常神奇的心理倾向,人们一旦获得某个东西的所有权,则对该物的评价就变高了,否则评价就比较低。

        禀赋效应实验最初在学生当中做,后来发现结果非常稳定,就扩展到了很多人群。在成人的很多领域,都发现了禀赋效应心理倾向,不管是交换东西也好,或者交易股票也好,都有这样的心理倾向。然后进一步研究发现,在幼儿中也有禀赋效应。对于成人的行为,我们有时候是不知道它是先天的还是后天的,于是学者们就研究幼儿的行为,幼儿的行为通常可能有更多先天成分。研究者在幼儿园装上摄像头,看这些幼儿的行为怎么表现。比如,他们如何玩玩具,一堆玩具,每个小朋友都可以先去接触某些玩具,然后有些小朋友玩了之后可能会去玩别的玩具。这些小孩在争夺玩具的过程当中,谁在什么样的条件下会有更多成功?结果发现,如果某个小孩他先接触到某个玩具,那么在争夺这一件玩具上他通常会成为赢家。他成为赢家的原因是什么?因为他会比别人、比别的小孩更加努力地去争夺这个玩具。就比如我和你是两个小朋友,如果我原先接触这个玩具,现在你要来抢,我们两个可能就会干一架,是吧?要干一架,由于我原先接触过这个玩具,我就会更加拼命;而另外一个小朋友,你,见情况不对也就罢手了,另外再去找其他玩具去了。这说明什么呢?说明对于先前接触过的玩具,幼儿具有了对它的禀赋效应,没有接触的玩具他没有禀赋效应。后来还有一些实验,研究对他人的物品是不是有禀赋效应。结果发现,人们对对自己亲人的物品,也有禀赋效益。比如说,一个人对他母亲拥有的东西,或者他母亲用过的东西,他的评价就会更高;同样的东西跟他没什么关系的,他评价的就没那么高。

        最关键的是对动物的一些实验表明,动物也有禀赋效应和产权尊重。就是说,一旦动物拥有某物品的所有权,那么他对物品的评价可能更高一些,而他的同类也会尊重他的所有权。当然,动物对物品的所有权不好界定,对不对?因为动物不懂得什么叫所有权,也不懂什么法律。有一个实验设计很巧妙,它是这样做的:在笼子里放上几只猴子,用长短不同的绳子(比如2米和4米)一头拴着猴子一头拴着罐头,罐头里装着葡萄干。猴子行动的时候,罐头可以跟着自由移动,短的绳子罐头和猴子移动联系显然更紧密,长的绳子罐头很难跟着猴子一起移动。研究者们故意把罐头绳子连上弱势的猴子,观察他们的罐头会不会被其他强势的猴子夺走。结果发现,绳子越短,即便弱势的猴子也更能保住自己的罐头,强势的猴子下手抢夺的频率也更低;但绳子越长,情况则相反。也就是说,即使强势的猴子,在罐头产权归属更明确的情形,也会更尊重弱势猴子的产权。

        现在大家应该明白了禀赋效应是怎么回事。但是这个禀赋效应一般究竟有多强呢?对拥有的物品评价会更高,究竟高到多少?很多实验,不管是对人的实验,还是对小孩的实验,或者对动物的实验,结果都表明,这个更高大概就是两倍。这个两倍,不是我在这里随口说出来,而是大量的实验表明,它基本上就是两倍。当然,每次实验结果不太一样,有时候可能是两点几或者一点几,甚至有些做出来这个还可能有更多的,也有做出来是一百多倍的,但是绝大多数时候这个倍数都在2左右。这也是一个非常神奇的结果。

        当然了,这个2本身就比较奇怪。如果大家去了解一下卡尼曼前景理论,会发现跟这个2也可能有点关系。卡尼曼2002年得了诺贝尔经济学奖,但他实际上是个心理学家,他提出了前景理论,也就是这幅图表明的结果。这幅图表明什么呢?表明我们人对得到的幸福和失去的痛苦评价不一样,对同样价值的损益评价不一样。比如说你在这里得到100块钱,你的幸福会增加,增加了上面箭头所标志的幅度,这是你幸福的增加量。如果你失去100块钱,你的痛苦会是这么大,是这一段(注:指得到100块钱的幸福增加量)的两倍,是吧?也就是说,同样是100块钱的价值,你得到它的幸福增加量,只是你失去它的痛苦增加量的1/2,痛苦是幸福的2倍。换言之,我们对失去的痛苦更加敏感。有时候我们把这叫做损失厌恶。这个跟禀赋效应有没有什么联系?我觉得应该是有的。尽管它们来自于不同的研究,但我觉得是有联系的。因为,如果物品所有权归属于我,当我没有了它,我会把这当作损失;如果我本没有这个物品,现在却归属于我,我就认为这是一种获得。所以,为什么禀赋效应会是2倍,很可能跟前景理论有关系,因为我失去一件物品的痛苦,是得到它的幸福的两倍。

        等会儿我会进一步讲,我自己的研究是什么看法。

        文献中通常都认为禀赋效应是不理性的,因为它有可能导致值得交易的东西没有交易。比如说这支镭射笔市价100元,但是因为它现在属于我而我对它评价值200元,所以有人出价150元来购买时,我不会卖给他。但实际上,如果有人愿意花150元来买,我的最优选择理应是卖给他,然后再花100元重新买一支。这样的话,我仍然有一支同等的镭射笔,但却赚了50元,对不对?由于禀赋效应,我没有卖掉这只镭射笔,你会说我的决策不太理性。这是通常的看法。但是,我认为恰恰是这种“非理性”,构成我们社会秩序的基石。我们人不能够没有这种心理倾向,如果没有这种心理倾向,我们这个社会就不可能形成秩序。原因很简单,我曾经写了两篇文章,一篇中文的、一篇英文的,来解释我这个理论。把我那些文章的技术部分去掉,剩下最核心的思想在于:禀赋效应使得个体对其拥有之物评价更高,使得他们愿意为捍卫拥有之物而投入更大的战斗代价,这种更大的战斗代价有效地遏制了后来者的侵略,因为后来者不具有物品的所有权,不愿意承担更大的代价来战斗。这是什么意思呢?如果没有法律,我怎样保护属于我的东西,我怎么保得住?这个时候我只有靠我自己!我自己要保护我的东西,如果你非要来抢,我就得付出资源来捍卫。如果,我愿意为它付出的资源,超过你愿意为它付出的资源,我就更可能获胜。当我对它的评价足够高,就意味着我愿意花足够高的代价来捍卫它;此时你会发现,你花不菲的代价来抢夺我这东西,其实已经不那么划算。所以我说,过高评价拥有物看上去似乎不太理性,但恰恰因为我不理性的决策,有效遏制了其他人来抢夺的意图。一件物品的归属,不是说谁强谁就能够占有,而是说谁更有决心捍卫它,谁才能够占得住。禀赋效应给了我们捍卫拥有物的决心。

        但是我们还要追问一下,禀赋效应是怎么来的?大家已经明白,禀赋效应的确可以塑造社会秩序,即便没有法律保护,我也会努力地为拥有物而战,因为我对拥有物评价过高,我有这样的心理倾向。但是,大家还不清楚这个倾向怎么来的。人有很多偏好,包括人性的诸多方面,其实都是进化而来的。人类初期,跟动物差不多。为什么人类,乃至很多动物,会进化出禀赋效应来?

        这是去年1月份我在《经济研究》上发表的一篇文章,回答了这个问题。我们做了一个模型,这个模型有数理推导,但更多的是做一下模拟工作。我们在电脑里设计了一个原始社会,里面有很多的agents,就是一个一个的能动主体,每个agent的偏好都不一样。我们就是要看,在这样一个人工设计的原始社会中,究竟哪一种偏好会胜出,会穿透演化的筛子。这就是我们所做的工作。最后我们发现什么呢?屏幕上这段话基本上是这篇文章的核心内容——对于一笔资源,行为主体在拥有它时对它的主观评价更高,而在未拥有它时候对它评价更低,这种非对称的偏好,也就是我刚才讲的禀赋效应,将是演化稳定的结果。

        同时,在我们的模型中也涌现出了自然产权,也就是说对先占权的自发尊重——谁先占到这个东西,OK,谁就成为物主,其他人都尊重这个先来后到规则。这个规则是怎么涌现出来的呢?它是和禀赋效应与生俱来、相伴随行的一种现象。正是因为在演化过程中涌现出了禀赋效应,因而才出现了对产权的自发尊重;而对产权的自发尊重,也使得具有禀赋效应的agent能够受益更多,从而提升了它的适存性。换言之,禀赋效应和自然产权是协同演化的。这句话可能大家不太明白,是说什么意思呢?简单而言,我刚才讲禀赋效应是成就我们社会秩序的基石,并不是说我们先进化出了禀赋效应这种心理倾向,然后才有了社会秩序。我在这里表明的其实是,两者是协同演化的。在模型的初始时刻,agent对资源各有不同的评价偏好,有些人是拥有资源时对它评价高,没拥有的时候评价低;也有些人不管拥有或者没拥有,对资源的评价都一样;甚至不排除还有一些人,是拥有资源时对资源评价低,没拥有时反而评价高。我们的模型中各种各样的偏好都有,但是你会发现,到最后只有那种拥有资源时评价高而没拥有时评价低的这些人,他们能够更好地捍卫住自己的资源,他对资源的所有权或先占权,也更容易得到其他个体的尊重。所以这些人获得了一种优势。资源被自己占有,而别人尊重这种占有,这在进化中当然会获得一定的优势。当他们获得这个优势的时候,同时其他人对产权的尊重也就在形成。一旦人们真有自发尊重产权的行为,就会进一步强化禀赋效应的生存优势,两者是相辅相成。最后我们就看到,禀赋效应心理和自发产权秩序在同时形成。这个过程不能用今天人类的眼光来看,因为今天我们个人一生下来,那些秩序都已经存在了。但对于最原始的时代,人类心理和社会秩序是漫长年代演化而来的。现在我们对一些社会规则习以为常地遵循,原因在于我们一生下来这些规则就已经存在了。人其实是有规范倾向性的。如果我们等会儿有时间,我可以再简单讲一下道德是怎么演化的,现在我们先不讲。

        在我们文章当中,还解决了另外一个问题。agents的偏好有很多种,有些人是拥有资源时评价低,没拥有时价高,这刚好是跟禀赋效应是反着来的,我的文章证明这样的偏好不可能长期存在。为什么呢?把我们模型当中那些繁琐的地方去掉,背后的直觉和背后的思想很简单:倘若你对占有的评价低,而对非占有的评价反而高,这就是人们常说的“得不到的才是更好的”;假如个体一直保持这样的偏好,那么当他放弃某占有物之后,他对该物的评价就会变得更高,这个时候他就会后悔放弃了占有物,这就是所谓的“失去了才觉得珍贵”。但是“得不到才是更好的”,和“失去了才觉珍贵”,不满足偏好的一致性,个体将会在这两个状态之间来回的摇摆——我得到了这个东西,感觉它不值钱,扔了;扔了后觉得不行,太值钱了,我又把它找回来;回到手又会觉得不值钱,还是扔了;无穷无尽,永远徘徊。所以,这是一种不具有稳定性的偏好,具有这种偏好的个体,会长期处在徘徊中,在演化过程中将没有优势,故而不会长期存在。这里我还有一句,不要真的以为得不到的才是最好的,你还不如好好珍惜现在拥有的,符合我们禀赋效应的心理倾向。

        我的研究还试图解释为什么禀赋效应是两倍?刚才我们说是两倍,那为什么是两倍?把我们模型那些抽象细节抛开,从直觉上来讲,我觉得可以很简单。那就是,禀赋效应的功能之一是遏制别人对你的物品的争夺,当我对物品评价越高,你就越不可能争夺成功。但是,究竟高要高到什么程度?其实,只需要高到两倍就可以了。原因是什么呢?大家看我这幅图,这是《完璧归赵》,是吧?蔺相如为了遏止秦王夺他的和氏璧,他是怎么做的呢?他对秦王说,你不要过来,你过来我的头和璧就马上撞碎在这柱子上。所以,想要阻止他人争夺你的东西,最有效的方法是什么?那就是我把这个东西毁掉!我把这个东西毁掉,我得不到,你也休想得到。所以我把这个办法叫做“玉碎”策略。换言之,你要捍卫一件物品,要灭熄他人的抢夺之心,并不需要付出更高的代价,最高的代价就是物品本身,你把它毁掉就行了。关键是,在什么时候你有决心把物品毁掉?如果是你先行展示决心(注:这意味着博弈是序贯的),那么当你对这个物品的评价是别人评价的两倍的时候,你就有决心把它毁掉。如果没有达到两倍,你就没有这个决心。当然大家有可能会说:我的评价要是三倍,我也有决心把它毁掉。没错!但是三倍对你来说有一个问题。什么问题呢?如果你愿意付出三倍代价去捍卫一件物品,当我们发生争夺冲突的时候,你就真的会付出三倍代价。虽然,其他人观察到你的三倍评价,本应尊重你而自行撤退,但万一有几个犯错误的人怎么办?如果他犯了错误,本来他不该争夺而且也争夺不过的,但他就犯错了,脑袋短路了,就来跟你争夺,结果你付出的代价就是三倍,而你本来只需要付出两倍的代价就可以了,现在你付出了三倍,这对你是不利的。所以,超过两倍以上的代价,对你来说都是不利。对物品怎样才算最优的评价?那就是,没有拥有时就按其实际价值评价,而拥有时就过高评价,最优的过高评价刚好是实际评价的2倍。这在我们模型当中是可以得到解释的。

        而且我觉得我的理论还可以解释我们观察到的其他现象。今天我来北京,碰巧有个朋友跟我同个航班,在机场我们聊了我今天要讲的内容。我说我这理论可以为很多现象提供一些解释,不一定是成功解释,但至少是一个新的视角,也未必不是真相。比如说,很多的选举制度、投票规则,都把2/3规定为门槛线。要通过或修改一项法律,往往要求同意人数达2/3,没有说达1/2,也没有说达3/4,也没有说达4/5。为什么要求是2/3?以前的理论有一些解释,比较权威的一种解释是普林斯顿大学的迪克西特提出来的,他说因为2/3能够兼顾灵活性和稳定性。如果门槛是1/2,法律制度就很容易被改变。有时只要有一个人改变,可能就超过1/2,制度就变了,这太灵活,不稳定。但如果门槛是3/4,75%,或者4/5,80%,要改变制度又太困难了,因为很难凑到那么多人一齐同意。这时候制度稳定性高,但缺乏灵活性。所以要在稳定性和灵活性之间平衡,2/3就是最好的。我的解释与此不同。我跟那位朋友讲,任何制度,有人从这个制度中得益,也有人从这个制度得不到好处,我们可以把从制度中得益的叫作既得利益群体。既得利益群体从制度中得到收益,他们就有一种禀赋效应在这里,所以为了维护这个制度,他们愿意投入两倍的资源;但对于要改变这个制度的人,他们不愿意投入两倍的资源来改变,他只愿意投入一倍的资源。这当中你会发现什么?如果1/3的人是既得利益者,那意味着2/3的人想改变制度,才刚好使得维护这个制度和改变这个制度的资源投入刚好可以平衡。所以这是为什么门槛会是2/3。我觉得人类社会很多经验规则,包括这里的2/3规则,其实是从过去到现在从很多种经验规则中竞争胜出的,这种经验规则背后应该有其道理可循。漫长的历史长人类社会大概也曾采用过其他规则,比如1/2规则,3/4规则,甚至其他古古怪怪的规则,但最后有生命力的规则是2/3。它的生命力可能来自迪克斯特所说的原因,也可能来我这里说的原因,也可能我们俩说的都是原因。总之,它能够在历史的拣选中胜出是有它的原因的。

        现在我再总结一下我究竟在讲什么。大家可能会觉得我讲得很散漫。其实,我想讲的核心思想,可以简单总结成这么几句。首先,我们会比别人更珍惜自己拥有的东西,这是我们的一种心理倾向。其次,经济学家认为像这样的对价值过度高估,是不明智的,是非理性的。最后,我讲过了,恰恰是这种不明智,塑造了我们社会中尊重他人权利的秩序。因为你对自己东西的珍惜,才有别人对你所有权的尊重。所以个人的非理性,在社会层面是产生了积极作用的。这就是我今天演讲的副标题为什么要叫做非理性行为成就人类社会。

        我要看一下讲了多长时间,好像剩下的时间已经不多,后面我就简单讲一讲。我们再看另外一个问题——合作的问题。我们人类有很多合作行动。2005年的《科学》杂志,列出了我们还没有解决的125个科学难题,其中第16个就是讲到人类的合作是怎么发展出来的。在过去,对合作已经有很多理论解释,我简单回顾一下。传统解释中,最早是群体选择理论。为什么会有合作呢?群体选择理论认为,因为动物有利他主义,合作有利于种群繁衍。但是,自上个世纪60年代,群体选择理论被生物学家批判之后,尤其像70年代道金斯的《自私的基因》出版之后,很多人的观念改变了。群体内利他的个体,不如自私的个体更有适存性,所以大家不认同群体选择理论了。之后就是亲缘选择理论,它是说动物的合作发生在亲属之间,这个从自私的基因来看待也是可以的。按照道金斯的说法,我们人就是基因控制的机器,是一个载体,所以人活着其实不是人要活着,而是基因它要活着,基因要扩大它的基因池。对于我们的亲属,我们身上有共同的基因,所以亲属发展得好,也等于我们的基因在扩张,所以我们会对亲人好,这可以解释亲人的合作。但是这个理论没法解释亲缘个体之外的合作。所以后来人们又提出了对等合作理论,或者叫互惠利他理论。这是在一个重复博弈的框架当中,虽然我们不是亲戚,但是因为我们会长期反复见面,今天我帮你,明天你可以帮我。为什么叫互惠利他,其实就是一个对等的交易,迂回地为自己争取利益。但这个理论不能解释一次性合作,或者陌生人之间的合作,这些合作情景不是重复的。我今天跟你交易一场,以后再没机会见面,我为什么还要跟你合作?这没法解释。所以最近三十年又产生了一些新的理论来解释,比如直接互惠理论,间接互惠理论,还有代价信号理论等等。直接互惠就是对等交易,就是刚才讲的对等合作,这在大群体当中是比较麻烦的。如果群体比较大,每个人重复见面的机会就不是很多,人们可能就会产生一些背叛。为了克服这个问题,才有了间接互惠理论,就是印象分模型。这个理论说,你们两个见面机会不多,也没有关系,每次你跟别人交易之后,别人就会给你贴一个标签,这个人是好是坏,能不能合作。然后这个标签会在群体里面扩散,所以下次虽然你我不会再见,但你走到其他地方别人都能看见你的标签,要是发现你以前老是坑蒙拐骗,人们就会拒绝跟你合作,对吧?这就是印象分模型。它展示了声誉在我们社会中的扩散。既然我们的声誉可以扩散,意味着什么?我们有时候就会故意地、刻意的塑造我们的声誉,以便获得更多的合作机会,塑造声誉的代价越大,声誉的信号就越强。这就是有代价的信号理论。这都是过去的解释。