2021年1月31日

每天都进步#397 博弈论(五)诚信是选择重复博弈的态度

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊博弈论。昨天我们说到了一场由Robert Marshall Axelrod 所举办的比赛,这个比赛是叫做重复性囚徒困境电脑程式锦标赛。换句话说就是,囚徒困境不是只比一场就结束,而是会连续进行两百个回合,并且将两百个回合的分数加起来,看谁获得的分数最高谁就获胜。另外,这个也不是一个人类与人类之间的博弈,而是用电脑设计出一段程序出来,并且运用程序与程序之间互相博弈。这其实代表了一件事,这个锦标赛的目的,不是看谁的博弈能力最强,而是哪一种策略是最好的策略。

有趣的是,如果我们撇开这一个电脑程序比赛,而是回归到人身上来看的话,同样的重复性囚徒困境,一个人又会采取什么样的策略呢?难道真的会因为一次性的囚徒困境中表现的那样,选择对自己最有利的背叛吗?然后根据纳什均衡的逻辑,变成大家双输?其实并不是的,因为这一次比赛所进行的,不是一次性的博弈,而是会有多次的重复性博弈。当博弈变成重复性博弈之后,人们就会倾向于选择合作。因为真的双方合作的话,是会带来最高分的。而一旦自己背叛了的话,那么这个不诚信的因子就会烙印在自己身上,别人在下一次博弈的时候也不会选择合作了。既然诚信对整个长远来看的话比较有利,自然会倾向于选择诚信,选择合作。

讲到这里,我们似乎从囚徒困境之中看到一个很有趣的,可以运用在现实生活中的博弈策略,那就是尽量将一次性博弈,变成重复性博弈。来讲两个例子,第一个例子是,在一个巴刹菜市场里面,有一个在卖鱼的小贩。一个妇女走向前去,询问其中一条鱼怎么卖的时候,这个小贩说:五十块钱一kilo妇女说:很贵啊。可是小贩却说:“aunty,不贵啦,这是石斑,是这样的价钱的。我都在这边摆摊这么久了,你还不相信我吗?于是,这个妇女就说:好啦好啦,我就买下这条鱼。

换一个例子,第二个例子是,在一个旅游景点附近开的一间海鲜餐厅,一个妇女一样走向前,询问其中一条鱼怎么卖的时候,这个餐厅老板二话不说,捞起来鱼甩在地上,然后啪啪两下敲死了鱼之后,才来说:两百块钱一kilo,你要清蒸还是红烧?看着在地上不能动的鱼,还有老板手上拿着的那支拍死鱼的铁锤子,这个妇女只好选择怎么煮了,不付钱的话,恐怕躺在地上不能动的就是她了。

我们来看看这两个例子,为什么有那么大的差别?原因就在于这两个例子是不一样性质的博弈。第一个例子是重复性博弈,小贩在这个菜市场摆摊摆了很久,也会一直摆下去,所以自然不愿意坑顾客,否则的话,这些aunty们就不会再来帮衬他了。更可怕的是,这些aunty还会八卦起来,一起叫别人不要光顾他,他就完蛋了。但是,第二个例子的餐厅老板,做的就是游客的生意,是属于一次性博弈的那种。既然只有那么一次机会,对老板来说最好的策略当然是痛宰每个上门的顾客,反正每一个人都不会知道他是否诚信。

所以,与其花时间和成本来宣传诚信经商,倒不如直接将一次性博弈的旅游区变成重复性博弈。开发一个可以让公众点评的平台,好像lazadashopee这样可以给好评还是差评的,就直接将一次性博弈变成了重复性博弈了。商家就不敢不诚信,因为不诚信等于让他的店获得差评,未来就不会有人愿意来帮衬了。所以说啊,诚信是什么?根本不是道德层面的事情,诚信就是,你要不要为了未来可以溪水长流,持续经营的前提下,牺牲这一次的少许盈利。

因此,到餐厅吃饭的时候,要说你家就住在隔壁,因为这代表了你很有可能会经常来。在外地旅游的时候,要尽可能的假装是本地人。这样子做都是为了让自己和商家的博弈,从一次性博弈,变成重复性博弈。让对方察觉到,你很有可能会回去拜访他,他就会愿意给你提供比较诚信的服务。千万不要说,你就要搬家了,这是最后一次来到这里。因为这等于告诉老板说,你的博弈是重复性博弈中的最后一次,所以他能够采取的最优策略将会是,痛宰了你啊。

最后要问大家的问题就是,你认为还有什么办法可以有效的提升商人们的诚信程度呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月30日

每天都进步#396 博弈论(四)重复囚徒困境

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊博弈论。昨天我们说到了,Robert Marshall Axelrod为了研究博弈论和囚徒困境,就设计出了一个重复囚徒困境的游戏出来。这个游戏让参与者双方选择要合作还是要背叛,如果双方都合作的话,就一起拿3分,而如果双方都背叛的话,就一起拿1分。但是假如其中一方选择合作,另一方选择背叛,那么就让选择背叛的那个获得5分,选择合作的那个拿0分。但是,之前的纳什均衡的理论实在是太过于强大,也让大家都相信在这种规则之下的囚徒困境,参与者双方是会一起选择背叛的。于是,Axelrod久改良了这个囚徒困境的游戏,设计了会重复博弈的机制。也就是说,这个游戏不是只是玩一个回合,而是玩200个回合。那么背叛就会被记得,然后也会被报复。Axelrod想看看,在这个规则之下,人们采取怎样的策略才会比较好。没错,Axelrod要找的,不是博弈高手,而是一个策略,所以他举办的比赛,是电脑程式比赛。参赛者必须写出一段程式,设计一个算法,然后由电脑程式之间互相pk,看看谁设计出来的程式可以得到最高分。

Axelrod设计出了这个游戏,并且举办了比赛之后,就邀请了14个人来参赛,要他们提供一个策略,以便可以在这个重复囚徒困境中得到最高的分数。之后呢,Axelrod还加入了一个随机的策略,就是他会选择合作还是背叛完全是随机的这种策略。一共15个策略,每个策略互相抓对pk,还要再加上和自己pk,一共比了16场比赛,累积分数起来之后,发现到一个很有趣的现象。排名第一的程式,是一款由Anatol Rapoport设计的程式,名字叫做Tit for Tat。这个程式超级简单,写在Basic语言之中只有四行。这段程式的运行逻辑也很简单,首先第一个回合选择合作,然后第二个回合开始就和对手上一个回合所采取的策略一样。也就是说,你上一个回合和我合作的话,我这个回合就和你合作。你上一个回合背叛我的话,这一个回合我就背叛你。

设计 Tit for Tat 策略的 Anatol Rapoport 的肖像
图片来源:By Source, Fair use, https://en.wikipedia.org/w/index.php?curid=31751529

没错,就是这么简单的一个策略,吊打所有其他的策略,获得了冠军。而更有趣的一点是,再观察了这个比赛结果之后,排名靠前的策略,基本上都有一个特点,那就是善良。什么叫善良呢?这只是电脑程式啊,哪里会有人性在里面的。原来,这个所谓的善良指的就是,不会首先背叛,一旦确立了合作关系,就很容易一直合作下去,直到被别人背叛。

这个比赛的结果,让Axelrod觉得很好玩,甚至在他公布了这个结果之后,引发了学术界的激烈讨论。这时候,Axelrod就打铁趁热,宣布举办第二次比赛,广泛邀请学术界里面有兴趣的人士报名参加,给出自己认为的,能够在同样规则的重复囚徒困境中获胜的程式。Axelrod就是想要看看,Tit for Tat的获胜,又或者说,善良程式的获胜,究竟是一个巧合,还是一个真的有效的策略。

由于有第一次比赛的铺垫,所以第二次比赛响应的人比较多,总共有62个策略参加比赛,当然,这62个策略里面也包括了准备卫冕冠军宝座的Tit for Tat策略。另外,还包括了好几个其他善良型的策略,比如被背叛两次才报复一次的策略,又或者是一直合作下去的策略,又或者是只要被背叛一次之后就永远背叛下去的策略,甚至是很多特地设计出来针对Tit for Tat的策略。结果,Tit for Tat还是这一次比赛的冠军。

连续两次拿到冠军就不是偶然了,于是,Axelrod再次举办第三次比赛。这次比赛的内容改变了,不再是要在得到冠军,而是要针对Tit for Tat这个策略所设计出来的策略,结果,Tit for Tat的地位依然难以动摇。

这其实让我想起了孔子的那一段以德报怨的典故。或曰:以德报怨,何如?子曰:何以报德?以直报怨,以德报德。这才是孔子对于以德报怨的解释,他根本不赞成以德报怨,因为如果以德报怨了,那么对你好的人怎么办呢?所以,对付仇人,要用正直的心态对待他,对有恩德的人,才对他好。这是一个君子所为,也正是这个冠军程式Tit for Tat教会我们的策略,首先你需要善良,永远不要先背叛。然后呢,在遭遇背叛之后,就要报复回来。但是假如对方释放出善意了,那么也要原谅对方,继续和对方合作。

最后要问大家的问题就是,你对于以德报怨这句成语的看法是怎样子的呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月29日

每天都进步#395 博弈论(三)为什么囚徒困境不能用在现实?

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊博弈论。这两天我们说到了博弈论中最出名的例子,囚徒困境,也说了这囚徒困境之中的一个现象,名字叫做纳什均衡。或许,在博弈论里面,纳什均衡才是真正用来探讨每一场博弈之间,整个情形会怎么变换的一个模型。有趣的是,纳什均衡虽然说是一个均衡,可是却还是会因为人为的影响而被破坏,只不过这时候的认为影响是直接改变博弈规则,而不是参与者之间的策略选择。

那么说到这个囚徒困境和纳什均衡的话,我们今天就来说说两个方面的课题,第一个层面的课题是一个小课题,那就是囚徒困境的结论其实很好的解释了为什么在大多数的国家之中,认罪减刑是不可行的方案,也是被禁止的方案。原因正是因为囚徒困境所带来的结论,坦白者可以获得减刑,那么犯罪者就会尝试坦白。那么要是万一,抓到的两个嫌疑犯之间,有一个是真的无辜的呢?如果他真的是无辜的,那么他就应该被释放,而不是参与囚徒困境这样的选择。尤其还要是,一个无辜者不会认罪,又或者说,他也无法坦白认罪啊。

毕竟我们无法想象到,一个无辜者会为了减刑而认罪。到时候警察问说:你认不认罪?无辜者说:我认,释放我吧。警察这时候说:认罪吗,好吧,告诉我你是怎么杀他的?无辜者说:哦,我开枪射死他的。警察这时候满脸问号说:可是对方明明是被刀刺死的。

你看,一个无辜者可是连认罪都没办法认罪的。所以,如果这个坦白减刑,抗拒从严的规则真的实行的话,那么其实并不是在期许用纳什均衡来惩罚坏人,而是会因为无辜者的牵连而导致他们需要被严厉惩罚啊。到时候,真正的坏人反而可以获得减刑逍遥法外,真正的好人却要无辜入狱,这就违反了司法公正的初衷了。

这个为什么现实中不可以用囚徒困境的原因也就说到了这里,至于第二个层次呢,则是选择用另一个角度来切入。那就是博弈,其实不会只发生一次,而是会发生很多次的。应该说,哪怕这一次参与博弈的两个嫌疑犯AB,在坦白还是沉默之后,生活还是需要继续下去,未来还是会相遇。因此,在你选择背叛,或者说坦白认罪的那一刹那,得知结果之后,你也会清楚的知道对方的选择。也因此选择背叛并且获利不见得是你最优的选择,因为你在日后就失去了这一个人的信任。

Robert Marshall Axelrod 的肖像
图片来源:https://alchetron.com/Robert-Axelrod

那么什么才是最好的选择呢?一个政治学家为了回答这一个问题,也是为了进一步探讨关于囚徒困境的状况,他设计了一个比赛。这个政治学家的名字叫做Robert Marshall Axelrod,他所设计的游戏如下,在一个游戏之中,参与者双方必须要选择,合作还是背叛。如果双方选择合作,那么获得的利益是最大的,每个人得到3分,总计6分。但是,假如一方选择合作,一方选择背叛,那么选择背叛的那个人得到5分,选择合作的那个人0分。至于如果两个都选择背叛的话,那么就都得到1分,总计2分。这个囚徒困境的设计,和我们昨天所说的那个囚徒困境是差不多一样的,按照纳什均衡的理论来说也是如此,纳什均衡会出现在双方都背叛的那个最糟糕的情形。但是呢,Axelrod做了一个小小的改变,他让这个囚徒困境重复两百个回合,然后,在200个回合之后,谁最后的分数高,就谁获胜。这个游戏,他命名为重复囚徒困境。更好玩的是,当时候的时代背景是1970年代左右,正是电脑刚刚盛行崛起的时候。所以,Axelrod就办了一个比赛,这个比赛不是靠两个选手真的在那边玩两百场囚徒困境,而是用电脑写出一段程序出来,由这个程序来参与比赛。

简单来说,Axelrod并不是要找出谁是博弈高手,而是要找出可以在这种重复囚徒困境的环境中,得到最多分数的一种策略。也就是说,他要找的是一个算法,是一个程序,是一种策略,而不是一个人。当时候,Axelrod找来了14名专家,分别来自心理学、经济学、政治学、数学、社会学这五个领域。然后呢,Axelrod再贡献一个完全随机的策略,一共15个策略。这15个策略就会和包括自己在内总共16个策略展开这个200回合的重复囚徒困境比赛。看看哪一个策略可以得到最高分。

那么,这个比赛的结果会是如何的呢?今天得篇幅用完了,明天才来和大家揭晓。

最后要问大家的问题就是,如果你受邀请参加这个重复囚徒困境比赛的话,你会设计出一个怎样的策略或者说程序呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月28日

每天都进步#394 博弈论(二)囚徒困境怎么破?纳什均衡

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊博弈论。昨天我们说到了博弈论中最出名的例子,囚徒困境。同时呢,我们也说了囚徒困境这个例子,其实很好的说明了一个现象,叫做纳什均衡(Nash Equilibrium)。这里重新复习一下什么叫做纳什均衡,那就是一个平衡的状况,在这个状况之中,无论谁单方面改变策略都会面临到损失,所以谁都不会改变策略。这样子的平衡状况,就叫做纳什均衡。有趣的是,纳什均衡不一定只有一个,昨天我们说的那个囚徒困境的例子只有一个纳什均衡,但是那是因为参与这个博弈的双方可以做出的选择不多,只有两个,要嘛坦白认罪,要嘛沉默不认。但是,假如参与博弈的双方可以做出的选择变多,那么就很有可能产生出不止一个纳什均衡,无论哪一个均衡,都是稳定的,都是会让参与博弈的双方无论谁单方面改变策略都会面临到损失。

好了,回到我们昨天说的那个囚徒困境。站在警察或者是全社会这个好人的角度来看的话,让两个罪犯同时认罪对我们来说是一件好事,因为我们可以让两个坏人关最久的时间。但是,如果站在坏人的角度来看的话,比如说这两个嫌疑犯所在的黑社会里面的大哥来说,就不是一件好事了。所以,如果这个黑社会大哥学过博弈论的话,他就会想要做出什么,来让两个人都认罪的这个纳什均衡被破坏掉,变成一个对他来说是好的纳什均衡。

那么这个黑社会大哥要怎么做呢?很简单,增加这两个嫌疑犯坦白认罪的成本。这个黑社会大哥大可以对这两个嫌疑犯说:不要怕,你们就沉默不认罪,这样子一年就可以出来了。但是假如谁背叛我们,我就会砍掉他和他的全家,抄了他所有的家产。到时候你十年期满释放出来之后,我就把他的家产全部给你,另外我在补贴你十万块钱。这听起来是不是很像我们看戏的时候听来的对白啊?我们会不择手段的对付二五仔,背叛我们的人没有好下场,比警察还要凄惨。为什么会有这种对白?在我还小的时候,以为这就是黑社会的道义,其实是,他们也隐隐约约知道博弈论,知道增加坦白认罪的成本,就可以让他的手下不出卖他。

没错,一旦这个坦白认罪的成本变了,纳什均衡就会改变。现在如果双方都认罪,除了要进监狱7年以外,还要牺牲自己的家人,在释放出来之后还要承担被大哥追杀的风险。但是假如选择沉默不认的话,就只需要坐牢10年。这等于监禁3年和牺牲家人与被追杀的风险中二选一。估计,被义气洗昏了头脑的人,都会选择监禁3年。这样一来,之前的纳什均衡就会被打破,新的平衡就会形成,变成两个人都沉默不认罪。而一旦这个谁都沉默不认罪的新平衡达成之后,无论是谁,想要单方面改变策略,就变成了从监禁1年变成无罪释放,但是却要面临被大哥追杀全家的境地。这等于用1年的监禁换被追杀的结果,之前3年的监禁都不换,何况是现在这个1年的监禁呢?所以这对于嫌疑犯来说就更加不能接受了,因此没有人会改变策略,新的纳什均衡就会被达成。

所以啊,当你学会了博弈论,当你了解了纳什均衡之后,你就会知道,要打破现状的办法就是,想办法改变掉这个平衡。虽然逻辑就是简单的对于你不想要的状况,增加它的成本或者是减少它的利益。又或者是倒转过来,对于你想要的状况,减少它的成本,或者是增加它的利益。只要能够重新调整之后,或许对你来说坏的纳什均衡就会被破坏,重新建立出一个对你来说好的纳什均衡。而有趣的是,这个干预并不是只有你一个人可以做罢了,是无论哪一方都可以加入进来的。因此对你来说好的纳什均衡可能对别人来说是坏的纳什均衡,那么他也会出招来改变这个纳什均衡。因此,当黑社会老大威胁了他的小弟之后,警察就会对小弟说:不要怕,你的家人我来保护,只要你愿意配合的话,我会给你一个全新的身份,让你远走高飞,重新开始新的生活。这样一来,坦白认罪的成本,被追杀就被抵消掉了,纳什均衡再次被打破,再次变成了对警察和社会有利的纳什均衡。

最后要问大家的问题就是,你还有什么例子来证明纳什均衡的存在吗?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月27日

每天都进步#393 博弈论(一)囚徒困境 Prisoner's Dilemma

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们来聊一个新的系列,叫做博弈论。博弈论,也被叫做赛局理论,英文名字叫做Game Theory。这是一个很有趣的理论,也是一个可以在生活中促发你思考的理论。这个博弈论可以说是经济学中的一个分支,也可以说是数学中的一个分支。因为在博弈论里面,确实用到大量的数学公式,逻辑推理等等和数学有关的技巧。但是于此同时,博弈论讨论的,却是现实生活中两个人最有可能做出的举动,这和经济学的定义,研究人们在一般情况下会怎样采取最符合自己利益的举动的科学,基本上很吻合。不过,博弈论到底是数学的分支还是经济学的分支基本上不重要。我们要讨论的,是博弈论本身。

讲到博弈论,我就一定要来讲在博弈论中最出名一个例子,叫做囚徒困境(Prisoner's Dilemma)。其实所谓的囚徒困境是这样子的,假设警察逮捕了两个嫌疑犯,我们就叫他们做A嫌疑犯和B嫌疑犯好了。这时候,警察就将这两名嫌疑犯分开关押,不让他们有串口供或者是商量的机会。然后呢,警察就分别对这两个嫌疑人说:如果你们两个人都认罪的话,那么我会向法官求情,将你们两个人的入狱服刑期限减少到7年。而如果你们两个都沉默不认罪的话,那么我们虽然没有证据起诉你,但是还是可以告你私闯民宅,所以你们两个人都还是要入狱1年。但是假如,如果你们其中一个人坦白认罪,另一个人沉默不认罪的话。那么我可以做主,把认罪的那个人放了,将另外一个不认罪的家伙送进监狱。这时候他可就要面临十年的监狱生活。所以,你想想吧,要不要认罪?

好,刚才的那一段故事可能说得你听得不是很懂整个关键,但是你现在看上面的那个表就一目了然了。两个都坦白认罪的话,直接两人送监狱7年。一个坦白认罪一个沉默不认的话,那么坦白认罪的那个被释放,沉默不认的那个进监狱10年。但是假如两个都沉默不认罪的话,两个人只要进监狱1年就可以了。用上帝视角来看这个表的话,然后再将两个人要进监狱的年份加起来,我们就可以得到结论说只要这两个嫌疑犯都不认罪的话,那么他们就有最好的那个结果,也就是两个人加起来只需要进监狱总共2年就可以了,这应该是最皆大欢喜的结果了吧。可是呢,博弈论却告诉了我们,如果场景真的是这样的话,那么结果就会是两个人都是坦白认罪,搞到最后就是大家一起进监狱7年,总共合计起来14年,是最差的结果。

这是怎么一回事呢?原因就在于我们必须要回到个人的视角上面来看这一个问题。你看,如果从嫌疑犯A的角度来看的话,因为他不知道B会不会认罪,所以就只好两种情况都考虑进去看看咯。先假设B坦白认罪,那么这时候他沉默不认的话,他就要进监狱10年,但是如果他坦白认罪的话,他就只需要进监狱7年而已,这等于他选择坦白认罪的话会比较好。再来假设B沉默不认罪,这时候他如果选择沉默不认得话,还是要进监狱1年,但是如果他坦白认罪的话,那么他就会被无罪释放,这也等于他选择坦白认罪的话会比较好。所以,如果我们回到B的角度来看的话,会得到一摸一样的结论,也就是代表说,这两个嫌疑犯,无论是A还是B,都会倾向于选择坦白认罪,因为这样的选择对他们来说是最好的。只不过,当大家都这么选择的时候,会造成的结果是对大家都最不好的结果罢了。

这就是囚徒困境的场景,也是博弈论中最出名的题目。然而,每次提到博弈论的时候,我所知道的知识也就只有这个囚徒困境罢了。直到我真正的跑去研究博弈论,才知道了奠定博弈论中最重要的一个知识点,纳什均衡(Nash Equilibrium)。而这个囚徒困境,只不过正好是纳什均衡中的一个例子。

那么到底什么是纳什均衡?简单来说就是,当博弈到一个阶段之后,大家就会进入一个稳定的状况,这时候,无论是谁单方面改变策略,都会面临到损失,这个稳定的状态就叫做纳什均衡。就好像刚才所讲的囚徒困境一样,当两个都选择坦白认罪之后,无论谁单方面改变策略,变成沉默不认,都是会损失的。而在均衡还没有达成的时候,就比如我们直觉觉得最优的选择,大家都选择沉默不认罪的时候,当某一个人单方面改变策略的话,那么他会获得利益,所以他就会选择改变。因此,嫌疑犯A从沉默不认变坦白认罪的时候,他就从进监狱1年变成无罪释放,对他来说有利,所以他会改变策略。这时候就变成了A坦白而B沉默。这时候如果B也改变策略,从沉默变坦白,他也能从进监狱10年变成进监狱7年,对他来说也是有好处的,所以他也会改变策略。但是至此,每个人变成坦白之后,无论是谁,单方面改变策略都会面临到损失,那么他们就不会改变策略了,所以均衡就达成了,这就是纳什均衡。

最后要问大家的问题就是,你对於博弈论有着什么样的认知呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月26日

每天都进步#392 原谅与宽恕

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

昨天我们尝试把角度从外在的系统,拉近来看内在的自己,所以我们聊了一个关于怎么不要停留在空泛的概念上面的方法,进一步变成细节,从而可以延伸出真正可以实际操作的行动。今天呢,我们继续往内拉,在拉近多一点,拉到内心中去。今天我们来聊一个很扎心的课题,原谅。

说到原谅或者是宽恕,我们直觉想到的就是,别人做错了一件事情,惹到我们不高兴,或者是更严重点的,愤怒了。这时候的我们,在道德水准上被要求的是,要宽宏大量,要宽恕对方,要原谅对方。仿佛当初的不高兴、愤怒、受伤都是短暂的,都是无所谓的。但是其实呢,今天我要告诉你的是,不对,你当初所受到的伤害、你当初感觉到的愤怒、你当初的不高兴,都是真实的,而且还是会延续很久的。然而,如果你不会原谅和宽恕的话,那么这一份伤害与愤怒,就会一直跟随着你,直到你原谅对方为止。所以,要你宽宏大量,要你宽恕对方,要你原谅对方的目的,不是为了让你当一个圣人,而是要你放过你自己啊。

别人只是伤害了你一次,为什么你要在接下来那么久的时间持续的伤害你自己呢?那是因为,很有可能在你的内心之中,有着这么一股愤怒,有着一种无法释怀,这种愤怒与不理解,会侵蚀你自己的内心,从而让你一次又一次的遭遇到痛苦,然后一次又一次的受伤。

在咨商心理学界里面,有一个经典案例。有一个女士在年轻的时候,遭遇到了性侵。这一次的侵犯让她的心理受了很严重的伤害,十几年了都无法介怀,她没有办法谈恋爱,不敢交男朋友,更别说踏入婚姻了。于是,这个女士踏进了心理咨商师的门口,希望心理学家给她解脱。在心理学家陪伴她好一阵子之后,慢慢解开她的心结的时候,在某一个特定的时机,这个心理学家就问这个女士:那个坏蛋强暴了你一次,你为什么强暴自己十几年呢?

这是不是和我们所受到的创伤很像?别人用恶意伤害我们一次,为什么我们要抱着这个伤害,持续的让自己痛苦那么久呢?而每次往往谈到这里的时候,我们的心里面可能会有一股小声音说,因为对方并没有道歉,因为对方并没有悔意,所以他不值得被我原谅,他不值得被我宽恕。似乎只要对方真正的来和我们道歉,并且付出相对应的赔偿之后,我们就能够原谅对方,我们就能够宽恕对方。但是,现实真的会是如此吗?你回想一下,当初他伤害你的时候,你是不是当场就愤怒了?你是不是当场就受伤了?那么他有没有马上道歉,有没有马上给你赔偿?如果他当初都没有这么做的话,为什么今天,又或者是未来的哪一天,会这么做呢?

在我们受伤之后,我们每时每刻的都在想,如果对方能够怎样怎样,那么我就会原谅他了。或许,不需要上升到这么高的程度,我们日常生活中就充满了这样的例子。比如,如果老板不骂我,我就会开心了。只要我的伴侣多关心一下我,我就幸福了。只要我的父母肯定我的努力,我就满足了。只要我的孩子能够听话,我就放心了。你看这些话语,是不是和我们的OS很像,是不是和很多人心里面的感觉很像?但是,这样的想法,其实是建立在别人的行动上面的。也就是说,如果对方不按照你的期望来行动的话,那么你是不是就永远快乐不起来?这也就代表说,你的幸福与快乐,其实是建立在别人的行动上面的,更可怕的是,这还要是有很大的概率,别人是不会这么行动的。那么是不是代表了,你无法掌握自己的人生,你无法让自己快乐与幸福,因为你的幸福都握在别人的手上。

所以,我们需要的不是原谅,因为原谅这个词,仿佛给人的感觉就是要对方做出了道歉之后,我们才能够给与原谅。我们真正需要的是放下,放下你的执着,放下你想要别人怎样的心思,放下一切会让你不开心的事情。只有你真正做到了放下,你才能够紧紧握住让自己快乐的关键因素。自己的快乐,自己的幸福,要自己握住,而不是把他交出去。祝福你,可以不需要原谅别人,因为你已经放下了这一段心结。

最后要问大家的问题就是,你有没有无法释怀的事情,等着别人的道歉呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著     

2021年1月25日

每天都进步#391 怎么从说说而已变成实际行动

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

这几天一直和大家聊了关于系统的课题,感觉都是一个组织应该要怎么做,又或者身为一个组织的设计者要怎么设计组织的课题。感觉上,很多的人,包括你我,都只是参与进一个系统的人,我们的位阶没有到一个可以指挥组织或者是影响系统的设计。那么对于我们这些普通人来说,又要怎么做才会比较好呢?其实,个人层面也是可以设计系统的。其中一个最容易影响到的就是,对自己的承诺,以及别人的承诺。

怎么说呢?你有没有这样子的经验,明明说了要减肥,要控制饮食,可是到了该吃的时候还是照常吃,有美食诱惑你的时候还是情不自禁的沦落。又或者说,总有一天我要学会日语或是韩语,到时候就可以爽看动漫不用看字幕或者是和韩国oppa的交流就没有问题了。不过呢,你的外语学习计划一天拖一天,今天没有时间,明天很忙,后天工作回来很累。结果到最后都不知道什么时候才可以开始你的学日语或韩语的计划。不说你自己了,说说别人吧。是不是也有一种老朋友见面之后,就说改天我们一起喝茶吧?结果,这个改天也不知道什么时候才会来。

这给人的感觉就是,大家很努力的想要做一件事,可是到最后,这件事情都只是沦落到了说说而已的地步。要减肥?说说而已啦。要学外语?说说而已啦。要喝茶?说说而已啦。那么如果你真的很想要克服这种说说而已的状况,你应该要怎么做呢?注意哦,以下所说的只是在你想要真的有所行动,而不是说说而已的状况。至于那些你真的要敷衍过去的情况,你真的要只是说说而已就好的状况,自然是不适合用这种技巧的。毕竟,人总是有些时候是只想要敷衍罢了的。

好了,话说回来,如果你真的想要有所行动的话,而不是只是说说而已的话,怎么办?其实答案已经说出来了,那就是有所行动。在你信心满满要减肥的时候,立志要学外语的时候,或者是兴致勃勃的聊到了喝茶的时候。你只需要再进一步,问一问具体接下来的行动是什么。要减肥吗?那么今天晚餐要吃什么?又或者等下傍晚要做些什么运动?要学外语吗?那么马上搜寻一个学外语的课程详情,看看要选哪一个。要喝茶吗?那么就马上问说,那么下个周末你们大家得空吗?

就是这样,如果你问了自己这个问题,晚餐要吃什么的时候,无论你再怎么选,又或者无论你对健康的概念有多薄弱都好,你都应该不会选麦当劳或者是肯德基来作为你的晚餐吧。所以,你所选择的食物,很有可能就是比你本来要吃的食物好上那么一点点。别小看这一点点,应该每一个一点点都是一种进步啊,再加上每次当你有这个要减肥的念头,就为了自己的健康做出一点点贡献之后,累积起来,你的健康就会得到了很大的改善了。所以,你就从说说而已,变成了一种行动,这无疑是一个很不错的进步。

不管是减肥,还是要学外语,还是要喝茶,这种从说说而已,到进一步的行动,就是一个很好的进步。因为,在说说而已的时候,只是一个概念。概念虽然很重要,但是也是很空泛的。没有概念无法成事,这句话是对的,你总不可能在完全不想减肥的时候,会想到控制饮食这一回事。所以,要先拥有一个概念完全是正确的事。然而很多人就卡在了这一步,只有概念。只有概念当然是不行的,因为这就会变得很空泛。只有概念,人会不知道应该怎么行动。就好像一直说我要减肥,可是却完全不知道应该要做什么才能减肥,所以只好继续该吃就吃。

然而,当这种概念进一步问出了下一步的行动之后,你就赋予了他一个细节。而当一个事情有了一个细节之后,就会比较容易吸引出下一步的行动,并且真正的去执行它。注意哦,并不是要你逼迫其他人给予承诺,而是要求一个细节。逼别人给承诺,那很容易会造成别人反感,给别人一个细节,那就比较容易引导对方,给出细节的想象,进而给出能够实际操作的行动。

最后要问大家的问题就是,你愿不愿意为你目前做出的概念,给出一个细节,从而给出一个能够实际操作的行动呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著    

2021年1月24日

每天都进步#390 系统(七)怎样说服人买单

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊系统。聊了那么久的系统,我们都没有说到建立系统其中一个最重要的因素,那就是,谁来买单。确实,无论建立一个系统的初衷是什么,到最后总是会牵涉到一个问题,这个系统要建立出来,不可能是白白建立出来的,而是要付出人力物力才有可能建立出来。既然要付出人力和物力,自然要给钱,付出成本。那么,这个成本由谁来承担呢?如果是组织本身自己建立的系统,自然是由他们买单。但是假如是由外部人士建立的系统,然后尝试推销这个系统给别人,解决他们的问题的话,那么又要怎么推销呢?

要回答这个问题,估计就要在商言商。一个组织会愿意为一个系统买单,自然是因为这个系统帮助到他们。可能这个帮助是提升了他们的收益,也有可能是降低了他们的成本。但是无论是哪一个都好,只要这笔帐算出来划算的话,基本上就可以期望成交了。但是,有时候,这笔账可是不容易算的啊。不信,我们来看看下面这个例子。

David Olds 的肖像
图片来源:https://spartanburgnursefamilypartnership.org/about/

这是在1970年代的时候所发生的事情,在美国有一个叫做David Olds的人,发现到很多的社会案件都是因为贫困女性对于从怀孕到生产到照顾孩子没有足够的知识引起的,而这些贫困女性要搞定自己的生活都已经有问题了,就不用指望他们会积极主动的去寻找育婴的知识。所以才会造成很多虐待儿童、婴儿死亡、甚至于儿童犯罪等状况的发生。于是,David Olds就说,既然这些社会案件的造成原因是贫困女性育婴知识的缺乏,那么就给他们配备一个教练好了。所以,David Olds发起了这个叫做Nurse-Family Partnership的计划,把专业的医护人员,也就是护士,和即将生育贫困的女性一一配对。于是呢,从怀孕到小孩出生后长大到两岁为止,医护人员都会定期的访问这个新手妈妈,告诉她怀孕期间要注意什么、小孩出生以后要怎么带、新手妈妈的心理建设要怎么做、妈妈或者是小孩半夜睡不好要怎么办、小孩哭闹要怎么办、怎样喂母乳、什么时候断奶、断奶之后要给小孩吃什么等等这些育婴知识。

这样下来,估计这些新手妈妈们就会懂得要怎么带孩子,以及怎么带好孩子,从而减少各种和妈妈不会带孩子从而引发的社会案件。但是,这个计划听起来很好,可是却有一个致命伤,那就是,没有人愿意买单啊。首先,配备一个专业的护士在接近三年的时间定期访问一个新手妈妈,这不可能单纯靠爱心就做到的,一定还要有薪水才可以,至少车马费和辛苦费也一定要有吧。根据David Olds的估算,每应付一个新手妈妈,要花的成本呢大概就是一万美元。这可不是一个小数字,而如果单纯靠善心人士的捐款的话,这个计划就没有可能做大。再来,这个计划既然帮助了新手妈妈,也帮助了降低社会案件,自然会为全社会带来更好的综合效益。根据预测估算,在这个计划中每投入一美元,就会为这个社会产生大概6.5美元的总和效益。既然是有这样的好处的话,那么为什么不要直接找政府来买单呢?

于是,David Olds就和政府谈判,希望得到政府的支持,让这个计划真正做大,帮助到更多的人。他说服政府的方式,就是用这个经济效益的模式。这个计划可以让新生儿童不那么容易生病,所以就让医院省了钱。这个计划还可以让妇女不虐待儿童,也因此就不犯罪,司法系统省了钱。这个计划还让贫困家庭的状况获得了改善,因为这些妈妈们知道,生了孩子之后最好隔开18个月才来怀第二胎,这样对健康比较好,对经济负担也比较小,这样子的话等于让福利系统省了钱。这样子的说服看起来很不错,但是问题却是,这里所说的每一个政府机构都是各自为政的啊,不可以把他们看成一个叫做政府的整体。再来,政府都是比较保守的,你所说的这些好处听起来很不错,但是你又怎么确定它确实有效呢?

到最后,经过了长年累月的谈判和协商之后,终于在2016年的时候,找到了一个解决办法。首先就是由一个慈善机构出资三千万美元,在South Carolina这个州帮助三千个贫困妇女,这些贫困妇女由政府随机挑选,同时还要分批进行,相当于做一个超大型的随机实验。然后呢,在完成了这个计划之后,政府就会追踪并且查看各项指标,看看是否真的好像David Olds说的这么好。如果这个计划真的能够让政府省钱的话,那么在未来就会由政府接管这个计划,永久性的买单。

这个计划就说到这里。听完以后,我感觉到感概的是,美国的政府就是拥有科学思维。在一个人怎么吹嘘自己的系统很好的时候,没有脑子一热就拍板决定,或者是死板固执的反对到底,而是选用了一个比较科学的方法,采用随机测试,小规模的推行来看看效果是否真的那么好。所以,在你要说服别人买单的时候,或许也是应该用这种科学的方式,直接用实验和数据说话,告诉别人,你的系统就是可以解决问题。系统这一个系列就讲到这里结束,明天我们聊别的课题。

最后要问大家的问题就是,你相不相信这种用科学得出来的实验数据呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。

天地海  著    

2021年1月23日

每天都进步#389 系统(六)你可能只需要一个反馈

 

大家好,欢迎收看每天都进步,这里是天地海课室,陪你每天进步1%

今天我们继续来聊系统。昨天我们说到了系统的另外一个特质,那就是要小心眼镜蛇效应的产生。眼镜蛇效应,是你设计系统的初衷是A,可是当系统执行的时候,却带来了一个你绝对不会想要它的结果的B。就好像英国人悬赏,让印度人抓眼镜蛇,初衷是要减少眼镜蛇的数量,结果最后印度人跑去养眼镜蛇,这就绝对不是英国人想要看到的结果。

那么我们要怎么避免眼镜蛇效应的产生呢,其中一个很有效的方法就是反馈。建立一个反馈机制,将结果反馈回来,那么我们就可以知道情况究竟是怎样,也就可以知道要怎么调整系统。如果英国人在印度人饲养眼镜蛇的第一天就知道这件事情的话,那么他们就可以调整他们的悬赏系统,从而避免事情恶化下去。

很多事情是有反馈机制的,比如说Grab,或者是外卖平台,或者是网络购物这些事情,消费者可以在网站上面给出评语。这些评语公开透明,让所有的人都看得到。因此,商家为了顾及到自己的名声,就不敢做出恶劣影响的事情。所以,我们可以放心的购买那些有着好评的商家的商品。

这里举一个有没有反馈机制所带来的不同结果。在一家医院里面,有一个身体理疗师。她的工作是给那些做过乳房切除手术的女性做理疗按摩。这家医院里面只有两个医生会进行这种乳房切除的手术,而有趣的是,这个理疗师可以一眼就看出来这个病人是哪一个医生操刀的。这是为什么呢?原来是因为,其中有一个医生会精心设计她开刀的时候的伤口,这样留下来的伤疤就会比较好看。至于另外一个医生则完全没有讲究,所以那个伤疤会搞得很难看。

这个故事其实挺悲哀的,因为这个伤疤基本上就是会留在身上一辈子的。所以被不讲究的医生开刀的话,患者的心理可能就会有痛苦了。而更悲哀的是,因为没有反馈机制,所以那个不讲究的医生可能直到退休都不会知道,她的技术是还可以再进一步的,可以不让患者有那么多痛苦和压力的。而这一切,很有可能只是需要这个身体理疗师将这个状况反馈回去,给医生们知道同行之间的技术,就可以互相切磋交流,一起进步了。

不过呢,并不是所有事情都可以建立反馈机制的,或者说,哪怕建立了反馈机制之后,要调整也是很辛苦。2014年的时候,芝加哥市通过了一项法律,禁止超市提供一次性塑料袋。请注意,不是如果要使用塑料袋的话,要付多一点钱,而是直接禁止提供一次性塑料袋。造成的结果就是,超市改成提供比较厚的,可以反复使用的塑料袋。但是呢,大部分的消费者却没有重复使用,仍然还是用一次就丢。结果自然是更加不环保了。

2016年的时候,加利福尼亚州通过另一项法律,直接禁止一切塑料袋,消费者只能够使用纸袋或者是布袋。结果呢,有两个,一个是垃圾袋的销量上升。本来大家都是用超市的塑料袋来当垃圾袋的,可是现在要民众自己购买了。不过这还不算太大的影响,加利福尼亚州的塑料袋使用哪怕加上垃圾袋的增长还是属于下滑了的,对环境也起到了一定的保护作用了的。不过,第二个结果就不是加利福尼亚州想要的了。因为第二个结果是,城市环境的卫生变差了。本来民众们遛狗的时候,会带塑料袋装狗大便,现在没塑料袋了,直接就让狗随地大小便。不止是如此,加利福尼亚州有一群无家可归的人,以前大小便也是在塑料袋里面,然后丢进垃圾桶的。现在连没有塑料袋,他们也就随地大小便了。

这些情形都是在反馈的时候侦测到的,但是,侦测到了之后那又怎么样?政策一旦通过了法律程序,要在扭转更改过来就变得很困难了。所以,在我们设计一个系统的时候,我们一定要问自己三个问题。

第一、能不能在小范围先做一个实验?

第二、执行过程中,能不能快速得到反馈,然后快速调整?

第三、如果最后证明这个真的行不通,那么是否可以变回原来的样子?

只要这三个问题里面,有任何一个的答案是否的话,那么在真正实施这一个系统之前,要很小心的衡量再衡量。

最后要问大家的问题就是,你是否有尝试过用反馈机制来帮助你调整自己系统的经验呢?欢迎在下方的留言区留言,和我分享讨论吧。

今天就讲到这里,如果你喜欢这一集的内容,就请你按赞并且分享给你的朋友。如果你认为我所制作的内容对你有所帮助的话,就请你不要吝啬于订阅我的频道,同时别忘了开启小铃铛,那么你就不会错过接下来的资讯了。天地海课室,陪你每天进步1%。我们明天见。


天地海  著