博弈论在虐恋中的应用
文章导读: |
1博弈论概述
博弈论是现代数学的重要分支,在经济学等领域中有广泛应用。博弈论考虑的问题是:在一个游戏中当游戏参加者采取不同策略时,他们会得到不同的收益,那么,为了提高各自的收益,他们应该采取什么样的策略。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。比如2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽。
博弈论主要是由冯·诺依曼(1903—1957)所创立的。他是一位出生于匈牙利的天才数学家,他不仅创立了经济博弈论,而且发明了计算机。而纳什是继冯·诺依曼之后最伟大的博弈论大师之一。纳什在1950年和1951年发表的两篇关于“非合作博弈论”的重要论文,彻底改变了人们对竞争和市场的看法,即著名的“纳什均衡”。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子:
有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯,由地方检察官分别和每个人单独谈话。
检察官说:“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。如果都抵赖就两人都判一年。”
斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年,但是由于两人处于隔离的情况下无法串供,由于每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁——3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。
这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这种两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。
博弈论告诉我们,如两游戏者之间不能互通消息,那么由于对他们每个人而言无论对方的策略是什么,自己选择B所获得的收益总比选择A来得多,所以他们都会选择B。而这样一来他们每人只能得到1个单位的收益,这显然不如两人都选择A带来的收益多。对于双方来说,这是一个无法避免的困境。在这个例子中,当双方都采取B策略时,他们中的任何人独自改变策略都只会使自己收益降低。这种情况称为“纳什均衡”。
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁之结果。
“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。因此,从“纳什均衡”中我们还可以悟出一条真理:团体合作才是有利的“利己策略”。
要达到这个有利的“利己策略”,必须符合以下条件:你必须按照你愿意别人对你的方式来对别人,同时对方也按同样方式行事才行,也就是中国人说的“己所不欲勿施于人”。