耶鲁大学《博弈论》课程——逆向归纳

逆向归纳 Backward Induction

Looking forward,thinking backward。

帽子里的金币】案例:

该游戏有两个参与人,参与人1先往帽子里放金币,可以选择放0个、1个或3个,然后把帽子传给参与人2,参与人2可以看帽子里面有多少金币,然后选择全部取出、不放、放1或3个,他们的净利润如下博弈树图所示:(注意,这里有个关键点:参与人2在作出决定之前知道参与人1的决策,且参与人1知道这种情况,这叫做【序贯博弈(Sequential Games)

耶鲁大学《博弈论》课程——逆向归纳_第1张图片

(如,A在投行工作,借钱给那些创业者们,而B作为创业者,拿到钱后,既可以选择按计划创业赚钱,也可以选择偷懒甚至卷钱跑路)

**这里问题的关键就在于预测(anticipation):**沿着树形往下看,站在后行动参与者的立场上思考,看下级参与人会有什么动机,找到他们的BR,再根据树形图倒回来。

在这里,要站在参与人2的角度看,对于上分支,参与人2没有选择权,无需分析;对于中分支,1.5相对于1是优势;对于下分支,3相对于2是优势。逆向推进一层,站在参与人1的角度分析,可选择的3个策略分别对应的结果为:0、1、-3。找到参与人1的优势决策,如放1金币。

这里的方法叫做——逆向归纳法(Backward induction)】,looking forward,thinking backward。

希望得到一个更好的结果(如2比1.5好),某种动机却阻止我们作出这种选择,称之为道德风险(moral hazard)。(道德风险,典型的例子如保险行业,当你的车上了保险之后,你就不会像以前那么小心了,因为损失会有保险公司承担,所以保险公司会要求签署一定的免赔额,不会承担全部损失)

通过限制项目的规模,或者说贷款额度,来降低被骗的风险。

那么,参与人1如何才能获取比1更高的收益呢? => 【激励设计(Incentive design)】,改变3金币分支的收益分配,由原本的(3,2)改为(1.9, 3.1),此时3.1大于3,参与人2就更可能选择投资。 动机不是上天赋予人们的,它是由合同双方设计出来的。

“有时大蛋糕的一小块儿,可能比小蛋糕的一大块儿要大。”。(Sometimes, a smaller share of a larger pie, can be bigger than a large share of a small pie.)

但是这里仍然有优化的空间,对于参与人1来说,把这3美元分散去投3个1美元的小项目,仍然是100%的回报率,收益3美元,是大于这个大项目的1.9美元收益的。(那么,要怎么选择呢? => 对于私募公司的经理人来说,你要考虑有多少个可行项目、每个项目的回报率、自己的可支配资金等)

或者使用 担保(Collateral)担保的作用在于,它降低了你不偿还贷款的收益,但实际上使你过得更好了,因为它改变了其他人的行为,这对你是有益的(如,原本参与人1考虑到道德风险,可能只投资1美元,现在有了担保,就投资了3美元,参与人2的收益就从原本的1.5涨到了2)。

诺曼底人侵略英国】案例:

参与人:诺曼底公爵Norman、英国防御者Saxon

策略:战斗Fighting、逃跑Running away

耶鲁大学《博弈论》课程——逆向归纳_第2张图片

但是最开始,诺曼底人有两种选择:破釜沉舟Burn(把登陆的船烧了)、留条后路Not Burn。

这里有一个 【承诺(Commitment) 】概念,通过减少可选策略而改变其他人的行为,但如果改变不了其他人行为就毫无意义。

如在这里,诺曼底公爵就选择了破釜沉舟,烧了自己的船,并且让对方知道(不知道就没有意义),从而降低对方抵抗的积极性,更大的概率选择R,这对诺曼底人来说收益更大。

饥饿的狮子】案例:

斯塔克伯格模型】案例:

在前面,我们可以找到纳什均衡点下的古诺产量。

耶鲁大学《博弈论》课程——逆向归纳_第3张图片

现在,我们以序贯动态博弈的角度重新去审视它。去想象,两家不是同时确定他们的产量,是有先后次序的,如厂家1先制定产量,然后开始观察厂家1的产量,然后再确定自己的产量。那么,是先下手为强呢?还是等对方采取完行动再进行针对性方案呢?这个问题的研究模型,就是斯塔克伯格模型

首先,厂家2已经知道了厂家1的产量q1,需要选择产量q2,如下图:

耶鲁大学《博弈论》课程——逆向归纳_第4张图片

厂家2针对q1,按照BR曲线,选择与之对应能最大化厂家2利润的产量q2;

厂家1知道了这个q2,又会根据它来调整自己的最优产量q1‘,然后厂家2再调整自己的最优产量q2‘…从而无休止的继续下去(直至达到前面古诺模型得到的均衡点 )。

这里面有个【策略替换(Strategic Substitutes)】问题,厂家1增产,厂家2就要减产来回应,而这就会导致厂家2的BR2(q1)下降。在斯塔克伯格的模型中,厂家1不需要知道厂家2的产量也能有理由超过古诺产量继续生产,因为这可以迫使对手减产,对厂家1是有利的。所以厂家1的利润一定是上涨的(不然厂家1不会选择增产),那么厂家2的利润怎么判断?

我们先看当前市场上的总产量q1+q2,如下图所示,当q1增加一个单位时,q2减少的量要小于1个单位,所以总产量是增加的

耶鲁大学《博弈论》课程——逆向归纳_第5张图片 耶鲁大学《博弈论》课程——逆向归纳_第6张图片

而总产量增加,根据供求关系,价格时下降的,所以厂家2的利润肯定是下降的。

下面是 数学证明:

耶鲁大学《博弈论》课程——逆向归纳_第7张图片 耶鲁大学《博弈论》课程——逆向归纳_第8张图片

这是一个典型的【先行者得利】的范例,先行者一定占优。

但是,有时候,后行者更有优势,又或者两者都无优势。比如,在要接触一个对大家都很陌生的领域时,让别人先做,你就可以在后面学习经验教训;又比如,“我切水果你来选”,对于前后两人都没有优势。

Nim拿子游戏】案例:

有两堆石子,数目可能相同也可能不同,让两个玩家去选择,每次都从某一堆里拿任意个石子,拿到最后一个石子的玩家获胜。

如A堆有5个,B堆有3个,玩家1先拿两个A堆的,此时为(3,3),然后玩家2拿2个B堆的,(3,1),然后玩家1再拿两个A堆的,(1,1),然后无论玩家2拿哪一堆,都是玩家1赢。

该游戏有个技巧,那就是,如果最开始两堆石子数目不一样,先手者拿的石子数目只要一直保证两堆石子余数一样就能获胜(如上面的玩家1);而如果两堆石子数目一样,那么后收者只要保证两堆石子余数一样就能获胜。所以,有时候先手有优势,有时候后手有优势。

垄断市场竞争】案例:

市场中有一个垄断企业Inc,年利润为3,现在有一个企业Ent想要进入这个行业。Ent公司可以选择是否进入这个行业,Inc公司可以选择是否对Ent发起反击,如果发起反击,则Ent收益-1,Inc收益0,而如果不反击,两者共处,收益都是1。如下图所示:

耶鲁大学《博弈论》课程——逆向归纳_第9张图片 耶鲁大学《博弈论》课程——逆向归纳_第10张图片

纳什均衡点:(in, NF), (out, F)。 ((out, F)这个均衡建立在一个不足信的威胁基础上

注意,当你想要进入一个行业时,可能有人威胁你,如果你进入,他会全力阻击你,但是你不要盲目相信,因为他阻击你可能对他并没有好处,相反,你们共处,虽然他的利润比他垄断时候低了,但是要比他阻击你要高,这是一种非可信威胁,你如果真的进入,他并不一定真的会攻击。

在这个案例中,加入一些条件,这个垄断企业,垄断了十个不同的市场,此时这十个市场来了十个尝试进入者,这十个进入者是有顺序性的,此时垄断者会对第一个进入者进行攻击,以威慑后面的进入者。但是,对于最后一个进入者,因为后面没有进入者了,他就不需要威慑了,为了更高的利益,他是会选择不攻击的。

使用逆向归纳法分析的话,垄断者为了更高的利益,是不会攻击最后一个进入者的,那么第九个进入者就成了最后一个进入者,垄断者也不会攻击第九个进入者了,以此类推,所有企业都可以进入市场。

但是显然垄断者是不会这样的做的,那么,他应该怎么做以提高自己的威慑力呢? => 变得**疯狂。**

垄断者要对外表现出来自己有疯狂的可能,即便是只有1%的小概率变得疯狂(即便是假装出来的也行),他就可以用疯狂的名义来恐吓进入者,比如说,对于第一个进入者,他觉得垄断者绝大概率是正常的,所以他就会尝试进入,此时垄断者要选择进攻,然后第二个进入者一看垄断者前面直接就进攻了,就会怀疑自己评估的准确性,觉得垄断者可能有1/3的概率疯狂,但他还是冒险进入了,然后垄断者继续攻击,这样,后面的人就会觉得垄断者绝大概率是疯狂的,就不会进入了。

这种表现疯狂的策略,不仅在经济领域适用,在日常生活中其实也很常见。比如,当劫匪绑架人质的时候,美国或者某些国家有种理论是,决不谈判,不能因为他们有人质就向他们妥协,要以这种决绝的**【声望**】来阻止将来的潜在绑匪。

决斗Duel】案例:

两个参与者扔海绵,最初两人相距一段距离,策略是选择扔向对方,或者前进一步,如果扔中了就赢了,如果扔了但是没扔中,后面的策略就只能选择前进(拿不到海绵了),基本上相当于失败了。

这种博弈在经济学中的例子,如:两个互联网企业想要推广一个类似的产品,市场的情况是,由于某种原因只能吸纳一款产品,而此时两个企业都还没完善好自己的产品,这个时候就有两种选择,一个是直接投入使用并推广,但是如果自己产品出现问题,就会永远丢掉客户的信任,而如果投入使用太晚,可能对手就已经占领市场了。

在这里,策略决定的是“我应该什么时候去做?预先抢投是个关键点,但是也不完全是先下手为强

以Pi(d)表示参与人i在d点能击中对方的概率,两人的概率如下图所示:(如d=0表示两个人距离为0,此时无论谁扔都一定能扔中)

耶鲁大学《博弈论》课程——逆向归纳_第11张图片

优势定论 Dominance Argument:

  • 假设还没有人投出,如果i选手在d点,知道在d-1点j选手不会投出,此时i选手就不会投出,选择更进一步;
  • 如果i选手在d点,知道j选手会在d-1点投出,那么他应该投出海绵。

那么怎么判断要什么时候扔最好呢?=> 如果i选手在d点的命中率 >= j选手在d-1点的失误率(j选手失误了,那么如果i选手还没扔的话,i就一定获胜。所以,这是对i选手在这两轮的获胜率的比较,一旦发现前者大了,就要抓紧投),那么i选手就应当投出。

image-20230120095637746

设d *满足Pi(d *)+Pj(d *-1) = 1,那么第一次投掷就应该发生在d *处。

有时等待是一个好策略。不要过度自信,也不要迷信先下手为强。

你可能感兴趣的:(博弈论,职场和发展)