【文档说明】博弈论简介 微观经济学课件PPT 中山大学张丰教授.pptx,共(40)页,354.361 KB,由精品优选上传
转载请保留链接:https://www.ichengzhen.cn/view-323200.html
以下为本文档部分文字说明:
博弈论简介1、博弈论简介至今没有一个理想的模型可以解释形形色色的寡头垄断市场,现有工具内不能完全解释寡头市场或总结出所谓的主要规律。为此,人们发展出了新的工具,博弈论。博弈论(GameTheory)又名对策论,游戏论⚫失火了,屋里人很多,你往哪个门跑—这就是博弈⚫你的行动结果不仅取决于你的策
略选择,同时也取决于他人的策略选择。⚫它研究个体或组织之间存在利益冲突情况下如何进行最优决策。博弈论是50年代数学家冯·诺依曼和经济学家奥斯卡·摩根斯坦首先提出的。在经济学、政治学、社会学获得了巨大的应用。1994
年诺贝尔经济学奖颁发给了3位博弈论专家:纳什、泽尔腾、哈桑尼。博弈论是关于社会,而不是关于自然的。☺中国人研究博弈论是有优势的☺《三国演义》、《孙子兵法》、《三十六计》、《厚黑学》都是博弈论教材,如何在人与人的博弈中取得成功。1994年诺贝尔经济学奖获得者:美国数学家JohnF.Na
sh;德国经济学家ReinhardSelten;美籍匈牙利经济学家JohnC.Harsanyi。1928年Nash出生于美国,1950年获Princeton大学数学博士学位,曾先后任教于MIT和Princeton大学。其博士论文《非合作博弈》首次区分了合作博弈与非合作博弈,并且提出了非合作博
弈的纳什均衡概念。后来人们发现,早在1938年法国数学家和经济学家古诺(Cournot)关于双头垄断(oligapoly)的著作中,曾提出Nash均衡的观念。2002年《美丽心灵》获多项奥斯卡奖。1930年
Selten出生于现属于波兰的德国城市,1961年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。Selten的主要贡献是首次对分析动态策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年获布达佩斯
大学博士学位,后逃亡澳大利亚,再到美国,1954年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,从而为信息经济学提供了一个理论基础。199
6年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)获诺贝尔经济学奖。2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信
息经济学所取得的成就而成为该年度的诺贝尔经济学奖得主。博弈的规则或研究框架(1)博弈参与者(player),博弈论分析假定参与者都是理性的(追求个人利益最大化)。(2)策略空间,博弈参与者必须知道他自己及其对手的策略(strateg
y)或行动选择范围。(3)决策行为结果。博弈论用数字表示这类结果(可评价优劣高下),并称之为收益(payoff、支付)。博弈的分类一、静态博弈与动态博弈参与者行动的先后顺序,静态博弈是同时作出决策(不了解对手的决策方案),动态博弈是参与者先后
作出决策(后行动的人知道先行动者的行动方案)。二、完全信息博弈与不完全信息博弈对其他参与者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能确切了解其它决策者收益函数。三、合作博弈与非合作博弈能否达成一个有约束力的协议,合作博弈强调集体理性。(
经济学主要讨论非合作博弈)四、一次性博弈与重复博弈博弈重复多次进行。(注意区分动态博弈)博弈的分类行动顺序/信息状况静态动态完全信息完全信息静态博弈完全信息动态均衡不完全信息不完全信息静态均衡不完全信息动态均衡严格地讲,博弈
论并不是经济学的一个分支,它是一种方法,应用范围除经济学外,还包括政治学、军事学、外交学、国际关系学、犯罪学等。但为何博弈论受到经济学的重视呢?主要原因有:⑴博弈论在经济学中得到最广泛、最成功的应用,尤其在寡头市场理论中得到直接的应用。⑵博弈论的许多成果也是借助于经济学的例子来发
展的,经济学家对博弈论的贡献最大。⑶博弈论与经济学的研究模式一样:理性人在给定约束条件追求自己的效用最大化。由于上述原因博弈论逐渐成为主流经济学最重要的组成部分。2、博弈论基本模型囚徒困境(完全信息静态博弈)(A、B共同犯
罪被抓,警察分开审问)BA坦白不坦白A=10年A=25年B=10年B=1年A=1年A=3年B=25年B=3年坦白不坦白每一个人的结局不仅取决于自身的选择,同时也取决于对手的选择不管B坦白不坦白,我坦白总是会少坐一些牢囚徒困境(完全信息下的静态博弈)“囚徒的困境(Prisoners’Dil
emma)”,从博弈论角度看,这是一个存在占优均衡的博弈:因为对囚犯A,B来说,无论对方如何选择,“坦白”都是各自的最优选择。虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处等竞争性动机阻碍了它们达到更好的互利选择,我们将看到,寡头垄断
厂商经常面临类似的困境。启示:个体理性决策常导致集体非理性结果•实例:投标(总工程量50,贿赂成本5,甲乙双方实力相当)•甲•贿赂不贿赂贿赂不贿赂20200454502525均衡:(贿赂,贿赂)乙智猪博弈背景:在一个猪圈里住着一大一小两头猪。它们从同一个食槽中获得食物。但食槽
的按钮与食物的出口分布在相反的两端。每按一次按钮,可得10个单位食物,但需付出2个单位劳动。规则:若大猪按按钮:大猪吃6个单位,小猪吃4个单位;若小猪按按钮:大猪吃9个单位,小猪吃1个单位;若一起去按:大猪吃7个单位,小猪吃3个单位;问题:哪头猪将会去按按钮?小猪按等待按5,14,4等待9,-1
0,0大猪市场中大企业与小企业的关系就类似于智猪博弈,大企业进行研究开发,为新产品做广告,而对小企业来说,这些工作可能得不偿失,因此,小企业就将精力放在模仿上,或等大企业用广告打开市场以后再出售廉价产品。股份公司治理中的小股东、股市中的信息收集智猪博弈结果:多劳不多得斗鸡博弈假
设两只公鸡遇到一起,每只公鸡都有两个行动选择:进攻或后退。后退是很丢面子的事情,若鸡甲进攻,乙后退,则甲赢。双方前进,两败俱伤。鸡乙进退鸡甲进-4,-41,-1退-1,1-1,-1双方都没有占优策略存在两个稳定的
状态(纳什均衡):(-1,1);(1,-1)双方都避免两败俱伤,斗鸡博弈有两个纳什均衡,一方前进,另一方后退。由于有两个均衡点,结果无法预知。20世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的很好例子。古巴导弹危机是冷战时期苏美
之间最严重的一次危机,赫鲁晓夫1962年偷偷将导弹运到古巴对付美国,被美国U2飞机侦察到,美国派出携带核武器的战机、航母,威胁苏联限期从古巴撤出导弹。苏美这两只大公鸡均在考虑进还是退?战争的结果当然是两败俱伤,但任何一方退下来则是很不光彩的事。博弈结果是苏联从古巴撤回了导弹,做了丢面子的“撤退的
鸡”,而美国坚持了自己的策略,做了“不退的鸡”。当然为了给苏联面子,同时也担心战争,美国也从土耳其撤了一些导弹。例:两个寡头进行价格战博弈的收益矩阵。博弈论中的均衡是一组稳定的博弈结果。双方均不愿先改变策略。博弈的均衡是稳定的,因而是可以预
测的。10,1050,50-50,100100,-50低价低价高价高价厂商B厂商A3、博弈论中的均衡占优策略,又称支配性策略(dominantstrategy)⚫此类博弈中存在一种策略,无论B选择何行动,该策略对A都是最优,则称此策略为博弈者A的占优策略。⚫在本例中,厂商
A和厂商B都有不受他人策略影响的占优策略,即选择低价。占优均衡,支配均衡⚫每个参与者都有并都选择占优策略,由此实现的均衡称占优均衡。本例为(10,10)。占优均衡纳什均衡纳什均衡(非合作性均衡):⚫纳什均衡是这样一组策略,它使所有博弈参与者都不能再提高其收益的状况。此时,双方在
对方给定的策略下均不愿意调整自己的策略。⚫下例中,A有占优策略即正常价格策略,而厂商B没有占优策略,它必须根据A的占优策略来确定其战略选择,即其选择受A的选择的影响。100,20010,10150,-30-20,150高价格正常价格厂商B厂商A高价格正常价格多个均衡和没有均衡⚫一个博弈可能有好
几个纳什均衡(即几组稳定并且自我坚持的策略),有时又可能不存在(纯策略的)纳什均衡。⚫甲表存在两个纳什均衡:其中“上,左”是纳什均衡(A选上,则B选左;且B选左时A仍应选上);“下,右”也是纳什均衡(A选下,则B选右;且B选右
时A仍应选下)。如某个博弈只有一个纳什均衡点,这个博弈的结果是可以预测的,如有两个或以上的纳什均衡点,则博弈结果无法预测。⚫乙表没有纳什均衡。如A选“上”,B则选“左”;然而当B选“左”时,A却应当选“下”。反之,A选“下”时,B
应选“右”;然而当B选右时,A又应选“上”。没有均衡点。2,11,20,00,0左上右下局中人B局中人A0,0-1,31,00,-1左上右下局中人B局中人A(甲)(乙)占优均衡与纳什均衡的区别占优均衡
:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。纳什均衡:我所做的是:给定你所做的我所能做的最好的。你所做的是:给定我所做的你所能做的最好的。占优均衡是纳什均衡的一个特例4、最大最小策略迄今为止,对厂商行为的分析都建立在利润最大化基础
上。但在一些竞争激烈的寡头垄断市场,冯·诺依曼和摩根斯坦认为决策者也可能采取一种风险厌恶策略。即确保在最坏的结果中得到最好的结果。这种决策规则称最大最小策略(MaximinStrategy):博弈者在可能最少的利润方案中选择利润最大的方案。如果企业谋求利润最大化,将有两个
纳什均衡,一家企业投资推出新产品,另一家企业不投资产品。最大最小策略,不是利润最大化策略,准确说,它是用来避免十分不利结果的。对企业1来说,如果它不投资新产品,利润最小是300万,如果它投资,利润最小是200万。对企业2数字也相同。两家企业都在最小利润中选最大值。结果是两家企业都不投
资新产品。因为这样的策略能保证至少获得300万利润。战略不投资投资投资4,43,66,32,2厂商1厂商2不投资双寡头企业都在考虑是否投资推出新产品。最大最小策略的结果并不是两种纳什均衡中的一种。原因是这种决策所用的准则,不是利润最大化
,而是避免亏损过多。不同的决策目标可能导致人们选择不同的策略,最终导致不同的博弈结果。5、重复剔除严格劣战略“重复剔除严格劣战略”的思路:首先找出博弈参与人的劣战略(dominatedstrategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后在
剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”。如果这样的解存在,我们说该博弈是“重复剔除占优可解的”。连续排除劣势策略两者都没有占优策略,怎么办?Player2Player1100,10090,11050,
120110,4080,8045,50120,3050,3540,40StrategyABCabc连续排除劣势策略(续)两者都没有占优策略,怎么办?StrategyABCabcPlayer2Player190,11050,1205
0,3540,4080,8045,5050,3540,40普林斯顿大学的一道习题题目:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城市而敌军的守备力量是三个师,规定双方的兵力只能整师调动。通
往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败。那么,你将如何制定攻城方案?6、重复博弈⚫“囚徒的困境”暗含有一次性博弈假定,结果陷入了个
体理性决策导致集体非理性结果的困境。⚫现在我们改变假定条件,讨论博弈可以多次进行的重复博弈(RepeatedGame)。⚫如,囚徒困境博弈中,假定博弈或重复多次,A对B宣布如下方针:我将选择沉默,并要求你也如此来增进各自利益;然
而,如果你半途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一方针与A利益一致,因而是可信的。重复博弈中,声誉(名声)十分重要⚫从B角度来看,和A合作可在每阶段得到较好结果;中途变卦,固然当期可得更好结果,但此后便每次面临更坏的后果,显然是不利的。⚫因而,重复性博弈中
,“沉默+沉默”点可能成为对双方最佳选择,因而成为纳什均衡点。——由于博弈条件由一次性变为重复性,均衡状态随之发生变化。⚫欺骗一次对方就会警觉,导致合作失败。在重复博弈中,名声对得出什么样的结果十分重要。7、混合策略博弈---警察与小偷某警察负责A、B两
地治安,两地相隔较远,他每晚只能去一个地方巡逻,该地区有一小偷,他每晚也只能选择偷一个地方,A地财产价格2万元,B地财产价格1万元,若警察选A地巡逻,而小偷也选择去了A地,则会放弃偷窃,警察保全了3万元财产;若警察选择A巡逻,小偷去了B地,则B地财产
被盗。问:警察如何巡逻效果最好?策略1:警察只对A巡逻,这样可保住2万元的财产不被窃。这个做法是最优的吗?有没有改进的措施?改进策略:既去A地,又去B地。那么去A地多少次,B地多少次最优?小偷警察盗窃A地盗窃B地巡逻A地(3,0)(2,1)巡逻B地(1,2)(3,0)
对上例,警察的最好做法是:通过掷骰子决定去A地还是B地,1/3的机会去B地,2/3的机会去A地。(对6个面的骰子,1-4点去A地,5、6点去B地。)对小偷也是如此,掷骰子来决定是偷什么地方,只是1-4点去B地,5、6点去A地。警察和小偷的损益分析:
警察到A地时,小偷有1/3机会到A,2/3机会去B,此时警察得益:同理警察到B地时,得益也为7/3。由于警察到A的可能为2/3,到B的可能为1/3,其总得益为:可以看出警察的总得益大于2,该策略优于只巡逻A的策略1。
小偷的得益有什么改变呢?(2/3)37232331=+3737313732=+37332131=+该博弈为零和博弈(一方之所得,即为另一方之所失),只有混和策略均衡点,不会有纯策略的纳什均衡点。警察与小偷博弈如同剪刀-石头-布游戏,或猜拳游戏,是混合策略博弈,参与者在多种备选策略中随
机选择。在这样的游戏中,不存在纯策略均衡(不能选择单一策略),对每个人来说,出剪刀、布、还是石头的策略应当是随机的,不能让对方知道自己的策略,哪怕是策略的“倾向性”,如果对方知道你出哪一个策略的可能性较大,你在游戏中输的可能性就增大。8、言语博弈:威胁和承诺为了在博弈中获得对已有利
的结果,往往会产生“威胁”和“承诺”的行为。语言哲学认为,语言就是行动。言语博弈涉及:声称的策略和实际的策略。现实中,各国的外交声明,企业发出的威胁等。伊拉克对美国:如果你打我们,我就使用大规模杀伤性武器。
台湾问题:美国声称,如果中国武力攻打台湾,美国将介入。中国声称,是否收回台湾是中国内政,中国原来的不率先使用核武器的声明在国内战争中不适用,温家宝的“不惜一切代价”。中国“不首先使用核武器”的承诺。阻止市场进入的威胁公司之间经常相互发出信号以表明他们的意图、动机和目标。有些信号是威胁性的
。只有威胁变得可信时才会生效。假定在一个市场中,某企业是市场垄断者。现在有另一企业作为潜在的竞争者,试图进入这个市场。对垄断者来说,会设法阻止潜在竞争者的进入。在这个博弈中,潜在竞争者有两种策略可以选择,即进入或不进入;垄断者也
有两种策略,或者与进入者打一场价格战,或者默许它的进入。该博弈的策略选择顺序是:首先由潜在进入者作出进入市场或不进入市场的选择,然后再由垄断者来决定是默许它的进入还是与进入者进行一场价格战。这个博弈的得益矩阵如表所示。上述博弈有两个纳什均衡
点(红、蓝),但由于是动态博弈,(价格战,不进入)被淘汰,动态博弈的均衡----子博弈精练纳什均衡得以实现。(泽尔腾的贡献)垄断者能阻止市场进入吗?一种策略是,垄断者对潜在进入者进行威胁。“如果你进入市场,我将采取价格战的策略。”但面对如上表的得益矩阵,垄断者的
威胁是不可信的。潜在进入者认为一旦进入发生,垄断者并不会选择商战的策略,而只会默许它的进入。因此,垄断者的这种声明并不能达到它阻止进入的目的,进入者仍然会进入市场。这种威胁被称为空头威胁垄断者价格战不打价格战
进入潜在进入者不进入-200,600900,11000,30000,3000承诺与可信性承诺,是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它不需
要任何成本。阻止市场进入的有效承诺就是就是通过投资来形成一部分剩余的生产能力。这部分生产能力在没有其他企业进入市场的时候是多余的,但在进入发生时则成为其低价竞争的有力武器。生产能力的扩大需要额外的投入,我们假定垄断者需要投资
800万元来实行这个承诺。这一投资将改变博弈的得益矩阵,新的得益矩阵如下表。表实行承诺后的阻止市场进入博弈承诺能够阻止市场进入的关键在于它是可信的。扩大投资需要花费较大的代价,但在某些情况下,只要承诺是可信的,其代价反而可能会小。垄断者价格战默许进入潜在进入者不进入-
400,400900,3000,22000,2200