博弈论概述

求缺 · 发表于 2004-9-23 00:12

博弈论概述

来自：MACD论坛(bbs.shudaoyoufang.com) 作者：求缺浏览：2027 回复：4

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有帐号？立即注册

x

博弈论概述 ?

1.1 博弈论简史
博弈论(Game Theory)又称对策论，起源于本世纪初，1994年诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了博弈论的理论基础。50年代以来，纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。近20年来，博弈论作为分析和解决冲突和合作的工具，在管理科学、国际政治、生态学等领域得到广泛的应用。
简单地说，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成：一是决策主体(Player)，又可以译为参与人或局中人；二是给定的信息结构，可以理解为参与人可选择的策略和行动空间，又叫策略集；三是效用(Utility)，是可以定义或量化的参与人的利益，也是所有参与人真正关心的东西，又称偏好或支付函数。参与人，策略集和效用构成了一个基本的博弈。?
1.2 博弈论的主要思想
博弈论可以分为合作博弈和非合作博弈。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能，则称非合作博弈(Non-Cooperative Game)，非合作博弈是现代博弈论的研究重点。比如两家企业A、B合作建设一条VCD的生产线，协议由A方提供生产 VCD的技术，B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈，因为每一方都试图最大化己方的评估值，这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报，则可以使自己在评估中获得优势；同理，A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”，则不会非常重视。这就是非合作博弈，参与人在选择自己的行动时，优先考虑的是如何维护自己的利益。合作博弈强调的是集体主义，团体理性(Collective Rationality)，是效率、公平、公正；而非合作博弈则强调个人理性，个人最优决策，其结果是有时有效率，有时则不然。
博弈论非常强调时间和信息的重要性，认为时间和信息是影响博弈均衡的主要因素。在博弈过程中，参与者之间的信息传递决定了其行动空间和最优战略的选择；同时，博弈过程中始终存在一个先后问题(Sequence,Order)，参与人的行动次序对博弈最后的均衡有直接的影响。
我们知道，竞争情报是关于竞争对手的背景、技术秘密、发展策略等一切影响竞争结果的信息。在博弈的参与人之间传递的信息有时就是竞争情报，在没有获得竞争情报以前，参与人还只能用概率来估计对方的行为，如果获得竞争情报，则可以大大提高决策的成功率，同时竞争情报还可以作为一种“武器”，来迷惑对方，所谓“攻心为上”。时序和信息是博弈论强有力的研究工具。目前人们对信息越来越重视，特别是信息不对称对个人选择和制度安排的影响，在信息经济学中产生了委托—代理制和激励理论。
博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识 (信息)是否了解两个角度进行。把两个角度结合就得到了4种博弈：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。其代表人物是纳什，泽尔腾和海萨尼。严格地讲，博弈论并不是经济学的一个分支，它只是一种方法，这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治，经济，外交和社会学领域有了广泛的应用，它为解决不同实体的冲突和合作提供了一个宝贵的方法。?
1.3 博弈论的应用
利用博弈论可以证明现实生活中许多有趣的问题。如：多劳者不多得，公共资源的过度使用，非合作者在一段时间内选择合作(坏人做好事)。虽然这些结论都是建立在一个很强的假设，即参与人是理性的，有最大化自己效用的趋势。但是其结论有深刻的哲学内涵。
目前经济学中的委托—代理制、激励理论都可以用博弈论来分析。现代的企业间竞争有很多情况都是在合作的背景下进行的。比如垄断市场的寡头A、B，他们可以协议指定一个产量( 如海湾国家的石油产量)，来维持自己的最大利润。但是在许多情况下总有为了维护自己的局部利润而提高产量的情况(如沙特常擅自提高产量)，结果导致价格下降，利润流失。竞争情报往往在这种情况下起重要作用，如果A掌握了B的实际生产能力这类竞争情报，就可以调整自己的产量甚至突破协议，从而形成新的均衡。
本文试图从博弈论的角度，在理论上探讨竞争情报对企业间合作的影响，首先介绍博弈论的经典命题“囚徒困境”。?
2 “囚徒困境”及其引申 ?
2.1 “囚徒困境”现象
“囚徒困境”(Prisoner,s Dilemma)的具体内容如下：两个嫌疑犯作案后被警察逮捕，分别关在不同的屋子里审讯，警察告诉他们，如果两个人都坦白，那么每人判刑8年；如果两个人都抵赖，每人各判刑1年(或许因为证据不足)；如果其中一人坦白，另一人抵赖的话，坦白的人释放，抵赖的人判刑10年。表1是囚徒困境的战略表达式，这里每个囚徒都有两种战略：坦白或抵赖，表中的数字表示对应的战略组合下两个囚徒的支付。?
表1 囚徒困境战略表达式?
囚徒A
坦白抵赖
囚徒B 坦白 -8,-8 0、-10
抵赖 -10,0 -1,-1
在这个博弈中，纳什均衡是(坦白，坦白)，尽管从总体上看，(抵赖、抵赖)是对两个人都有益的结果，但由于不构成纳什均衡，所以不是该博弈的解。给定B坦白的情况下，A的最优战略是坦白；同样，A坦白的前提下，B的最优战略是坦白，AB最优战略的组合(纳什均衡)却不是总体最优的选择，有没有可能其中一个选择抵赖呢?按照人是理性的假设，没有人会积极地这么做，因为如果对方坦白的话，自己就可能判刑10年，理性的人是不会冒这种险的。囚徒困境反映了一个深刻的哲学问题：个人理性和集体理性的矛盾。
囚徒困境在企业间最典型的例子就是“竞相杀价”，在某种产品市场容量一定的前提下，A 、B企业本可以订一个协议价格来维护共同的长期利润，但A会为自己的近期利益而采取“低价倾销”策略，B也会效仿降价，不遵守事先达成的价格协定，结果使市场过早枯竭，A、B 都没有出路了。但是如果A事先获知B的产量和价格这类竞争情报，就可以采取保护措施(如动用反倾销法案，甚至可以“威胁”用更低的价格“报复”)，这样就能避免“两败俱伤” ，形成新的协定。在“囚徒困境”中我们得到一个重要的结论：一种制度(体制)安排，要发生效力，必须是一种纳什均衡，否则这种制度安排便不能成立。?
2.2 囚徒现象的普遍意义
囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看，按次序上车是最有效率的做法，但是你挤我不挤，我就可能上得慢，所以每个人的最优战略都是挤，纳什均衡就是大家都挤，结果上车就更慢了，每个人采取的都是最优的战略，但是结果却是最劣，原因在于个人理性和集体理性的冲突。
除了“囚徒困境”以外，博弈论学者还总结出许多博弈的模型。如智猪博弈(Boxed Pigs)来解释多劳者不多得；性别战(Battle of Sexes)来解释互动博弈；斗鸡博弈(Chicken Game) 来解释僵局情况一方的妥协等等。?
2.3 “囚徒困境”的引申
“囚徒困境”至今仍然是研究的重要课题。这种博弈给人们提出难题：一是在冲突的情况下，参与人的目标是什么?是利己还是利他?前者导致坦白，被判刑8年，后者则冒被出卖而判刑10年的危险，这个冲突要参与人在个人理性和集体理性之间作出选择；二是博弈分一次完成还是分许多阶段完成，参与人的策略有什么变化?就囚徒困境来说，可以证明：如果博弈的次数足够多，那么可以导致囚徒间合作的产生，即每个囚徒在一定阶段选择抵赖(合作)，哪怕该囚徒是不合作的，但是为了自己的长期利益，他首先还是选择合作(抵赖)，直到博弈的最后阶段才选择不合作(坦白)。形象地说，坏人也可能做好事，坏人为了使别人相信自己是好人，从而获得更大的好处，坏人会在相当一段时间内做好事，直到最后才露出本来面目。

3 竞争情报对博弈均衡的影响
在博弈的基本组成中有一项是信息集(或信息结构)，竞争情报将改变参与人的信息结构，从而使博弈的均衡结果发生迁移。?
3.1 不完全信息静态博弈的例子
设房地产市场有公司A和B考虑进入，但是A对市场需求清楚，对自己的成本函数清楚，而B只知道自己的成本函数。A、B之间的公共信息是提供的价格。如果A不愿意B进入该市场，它可以提供比成本价格更低的报价，这样B就会认为无利可图而放弃进入，A虽然短时间会损失部分利益，但会享受垄断市场带来的长期利润。这时的均衡结果是(A低价，B不进入)。?
3.2 竞争情报的介入
在上例中，如果B能够通过各种途径获得A的成本函数和市场信息，如：①通过了解A在公众媒体上发布的各种报告和广告活动获取A公司的实力信息；②通过A的客户和供货商了解； ③通过A的员工等渠道探听成本消息。从情报的分类来说，这些情报既有一次情报，二次情报，也有零次情报和灰色情报，但无论如何，一旦B获得A的成本函数或有较大的把握，A就不能再用低的报价来阻止B的进入，这时均衡结果就成为(A高价，B进入)。?
3.3 制度的设计者
在“囚徒困境”中，制度的设计者是警察，但并不意味在博弈过程中制度应该由参与人以外的实体提供，从本质上讲，一种制度的形成，是参与人各方利益妥协的结果。在实际博弈中，制度的设计者既可以是参与人本身，也可以是参与人以外的实体，无论由谁制定规划或制度，存在的前提是各方是否认同。博弈论说明，任何制度存在的前提是这种制度是纳什均衡，否则，这种制度不可能真正地存在下去。竞争情报在博弈过程中影响参与人的信息结构，从而影响最后的均衡。最后还要指出，博弈论在应用过程中，不能忘记它的前提，即参与人是理性的，要最大化自己的效用，而实际上参与人还会受到感性因素的影响，这也使我们对博弈论的适用范围要有一定的把握。□?

求缺 · 发表于 2004-9-23 00:13

囚犯的两难处境

　　大理论中的小故事

　　要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。

　　博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。

　　从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

　　价格战博弈：

　　现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

　　污染博弈：

　　假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。

　　贸易自由与壁垒：

　　这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。

xdong · 发表于 2004-9-23 08:57

谢谢！

交易 · 发表于 2004-9-23 11:06

博弈论教导我的不仅仅是从博弈的角度看问题，他还告诉我思考问题一定要将思考方式上升到一定的层次。

bluewind1961 · 发表于 2007-11-26 22:20

:*19*: :*19*: :*19*:

		搜索
热搜: macd K线与均线飞狐分时指标共振指标分时橡胶牛股炒股入门