米尔格罗姆和罗伯茨构建了一个模型,聚焦影响活动对组织成本的影响。影响活动是决策者对雇员职位有自由裁量权时,雇员有动机花时间去影响结果,而这些时间本应用在生产任务上,因此,对企业而言影响活动是有成本的。模型结果显示,如果雇员拥有对决策者有价值的信息,一定程度的影响活动对企业是有益的,但过度的影响活动则是成本高昂的。同时,米尔格罗姆和罗伯茨还比较了公司阻止过多影响活动的各种策略,通常情况下,限制雇员访问决策制定者和改变决策制定标准比使用明确的财务奖励更可取。米尔格罗姆、迈耶和罗伯茨还进一步研究了多元化企业的影响成本上升问题。他们研究发现,业绩不佳且与企业其他部门关联紧密的部门经理为保留其工作有夸大部门前景的动机,这会导致影响成本上升。如果部门是独立的,歪曲部门前景的机会则大为减少,影响成本随之下降,原因是组织对该部门的激励绩效相对其他部门是清晰的,该部门的影响活动则减少。这些论点有助于解释为什么业绩不佳的部门会如此频繁地被剥离,以及为什么当这些部门不能成为独立公司时,它们往往被从事相关业务领域的买主购买。 (三)信息经济学 在一个竞争的环境中,信息有两种重要的作用。首先,信息能够显示产品或服务的质量。其次,其他经济主体的信息能够揭示这个经济主体面临的竞争激烈程度。因此,信息经济学的核心是设计有效的激励相容约束机制去试图解决信息不对称引致的一系列等问题。米尔格罗姆在信息经济学中引入“有利”(favorableness)这一新概念:对于所有努力、能力、质量等相关变量的先验信念(belief,一种概率估计)。如果观察(observation)X的后验条件信念一阶随机占优于另一观察Y的后验条件信念,则X比Y更“有利”,即X出现的概率大于Y出现的概率。米尔格罗姆凭借“有利”概念和相关信息结构的“单调似然性”推导出了信息经济学的一系列重要结论:从委托-代理问题中的最优激励契约性质到拍卖理论中的“赢者诅咒”等。米尔格罗姆创新的“有利”概念和“单调似然性”的观点使得经济学模型的分析和解释都更简洁。 三、对博弈论的贡献 20世纪八九十年代,米尔格罗姆重视概率理论在博弈论中的应用,对非合作博弈中的新分支理论——声誉博弈、重复博弈、超模博弈、说服博弈、博弈学习等模型做出了基础性贡献。 (一)声誉博弈 从博弈的视角看,声誉博弈形成的起点是囚徒困境的重复。在标准的一次囚徒困境博弈中,唯一的均衡是帕累托无效的(损失,损失)。同样地,当囚徒困境被重复一个有限且确定的次数时,帕累托无效仍是每次博弈的唯一纳什均衡解。这似乎违背直觉与常识,因为局中人有很强的合作动机并拥有广泛的策略空间。例如,如果一个局中人承诺采取针锋相对的策略,那么其他局中人将会选择一直合作至最后几期,这将产生一个帕累托最优均衡解。米尔格罗姆与克雷普斯、罗伯茨、威尔逊运用概率空间的拓扑性分析了拥有不同信息的局中人的分配策略。他们研究发现,某局中人即使以一个非常小的概率承诺采取针锋相对策略,均衡时双方也会一直合作下去,这是因为,即使一个无承诺的局中人,也有激励去建立一个针锋相对的声誉,激励其他局中人的合作意愿。因此,米尔格罗姆等开创了声誉博弈这一新分支博弈理论。 (二)重复博弈 当局中人的行为隐匿但他们的行为噪音信号可观察时,有两种普适的方法实现效率。一种方法是转让违规局中人的未来收益给其他局中人,但总的未来收益并未减少,用这种方式惩罚潜在的违规者。另一种方法是延迟发布信息,每个时期的噪声信号效果会发布,局中人会在信息发布时“评估”(review)最近时期的信息并决定彼此之间是惩罚还是奖励,这就是广为人知的评估策略。当局中人收到彼此行动的私人信号时,米尔格罗姆与阿布勒、皮尔斯首先证实了重复博弈中满足评估策略有效性的均衡的存在。 (三)超模博弈 超模博弈是一个令人印象深刻的新博弈模型,它为互补策略博弈提供了普适性方法。超模博弈的影响力和重要性源于该模型的广泛应用,涵盖技术采用、银行挤兑、军备竞赛、审前谈判、多人贝特朗(Bertrand)竞争以及两人的古诺模型等。 这个理论的主要贡献包括开创性的Topkis定理(Topkis,1978)和米尔格罗姆与罗伯茨的有影响力的研究贡献。米尔格罗姆与罗伯茨首先将以前的基数超模博弈演变为序数超模博弈,并采用比较静态分析方法推导出纯策略的纳什均衡集。每个局中人都有一个最大和最小准则的理性策略空间,每个局中人采用的最大准则策略是一个纯策略纳什均衡,与策略空间中每个局中人采用的最小准则策略类似。这意味着纳什均衡集和相关理性均衡集具有同样的边界,边界对外生变量具有单调性,这使得模型具有简单的行为假设和强大的预测能力。其次,超模博弈产生的均衡是比较静态分析的结果,局中人的得益受到一些特定参数的影响,最大和最小准则的理性选择的均衡均是受到参数影响后的均衡。这两个基本原因使得超模博弈在理论和应用方面产生重大而持久的影响。 (四)说服博弈 米尔格罗姆(Milgrom, 1981b)构建了一种新型的“说服博弈”模型。模型中,卖方拥有产品的私人信息,通常会选择性地揭示对产品有利的信息而倾向于隐瞒不利信息。买方如果预期卖方隐瞒产品不利信息则会惩罚卖方,即采取极度怀疑策略。在买方可零成本地收集信息且与卖方充分沟通假设下,米尔格罗姆论证了说服博弈的每一个序贯均衡中卖方都有激励去披露信息,任何隐蔽性信息将会被“披露”(unravel)。由此,卖方会采用充分披露策略,这个结果被称为“披露的结果”。随后,米尔格罗姆和罗伯茨引入了一个更符合实际的修正说服博弈模型。其中,当买方只能获得有限的K个信息时,模型存在一种序贯均衡,均衡的结果是所有相关的信息都被披露,即卖方总会披露K个信息。信息披露的含义是,个人可以策略性地选择是否隐瞒信息,但隐瞒信息将招致严重惩罚。米尔格罗姆的说服博弈影响巨大且贴近真实世界,它已被广泛地应用于众多领域,包括法庭辩论、产品测试的监管以及企业应对监管变化的财务披露等。 (五)博弈学习模型 传统博弈学习模型中的学习进程在短期内不一定收敛(converge),即使学习进程收敛,在一定条件下也需要很长时间。而且,传统博弈学习模型仅关注重复进行的相同博弈,没有考虑到灵活学习后更为复杂的问题:前一阶段博弈的得益会对后一阶段博弈的得益有暗示作用。其中,局中人在灵活学习时可以充分利用均衡分析中的得益信息,但不会强加给局中人任何预期目标。由此,米尔格罗姆和罗伯茨提出了两阶段的短期博弈学习模型,每个阶段的学习具有一定程度的普适性。模型中,随着时间的推移,一个局中人n的“观察序贯”记为{xn (t)}:t为任何一段时期,xn (t)是一个纯策略。鉴于此,如果局中人n最终选择的唯一策略是对其他局中人短期联合策略的概率分布的最优反应,那么观察序贯{xn (t)}与适应性学习(adaptive learning)一致。与之相比,如果局中人n在预测其他局中人策略的概率,那么观察序贯{xn (t)}与灵活学习相一致。其中,局中人的策略既包括过去的策略也包括适应性学习后或灵活学习后的选择策略。因此,符合适应性学习的一个序贯也符合灵活学习。有了这些界定,米尔格罗姆和罗伯茨证明了,如果一个序贯收敛于纳什均衡或相关的均衡,那么这个序贯与适应性学习一致。这就给了学习进程一定程度的普适性,同时这些学习进程与占优策略的消失相关,这揭示了古诺博弈和贝特朗博弈中的收敛含义。 四、对产业组织理论的贡献 20世纪70年代,产业组织理论的先驱阿克洛夫、斯蒂格利茨、斯彭斯等提供了产业组织的一些概念性和方法性的背景知识。20世纪80年代,米尔格罗姆与罗伯茨合作的几篇开创性论文,从信息不对称和博弈论视角发展了产业组织中的一些核心思想,构建了产业组织理论的全新框架并使之成为该研究领域的主流思想。 产业组织中一个重要的议题是掠夺性定价。很长一段时期,芝加哥学派麦吉(McGee,1958)的分析为此提供了唯一的连贯经济图景。麦吉认为掠夺性定价的概念缺乏逻辑一致性,除了被掠夺者之外,掠夺者也遭受太多掠夺。如果被掠夺者抵抗掠夺者,并采取积极行动,那么掠夺者最终会放弃自己的努力。预期这个结果,被掠夺者会更激烈地抵御掠夺者的掠夺。反过来,掠夺者通过抑制自己的掠夺策略会更好。进一步地假设,掠夺者被成功地诱导退出,被掠夺者随后提高了产品价格,享受其胜利的果实,新的掠夺者可能又会被吸引,全部问题又重新开始。由此,麦吉得出结论,掠夺不是均衡策略,被掠夺者的容纳是对掠夺者进入的最优策略,掠夺者的进入是对被掠夺者的容纳的最佳反应。当然,这些结论都是建立在完美信息条件下。 米尔格罗姆和罗伯茨、克雷普斯、威尔逊对掠夺性定价提供了一个新的视角。他们在信息不对称条件下创建了一个新的声誉博弈模型,并第一次将它运用于产业组织理论和政策中,为掠夺性定价这一产业组织理论的核心议题提供了新含义。他们假设在一些小的概率下,被掠夺者可能非理性地(irrationally,非利润最大化的行为)与掠夺者激斗。在此情况下,通过较低的成本反复打击对手,被掠夺者增加了“坚韧”(toughness)的美誉,从而强化了被掠夺者的生存空间,并阻止了潜在掠夺者的进入。 在完美信息条件下,限制性定价理论的推论是:潜在进入者如果知道商品成本等信息,在位者就不会采用限制性价格,因为显著限价在降低在位者利润的同时并不会对潜在进入者产生任何影响。但是,现实情况与限制性定价理论的完美信息假设恰恰相反,在位者和潜在进入者之间存在信息不对称,即潜在进入者不知道在位者的产品成本信息。由此,米尔格罗姆和罗伯茨摆脱了完美信息假设的窠臼,将信息不对称引入限制性定价(收费低廉甚至低于边际成本的价格)理论。他们认为,在位者和潜在进入者之间的限制性定价问题可视作信息不对称下的博弈行为。信息不对称时,潜在进入者不知道在位者的类型(高成本或低成本)。由此,在位者通过低价格信号向潜在进入者传递低利润信息,影响潜在进入者对在位者类型的估计概率,让潜在进入者认为该行业前景长期黯淡,从而阻止了潜在进入者的进入。 传统上,经济学家认为广告是一种信息,但为什么一些广告(例如说服广告)很少提供或根本没有产品特性的信息?米尔格罗姆和罗伯茨从信息不对称视角对该问题所提供的合理解释为,即使广告没有提供产品任何特性的直接信息,也可能是有告知性的,在某种程度上至少它是广告者质量的一个信号。 米尔格罗姆与罗伯茨一系列极具影响力的论文表明:掠夺性定价、限制性定价、说服广告等都是不对称信息条件下行为主体的理性策略行为。米尔格罗姆是一个开路先锋,他运用信息不对称和博弈论框架改写了现代产业组织理论的逻辑基础,指明了产业组织理论的未来研究方向。 五、对其他经济领域的贡献 米尔格罗姆研究兴趣广泛,他凭借信息不对称和激励机制分析框架对经济理论的诸多研究领域进行了拓展与整合,增加了人们对信息和激励机制在各种环境中的作用的理解。 (一)市场设计 市场机制通常需要参与者显示其对有关项目的偏好和评估价值,而当多个不同的项目进行分配时,项目组合数量之多使得参与者的决策成本过高,参与者会使用简单的信息去描述完整的偏好,即使用市场设计分配资源。除此之外,诸如器官移植、婚姻选择、学生实习等分配项目因情感伦理、每个个体具有特殊性等原因,价格机制在一些分配项目中无法发挥作用,需要市场设计实现稳定匹配。市场设计就是利用实验室研究、博弈论、算法等模拟竞争市场的分配功能进而实现稳定匹配。市场设计是一项经济工程,启发了人们重新思考经济理论的长期基础。 米尔格罗姆在市场设计的理论和实践方面都做出里程碑式的贡献。米尔格罗姆与哈特菲尔德利用递延接受算法具体论证了在考虑到“合同匹配”时如何泛化稳定婚姻匹配问题。这里,匹配模型两侧代理人之间的匹配关系内生于匹配过程。此外,他们注意到稳定匹配集合形成一个格(lattice,数学上一种特殊的偏序集),而且“似空位链机制”也存在。观察到稳定的匹配是一个格,为他们泛化市场匹配模型提供了洞察力,借此可以简化和优化参与者的信息空间,实现偏好不同的参与者的效用最大化。米尔格罗姆的研究成果成功地运用于不同的领域,有两个成功的案例:一是重新设计了日本的医院和居民的匹配;二是设计了士官生在美国军队部门的配置。 (二)制度 米尔格罗姆对学界理解市场经济中法律制度的演变做出了早期贡献。米尔格罗姆、诺思、温格斯特构建了一个重复博弈模型,阐释了正式制度充当判断契约行为的智囊团的(repository)作用,其中,契约行为可以协调多边声誉机制。他们揭示了中世纪后期欧洲商业法的作用,商人查询并依靠商业法来判断什么是“欺诈”,以判别潜在的贸易伙伴是否在之前的合同中欺诈,从而触发其他商家的惩罚。米尔格罗姆等认为,惩罚的激励源自重复博弈的结构,这是一个囚徒困境,欺诈是占优策略,不欺诈的唯一动机来自未来的合作伙伴可以从欺诈中学习并且欺诈可以不受处罚,这导致子博弈精炼纳什均衡。商人有激励创建类似于上述博弈中惩罚机制的机制,这是相对于合同执行制度的一种分权制度,分权制度有助于克服这样的理论观点倾向:法律执行的效果完全归因于利用集中执法机构(如立法院和警察局)的能力。 在法律制度方面,米尔格罗姆、格雷夫和温格斯特做出了进一步的贡献,他们应用重复博弈模型诠释了欧洲商业行会的作用。中世纪时期,欧洲经营环境混乱,长途贸易中的商人容易遭遇人身攻击、货物没收和契约无执行力等诸多风险,商人因此需要当地统治者对其人身、财产和契约的援助。但是,驱使统治者帮助商人的激励源自哪里?他们的关键洞见是,在有效的贸易层面上,无论是双边或多边的声誉机制都不具备统治者有保护外籍商人的激励。真正的原因是,失去单个商人或者一个商人小团体的贸易而给当地统治者造成的损失极小。因此,单个商人不足以制止当地统治者没收货物或鼓励他们付出资源、政治资本来保护贸易商。阻止统治者不良行为的有效惩罚需要能提供给统治者有价值的所有商人的广泛合作。现在问题是,什么样的激励使得商人不得不参与集体抵制?这就是商人行会的作用,商人行会有权惩罚不遵守行会宣布的抵制措施的行会会员。米尔格罗姆等探究了分权制度在协调和激励契约执行中的广泛作用,类似于声誉机制的作用。 米尔格罗姆等论证了正式制度和声誉机制的相互作用。他们认为无论是声誉机制还是正式制度本身都不能完全有效,它们是整个系统内互补的组成部分,只有组合在一起制度才能有效地发挥作用,也只有这样才有助于克服这样的不良倾向:法律、经济和政治理论都认为,执法机构是完全唯一的具有集中执法能力的正式制度。由此,米尔格罗姆等认为组织机构应建立分权的执行制度。
6 `9 ~* e. n1 O) K& }# z7 u+ f- Q' D( `
|