博弈论
字数 1381 2025-10-27 08:14:12
博弈论
博弈论是研究具有竞争或合作关系的理性决策者(称为参与者)之间策略互动的数学理论。它分析在既定规则下,参与者如何根据对其他参与者行为的预测,选择最优策略以实现自身利益最大化。
第一步:基本概念与要素
一个博弈模型通常包含以下核心要素:
- 参与者:参与决策的实体,可以是个人、企业或国家。假设参与者是理性的,即总是以最大化自身收益为目标。
- 策略:每个参与者在博弈中可供选择的完整行动方案。所有策略的集合构成该参与者的策略集。
- 收益:在每种可能的策略组合下,每个参与者所获得的结果(效用、利润等),通常用数值表示。
- 信息:参与者对其他参与者特征、策略和收益的了解程度。完全信息是指所有参与者的收益函数是公共知识。
第二步:博弈的表示形式
博弈主要有两种表述方式:
- 标准式(策略式):适用于静态博弈(参与者同时行动或不知他人行动)。通常用一张收益矩阵表示。例如,经典的“囚徒困境”有两个参与者(囚徒A和B),每个参与者有两个策略(坦白、抵赖),收益矩阵清晰地展示了所有策略组合下的结果。
- 扩展式(树形图):适用于动态博弈(参与者轮流行动)。它通过博弈树表示,包含了决策节点、行动分支、信息集(表示参与者是否知道之前的历史)和终点收益。这能直观展示行动的先后顺序和信息结构。
第三步:核心解概念——纳什均衡
这是博弈论中最重要的概念,由约翰·纳什提出。在一个策略组合中,如果没有任何一个参与者可以通过单方面改变自己的策略而获得更高的收益,那么这个策略组合就构成了一个纳什均衡。在均衡状态下,每个参与者的策略都是对其他参与者策略的最优反应。它是预测博弈结果的关键工具。在“囚徒困境”中,(坦白,坦白)就是一个纳什均衡,尽管对双方而言(抵赖,抵赖)的收益更高,但在单方面改变策略会让自己更糟的情况下,无人愿意主动偏离。
第四步:博弈的主要类型
根据参与者之间的利益关系,博弈可分为:
- 零和博弈:参与者的利益完全对立,一方的收益等于另一方的损失,总和为零。例如,扑克牌游戏。
- 非零和博弈:参与者的利益并非完全对立,可能存在共同利益。大部分经济和社会互动都属于此类,如“囚徒困境”和“协调博弈”。
第五步:合作博弈与非合作博弈
这是另一重要分类:
- 非合作博弈:重点分析参与者在协议不具有外部约束力的情况下,如何独立做出策略选择以最大化个人收益。前述的纳什均衡就是非合作博弈的核心解概念。
- 合作博弈:重点分析参与者之间如何形成联盟(合作团体),以及如何公平地分配联盟带来的总收益。其核心解概念包括核、沙普利值等,常用于分析投票、成本分摊等问题。
第六步:进阶概念与应用
在掌握了上述基础后,可以进一步探索:
- 重复博弈:当同一个博弈重复进行多次时,参与者可能会为了长期利益而选择合作(如“以牙还牙”策略),这为解决“囚徒困境”等单次博弈中的非最优均衡提供了思路。
- 不完全信息博弈:参与者不完全了解其他参与者的收益函数。对此,贝叶斯纳什均衡是其解概念。
- 演化博弈论:将博弈论与生物学演化思想结合,研究群体中策略的分布如何随时间变化而达到稳定状态,不要求参与者完全理性。
- 应用领域:博弈论广泛应用于经济学(拍卖、寡头竞争)、政治学(投票行为)、计算机科学(网络路由、人工智能多智能体系统)和生物学(进化稳定策略)等众多领域。