数学中“组合博弈论”的起源与发展
我们来循序渐进地探讨“组合博弈论”这一有趣而深刻的数学分支。请你放心,我会仔细讲解,确保你能理解其脉络。
第一步:核心概念与问题的起源(20世纪上半叶)
“组合博弈论”研究的是一类特殊的、规则完全明确的确定性、完全信息、无随机性、两人轮流博弈。关键特征是:正常结束,没有平局,且最后一步行动者获胜。这类游戏没有掷骰子或抽牌带来的运气成分,每一步局势对双方都完全透明。
- 经典游戏实例:其研究对象并非经济学中的策略博弈,而是像尼姆游戏、国际象棋、围棋、西洋跳棋、五子棋等。但国际象棋等游戏过于复杂,早期研究多从更简单的“不偏不倚”游戏入手。
- 关键特征——“不偏不倚”:早期研究的核心是一类特殊组合游戏,称为“不偏不倚游戏”。其特点是:在任何一个游戏局面,双方可用的合法移动集合完全相同。例如,在尼姆游戏中,双方都可以从同一堆中取走任意数量的石子。而象棋则不是不偏不倚的,因为红黑双方的棋子移动方式不同。
- 问题的提出:对于这样一个确定性的游戏,一个根本的数学问题是:给定一个特定局面,在双方都采取最优策略的情况下,先手方是“必胜”、“必败”,还是“必和”? 如果游戏没有和局,那么每个局面都必然有确定的结局。
第二步:理论基础的确立——从尼姆游戏到斯普莱格-格伦迪定理(1930s-1940s)
理论突破始于对“尼姆游戏”的完美分析。
-
尼姆游戏的解析:
- 游戏规则:有若干堆石子,两人轮流从某一堆中取走任意正数数量的石子(可以全取光)。
- 1901年左右,哈佛数学家C. L. Bouton找到了尼姆游戏的完整必胜策略。他引入了关键概念——尼姆和:将各堆石子数进行二进制按位异或运算。结果为0的局势,对“将要移动的玩家”(即当前行棋方)是“必败局面”;结果非0的局势,是“必胜局面”。必胜玩家总可以通过一步移动,将局势变为尼姆和为0的必败局面留给对手。
-
斯普莱格-格伦迪定理的诞生:
- 1930年代,德国数学家Roland Sprague和英国数学家Patrick M. Grundy分别独立地取得了重大突破。
- 他们发现,每一个不偏不倚的、正常结束的组合游戏局面,在数学上都等价于一个特定大小的尼姆堆。
- 格伦迪数的定义:对于一个游戏局面G,其“格伦迪数”(或“尼姆数”)G(G)可以通过递归方式计算:
- 终局(无合法移动的局面)的格伦迪数为0。
- 其他局面的格伦迪数,等于其所有“后续局面”(即走一步可达到的局面)的格伦迪数所组成的集合的最小排斥自然数。
- 定理核心:一个局面的格伦迪数为0,当且仅当该局面是“必败局面”(后手方有必胜策略)。格伦迪数为n(n>0),则先手方可以通过一步操作,将其变成一个格伦迪数为0的局面留给对手,因此是“必胜局面”。
- 加法(并合)原理:更强大的是,对于由多个独立子游戏同时进行的复杂游戏(如多堆尼姆),整个局面的胜负由各个子局面的格伦迪数的“尼姆和”(按位异或)决定。如果总尼姆和为0,则整体是必败局面;否则是必胜局面。
这一理论为所有不偏不倚游戏提供了一个统一、强大且可计算的判定方法,标志着组合博弈论作为一门严谨数学分支的诞生。
第三步:理论的扩展与深化——“偏倚游戏”与超现实数的革命(1970s)
经典理论局限于“不偏不倚”游戏。但现实中有大量游戏双方移动选项不同,如象棋、围棋,甚至是简单的儿童游戏“取石子游戏”(只有一方能取)。这类游戏称为“偏倚游戏”。
-
约翰·何顿·康威的突破:
- 1970年代,英国数学家约翰·何顿·康威为了分析围棋等偏倚游戏,提出了一个极其深刻和优美的理论。
- 他将每一个游戏局面G,用一个新的数系中的“数”来表示,他称之为“博弈”。这个数系就是后来由高德纳命名为超现实数的系统。
-
超现实数的核心思想:
- 一个游戏局面G可以形式化地表示为:
G = { G^L | G^R }。其中,G^L是所有“左方”(通常是先手方)一步可达到的局面集合,G^R是所有“右方”(后手方)一步可达到的局面集合。 - 通过对这种形式的递归定义,可以比较游戏局面的“大小”。例如:
- 局面0 = { | } 表示双方都无法移动的局面,是终局,其值为0。
- 局面1 = { 0 | } 表示左方可以走到0,而右方无步可走。这显然对左方有利,其值为正数1。
- 局面* = { 0 | 0 } 表示无论谁走,下一步都到达终局0。这是一个经典的“先手必胜”的不偏不倚局面,其值既不是正数也不是负数,而是一个“模糊”的无穷小量。
- 胜负判定:对于一个局面x:
- 若 x > 0,则左方必胜。
- 若 x < 0,则右方必胜。
- 若 x = 0,则后手方必胜。
- 若 x 与 0 不可比较(即x模糊,如*),则先手方必胜。
- 这套理论不仅包含了经典的斯普莱格-格伦迪理论(作为其特例),更重要的是,它为所有偏倚游戏提供了一个统一的、可计算的、允许代数运算的分析框架。
- 一个游戏局面G可以形式化地表示为:
第四步:理论的完善、计算复杂性与应用(1980s至今)
-
理论完善:康威与他的合作者(如Berlekamp, Guy)在《稳操胜券》(Winning Ways for Your Mathematical Plays)等著作中,系统阐述了这一理论,并分析了数以百计的具体游戏,展示了其强大威力。他们将游戏按数学性质分类,并研究了其代数结构。
-
计算复杂性问题:
- 理论上,任何有限组合游戏都可以通过逆向分析法确定胜负。但实践上,对于国际象棋、围棋等复杂游戏,状态空间是天文数字,无法用现有计算机在合理时间内完成计算。
- 因此,组合博弈论也研究特定游戏的计算复杂性。例如,已证明广义国际象棋是PSPACE-hard问题,广义围棋是EXPTIME-complete问题,从理论上解释了其难以求解的原因。
-
应用扩展:
- 计算机科学:是人工智能中博弈树搜索算法(如Alpha-Beta剪枝)的理论基础,尤其体现在跳棋、国际象棋、围棋等程序的开发中。1994年,跳棋被证明在双方最优玩法下是平局,是第一个被“解决”的非平凡棋盘游戏。
- 组合数学:为许多组合对象(如图、偏序集)的分析提供了新颖的工具和视角。
- 经济学与生物学:虽然核心是确定性博弈,但其对策略和最优行为的分析思想,对其他博弈模型有启发意义。
总结回顾
组合博弈论的发展路径是:从分析具体游戏(如尼姆) 出发,到建立不偏不倚游戏的普适理论(斯普莱格-格伦迪定理),再到康威通过创建超现实数理论,将理论扩展至所有偏倚游戏,最终形成一个强大、优美、统一的数学体系,并在计算机科学和人工智能等领域找到了深刻的应用。其核心魅力在于,用精确的数学工具,揭示了看似简单的游戏背后深层的代数与序结构。