纳什均衡

「纳什均衡」的各地常用名稱
「纳什均衡」的各地常用名稱
中国大陸	纳什均衡
臺灣	納許均衡、奈許均衡
港澳	納殊均衡、拿殊均衡

定理、解決方案概念、平衡类型
上级分类	解決方案概念
话题方面	博弈论
得名自	约翰·福布斯·纳什
公式定義
理论提出者	约翰·福布斯·纳什

在博弈论中，纳什均衡（英語：Nash equilibrium，或稱纳什均衡点）是指在包含兩個或以上參與者的非合作博弈（Non-cooperative game）中，假設每個參與者都知道其他參與者的均衡策略的情況下，沒有參與者可以透過改變自身策略使自身受益時的一個概念解。^[1]該術語以约翰·福布斯·納什命名。在博弈論中，如果每個參與者都選擇了自己的策略，並且沒有玩家可以透過改變策略而其他參與者保持不變而獲益，那麼當前的策略選擇的集合及其相應的結果構成了納什均衡。即若 $p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]$ ，則稱s為納許均衡點，其中： $p_{i}$ 為參與者i的收穫（payoff）， $s_{i}$ 代表所有參與者之策略， $r_{i}$ 代表參與者i的一種可能策略， $(s;r_{i})$ 指參與者i單方面改變策略為 $r_{i}$ 。^[2]

發展歷史

納許平衡的命名來由為美國數學家约翰·福布斯·纳什。該概念的其中一個版本已知最早於1838年被安托万·奥古斯丁·库尔诺運用於他的寡占理論中。在庫爾諾的理論中，商行們需選擇合適的產量以獲得最大利潤，然而一家商行的理想產量取決於其他商行的產量。當每一家商行的理想產量都需要根據已知其他商行的產量來做出調整，以達到最大利潤時，一種純策略的納許平衡——庫爾諾平衡（英语：Cournot equilibrium）就形成了。在分析平衡穩定性的過程中，庫爾諾還提出了最適反應（英语：Best response）動態（或最佳反應（英语：Best response）動態）的概念。然而納許對平衡的定義比庫爾諾的更為廣泛，也比帕勒托效率平衡的定義更為廣泛，因為納許的定義沒有針對「形成哪種平衡最為理想」作出評判。

與此相反，現代博弈論中的納許平衡概念是用混合策略來定義的，其中的參與者傾向於符合概率分布，而非動作合理性。约翰·冯·诺伊曼和摩根斯頓在1944年出版的《博弈論與經濟行為（英语：Theory of Games and Economic Behavior）》（英語：Theory of Games and Economic Behavior）一書中提出混合策略納許平衡的概念，然而他們的分析侷限於零和博弈這一特例。書中表明對於任何零和博弈，只要動作集合有限，就存在混合策略納許平衡。納許在1951年發表了文章《非合作博弈》（英語：Non-Cooperative Games），意在定義上述這種混合策略納許平衡，並證明這樣一場博弈至少存在一個（混合策略）納許平衡。之所以納許對上述存在性的證明能夠比馮·諾伊曼的更具普遍性，關鍵在於他對平衡所下的定義。根據納許的說法，「平衡點是當其餘參與者的策略保持不變時，能夠令參與者的混合策略最大化其收益的一個n元組」。在1950年發表的一篇論文中，僅憑著將問題置於該框架中的做法，納許就成功運用了角谷不動點定理；在1951年發表的改版論文中，納許運用了布勞威爾不動點定理。上述兩者共同證明了，存在至少一種混合策略的策略組合（英語：strategy profile），能夠針對有限參與者博弈（不一定是零和博弈）的情況自我映射，即一種不需要為提高收益而變更策略的策略組合。^[3]

自納許平衡概念形成以來，已經有博弈理論家發現，在某些情況下該概念所做的預測頗具誤導性（或缺乏唯一性）。這些理論家提出了許多相關的解概念（英语：Solution concept）（也稱為納許平衡的「微調」），意在彌補納許平衡概念中已知的瑕疵。其中一個尤為重要的問題是，某些納許平衡所依據的並非「實質性」威脅。1965年賴因哈德·澤爾騰提出子博弈完全平衡（英语：Subgame perfect equilibrium），以排除基於非實質性威脅的平衡。納許平衡的其他延伸概念闡述了重複博弈產生的影響，或資訊不完整對博弈的影響。然而，後人的微調與延伸都用到了一個關鍵性理解，也是納許概念的存在基礎：一切平衡概念都是在分析在每個參與者都考慮其他參與者的決定的情況下，最終選擇是什麼。

例子

其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑10年；如果两人均招供，将均被判刑2年。如果两人均不招供，将最有利，只被判刑半年。于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。这时个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯的博弈矩阵		囚犯乙
囚犯的博弈矩阵		招供	不招供
囚犯甲	招供	各判刑2年	甲立即释放，乙判刑10年
囚犯甲	不招供	甲判刑10年，乙立即释放	各判刑半年

基于经济学中“理性经济人”的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事實上，这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”（也叫非合作均衡），換言之，在此情況下，無一參與者可以「獨自行動」（即單方面改變決定）而增加收穫。

学术争议和批评

第一，纳什的关于非合作博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非建設性的（non-constructive），就是说纳什用角谷不动点定理证明了平衡不动点解是存在的，但却不能指出以什么建設性的算法如何去达到这个平衡不动点解。这种非建設性的发现对现实生活裡的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下卻找不到，因此仍不能解决问题。^{[來源請求]}

第二，纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是，博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为，但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论（有人称之为tiny-scale toy case）。^{[來源請求]}

这个假设的不完善处，可能比假设大家都是合作的更严重。因为在经济学中，一个庞大社会裡的人极不可能全部都是合作的，非合作的情况通常在庞大对象的情形中更普遍，而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提，却仍然停留在两三个节点的小规模博弈论中，这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文^[4]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的，找到纳什均衡点是几乎不可能的事。目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作，证明对某些博弈来说，穷全世界所有计算机之力，在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信，计算机找不到，人类也不可能找到。纳什均衡属于NP问题，Daskalakis证明它属于NP问题的一个子集，不是通常认为的NP-完全问题，而是PPAD（英语：PPAD）-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

不過在同一篇論文裡，Daskalakis也指出，在參與者匿名的情況下，則僅需多項式時間即可逼近纳什均衡。

參見

參考文獻

^ Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.
^ P.287, Annals of Mathematics 1951
^ Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.
^ Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始内容存档 (PDF)于2021-02-24）.

參考書目

Non-Cooperative Games, 约翰·纳什, The Annals of Mathematics 1951

外部链接

纳什博弈论的原理与应用（页面存档备份，存于互联网档案馆）北京晚报 (2002年3月21日)

[Osborne-1] Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.

[2] P.287, Annals of Mathematics 1951

[3] Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.

[4] Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始内容存档 (PDF)于2021-02-24）.

[1]

[2]

[3]

[4]

查论编博弈论专题
定义	正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好
均衡概念（英语：Solution concept）	纳什均衡 · 强纳什均衡（英语：Strong Nash equilibrium） · 子博弈均衡（英语：Subgame perfect equilibrium） · 贝叶斯-纳什均衡 · 贝叶斯完美均衡（英语：Perfect Bayesian equilibrium） · 颤抖手完美均衡 · 恰当均衡（英语：Proper equilibrium） · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡（英语：Quasi-perfect equilibrium） · 进化稳定策略（英语：Evolutionarily stable strategy） · 风险占优（英语：Risk dominance） · 帕累托最优 · 自我应验均衡（英语：Self-confirming equilibrium） · 马尔可夫完美均衡（英语：Markov perfect equilibrium） · 默滕斯稳定均衡（英语：Mertens-stable equilibrium） · 核（英语：Core (game theory)） · 夏普利值（英语：Shapley value） · 吉布斯均衡（英语：Potentialg ame） · 量子响应均衡（英语：Quantal response equilibrium） · 谢林点
策略	优势策略 · 纯策略 · 混合策略 · 以牙還牙 · 冷酷触发策略（英语：Grim trigger） · 策略复制论证（英语：Strategy-stealing argument） · 逆向归纳法（英语：Backward induction） · 前向归纳法（英语：Forward induction） · 马尔可夫策略（英语：Markov strategy）
博弈类型	对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商（英语：Cheap talk） · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈（英语：Global game） · 甄别博弈（英语：screening game） · 讨价还价问题（英语：Bargaining problem） · 多人博弈（英语：n-player game） · 大型泊松博弈（英语：Large Poisson game） · 严格决定博弈 · 潜博弈（英语：Potential game） · 位勢賽局
博弈模型	围棋 · 國際象棋 · 无限棋（英语：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可选择的囚徒博弈（英语：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 协调博弈（英语：Coordination game） · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 膽小鬼博弈 · 智猪博弈 · 性别战 · 獵鹿賽局 · 賭便士（英语：Matching pennies） · 最後通牒賽局（海盗博弈） · 石头、剪子、布 · 獨裁者賽局（信任游戏） · 公共財賽局（英语：Public goods game） · 纳什讨价还价问题（英语：Nash Bargaining Game） · 上校賽局 · 消耗战 · 少数派博弈（El Farol酒吧问题） · 公平分配博弈（切蛋糕问题（英语：Fair cake-cutting）） · 古诺竞争 · 死結 · 库恩扑克游戏（英语：Kuhn poker） · 甄别博弈（英语：Screening Game） · 公主与怪兽游戏（英语：Princess and monster game） · 约会问题（英语：Rendezvous problem） · 囚徒帽子谜题（英语：Prisoners and hats puzzle）
定理	极值定理 · 纯化定理（英语：Purification theorem） · 无名氏定理 · 显示定理（英语：Revelation principle） · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理
关键人物（英语：List of game theorists）	阿尔伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文（英语：David K. Levine） · 戴维·M·克雷普斯（英语：David M. Kreps） · 唐纳德·B·吉利斯（英语：Donald B. Gillies） · 朱·弗登博格（英语：Drew Fudenberg） · 埃里克·马斯金 · 哈罗德·W·库恩（英语：Harold W. Kuhn） · 赫伯特·亚历山大·西蒙（司马贺） · 埃尔维·穆兰（英语：Hervé Moulin） · 让·梯若尔 · 让-弗朗索瓦·默滕斯（英语：Jean-François Mertens） · 珍妮弗·图尔·蔡司（英语：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔（英语：Melvin Dresher） · 梅里尔·M·弗勒德 · 奧嘉·邦達雷娃（英语：Olga Bondareva） · 奥斯卡·莫根施特恩（英语：Oskar Morgenstern） · 保罗·米尔格龙 · 佩顿·杨（英语：Peyton Young） · 赖因哈德·泽尔腾 · 羅伯特·阿克塞爾羅 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯（英语：Samuel Bowles (economist)） · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见	全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论（英语：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 对抗分析（英语：Confrontation analysis） · 合作性競爭 · 棋局中的先手优势（英语：First-move advantage in chess） · 博弈机制（英语：Game mechanics） · 博弈论词汇表（英语：Glossary of game theory） · 博弈理论家列表（英语：List of game theorists） · 特殊博弈列表 · 雙輸 · 国际象棋的解局策略（英语：Solving chess） · 拓扑博弈（英语：Topological game） · 公地悲劇 · 小决定暴政

查论编平衡专题
概念	不动点平衡点動態平衡稳态细致平衡暫態穩定性理论判据李雅普诺夫稳定性有界输入-有界输出線性穩定（英语：Linear stability）吸引子隱藏吸引子輸入-狀態穩定性準穩態臨界穩定临界点倾覆点拐点穩定半徑（英语：Stability radius）多稳态双稳临界转换（英语：Critical transition）演化稳定状态（英语：Evolutionarily stable state）稳定措施（維基數據所列：Q44103811）自稳定（英语：Self-stabilization）防护因素（英语：Protective factor）负反馈可控制性可预测性（英语：Predictability）結構穩定性（英语：Structural stability）结构‎ 自发秩序涌现韌性不稳定性去穩定化自由度自由度 (工程学)
自然、工程与社会系统	力學平衡静力平衡流體靜力平衡动力学平衡（英语：Dynamic balance）轉動平衡平衡力（英语：Equilibrant force）熱力學平衡热平衡热化（英语：Thermalisation）相平衡汽液平衡分配平衡（英语：Partition equilibrium）可逆过程非平衡定态（德语：Stationärer Prozess）耗散系統化学平衡溶解平衡电离平衡化学稳定性（英语：Chemical stability）勒沙特列原理热稳定性化学稳态（英语：Steady state (chemistry)）質量作用定律催化可逆反應動態平衡地殼均衡辐射平衡穩態 (電子學) 亚稳定性（英语：Metastability (electronics)）体内稳态能量稳态體液平衡（英语：Fluid balance）化学稳态（維基數據所列：Q14905559）血糖水平酸碱平衡酸度系数渗透调节基因表达调控體溫調節人体温度调节（英语：Human thermoregulation）血压调节（維基數據所列：Q14819786）肾素-血管紧张素系统平衡能力平衡觉間斷平衡生态平衡 Alternative stable state（英语：Alternative stable state）生態穩定性抵抗力恢复力遺傳平衡（英语：Genetic equilibrium）竞争均衡（英语：Competitive equilibrium）社會均衡（英语：Social equilibrium）工作與生活的平衡反思平衡（英语：Reflective equilibrium）權力平衡 Balancing (international relations)（英语：Balancing (international relations)）恐怖平衡政治稳定（英语：Political stability）稳定-不稳定悖论‎
經濟与博弈论均衡（德语：Gleichgewicht (Spieltheorie)）	纳什均衡强纳什均衡（英语：Strong Nash equilibrium）子博弈均衡（英语：Subgame perfect equilibrium）马尔可夫完美均衡（英语：Markov perfect equilibrium）颤抖手完美均衡恰当均衡（英语：Proper equilibrium） ε-均衡序贯均衡准完美均衡（英语：Quasi-perfect equilibrium）风险占优（英语：Risk dominance）自我应验均衡（英语：Self-confirming equilibrium）默滕斯稳定均衡（英语：Mertens-stable equilibrium）贝叶斯-纳什均衡贝叶斯完美均衡（英语：Perfect Bayesian equilibrium）相关均衡进化稳定策略竞争均衡（英语：Competitive equilibrium）帕累托效率量子响应均衡（英语：Quantal response equilibrium）局部均衡一般均衡理论經濟穩定（英语：Economic stability）物價穩定金融稳定其它相关概念核（英语：Core (game theory)）夏普利值（英语：Shapley value）位勢賽局