纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。
当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。
扩展资料;
纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。
要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。
所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。
混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。
当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。
因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。
然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。
参考资料来源;百度百科——纳什平衡
一.纳什均衡(又叫做纳什平衡):纳什平衡又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。二.占优策略:占优策略是博弈论中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。三.纳什均衡和占优策略有2点不同:1、两者的性质不同:(1)纳什均衡的性质:一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。(2)占优策略的性质:每一个博弈中的企业通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在公司的商务竞争过程中,具有占优策略的一方无疑拥有明显的优势,处于竞争中的主动地位。占优策略有时是显而易见的。2、两者的作用不同:(1)纳什均衡的作用:改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具。(2)占优策略的作用:在某些情况下,企业的占优策略并非外在的和显性的,需要企业管理层比较各种可能的发展策略所带来的风险和收益,并最终确立可行的占优策略。就双寡头格局而言,当其中的一方发现、确立并开始实施其占优策略时,其唯一的竞争对手将陷于进退维谷之中。而对手的犹豫不决又会进一步坚定优势策略拥有方的信心和策略的实施力度。除非占优策略一方遇到不可抗力等因素的影响,或被动的一方通过非常规措施强化了自己的竞争能力,否则两者之间的相对地位很难得到改变。以上供参考。TensorFlow框架的前身是Google的DistBelief V2,是谷歌大脑项目的深度网络工具库,一些人认为TensorFlow是借鉴Theano重构的。Tensorflow一经开源,马上引起了大量开发者的跟进。Tensorflow广泛支持包括图像、手写字、语音识别、预测和自然语言处理等大量功能。TensorFlow遵循Apache 2.0开源协议。TensorFlow在2017年2月15号发布了其1.0版本,这个版本是对先前八个不完善版本的整合。以下是TensorFlow取得成功的一些列原因:TensorFLow提供这些工具:TensorBroad是一个设计优良的可视化网络构建和展示工具;TensorFlow Serving通过保持相同的服务器架构和API,可以方便地配置新算法和环境。TensorFlow Serving 还提供开箱即用的模型,并且可以轻松扩展以支持其他的模型和数据。TensorFlow编程接口包括Python和C++,Java,Go,R和Haskell语言的接口也在alpha版中支持。另外,TensorFlow还支持谷歌和亚马逊的云环境。TensorFlow的0.12版本支持Windows 7, 8, Server 2016系统。由于采用C++ Eigen库,TensorFlow类库可以在ARM架构平台上编译和优化。这意味着你可以不需要额外实现模型解码器或者Python解释器就可以在多种服务器和移动设备上部署训练好的模型。TensorFlow提供细致的网络层使用户可以构建新的复杂的层结构而不需要自己从底层实现它们。子图允许用户查看和恢复图的任意边的数据。这对复杂计算的Debug非常有用。分布式TensorFlow在0.8版本推出,提供了并行计算支持,可以让模型的不同 部分在不同设备上并行训练。TensorFlow在斯坦福大学,伯克利学院,多伦多大学和Udacity(2016年3月成立的在线学校)均有教学。TensorFlow的缺点有:每个计算流必须构建成图,没有符号循环,这样使得一些计算变得困难;没有三维卷积,因此无法做视频识别;即便已经比原有版本(0.5)快了58倍,但执行性能仍然不及它的竞争者。欢迎分享,转载请注明来源:夏雨云
评论列表(0条)