重复囚徒困境模型中零行列式策略的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本论文研究了重复囚徒困境模型中零行列式（zero-determinant, ZD）策略之间或与经典策略（AllC、AllD、TFT、WSLS）之间的博弈关系。在零行列式策略的集合中，存在一类敲诈型策略，参与者使用该敲诈型策略获得的收益相对于参考相互不合作的收益的盈余，可以是其竞争对手的χ（χ>1）倍。本文推广参考相互不合作收益至更一般的情形，即通过调节参数σ（σ∈[0,1]）使得参考收益值可以在相互不合作收益与相互合作收益之间连续变化。我们推导了ZD策略与ZD策略或者ZD策略与各个经典策略进行博弈的期望收益表达式。首先研究了策略在有限大小的全局耦合人群以及二维正方格子人群中的博弈演化行为，该演化行为是在基于参与者模仿表现更好的近邻策略的规则下进行。我们发现通过调节σ，敲诈型ZD策略（σ~0），虽然可以获得比对手更多的收益盈余，但是这类敲诈型ZD策略在群体中不具有演化稳定性。相反，慷慨型 ZD策略（σ~1），虽然让对手获得更多的收益盈余，但这类慷慨型的ZD策略可以和其他策略在人群中共存，甚至打败其他策略，从而占据优势地位。本文通过对比全局耦合人群中ZD策略之间以及ZD策略与经典策略博弈时的平均收益，从理论及计算机模拟分析了系统达到平衡态时ZD策略的浓度，并利用收益带理论分析了各类策略在二维正方格子上的演化行为。
　　本论文还提出并研究了一种自适应的ZD策略和经典策略在参与者之间具有空间结构人际关系系统中的博弈演化行为。参与者除了可以有一定几率模仿表现好的近邻策略的能力外，使用ZD策略的参与者还可以有一定的更新几率根据所处的竞争环境来调整自己的ZD策略。这种自适应ZD策略可以自我调整为敲诈型ZD策略，来避免在遇到背叛者时一直被对手欺诈或者在遇到无条件合作的参与者时占据优势。自适应ZD策略也可以在遇到有条件合作的策略时进化为慷慨型策略。这种自适应机制可以让ZD策略更具竞争力。模拟结果表明，当ZD策略更快地进行自适应而不是模仿其他策略时，自适应的ZD策略可以打败其他策略或者至少可以与其他策略在系统中共存。

著录项

作者
李勇;
展开▼
作者单位

苏州大学;

展开▼
授予单位苏州大学;
学科物理学
授予学位硕士
导师姓名许晨;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类对策论（博弈论）;
关键词
重复囚徒困境模型; 零行列式策略; 博弈关系; 竞争对手; 空间结构;

相似文献

中文文献
外文文献
专利

1. 美俄在叙利亚危机中的博弈策略分析——基于"重复囚徒困境"的视角 [J] . 黄福灿 ,郑少翀 . 北华大学学报（社会科学版） . 2017,第003期
2. 囚徒困境中的最佳选择──重复博弈条件下的集体行动困境初论 [J] . 袁瑞军 . 科学决策 . 1998,第005期
3. 对重复囚徒困境模型的思考 [J] . 蒋晓伟 ,徐鹏 . 中国经贸 . 2012,第006期
4. 重复囚徒困境的学习和响应模型 [J] . 宋亦泠 ,王秉中 ,朱洪 . 计算机工程与科学 . 2007,第010期
5. 惩罚因子在重复囚徒困境博弈中的研究 [J] . 杨文潮 . 计算机应用与软件 . 2012,第012期
6. 基于马氏链的重复囚徒困境博弈动态模型设计 [C] . 彭亮 ,刘海云 ,刘伟兵 . 第26届中国控制会议 . 2007
7. 重复囚徒困境博弈中群体策略演化研究 [A] . 李冰 . 2018

重复囚徒困境模型中零行列式策略的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅