首页> 中文学位 >基于重复囚徒困境博弈的风险与合作行为研究
【6h】

基于重复囚徒困境博弈的风险与合作行为研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1选题背景与研究意义

1.2 IPD博弈与演化博弈

1.3 IPD合作问题的发展历史和研究现状

1.4本文研究的关键科学问题、结构安排及创新点

第二章 考虑收益流风险的两方IPD博弈

2.1 IPD中的风险定义

2.2考虑风险的IPD策略学习

2.3实验设计与结果分析

2.4结果讨论与启示

2.5本章小结

第三章 基于动态风险的多agents演化IPD博弈

3.1相关研究

3.2演化模型

3.3实验结果分析

3.4本章小结

第四章 局部博弈、差异化博弈与合作

4.1相关研究

4.2演化模型

4.3实验设计与实验结果

4.4结果讨论与启示

4.5本章小结

第五章 总结与展望

5.1全文内容与创新性总结

5.2本文局限与研究展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

21世纪以来,随着世界经济一体化以及互联网信息技术的快速发展,不同组织、不同个体之间的相互联系已日趋紧密,寻求稳定合作、共同发展的可持续发展战略已经深入每一个领域中。本文通过在重复囚徒困境博弈模型(Iterated Prisoner’s Dilemma, IPD)中引入收益流风险(Income Stream Risk)的概念,研究了个体追求稳定收益,即长期稳定可持续发展,这一目标对个体的合作行为的影响。主要的研究内容与创新性工作包括:
  (1)介绍了合作问题研究的背景、意义以及IPD合作问题研究的基本方法;综合评述了IPD合作问题的研究现状,并提出本文研究的关键科学问题与框架。
  (2)基于收益流风险的概念,将IPD博弈中的风险定义为博弈者在所有阶段PD博弈中收益的标准差,构造了基于收益与风险的博弈效用函数;利用基于小生境技术的双种群协同进化算法模拟了两方IPD博弈过程。实验结果表明,博弈者的风险规避行为对合作有着显著的促进作用。特别地,尽管先前文献指出“合作在重复博弈次数较少的IPD中很难形成”,本文实验证明了若IPD中的两个博弈者均为风险规避者,则双方在重复博弈次数较少时亦能形成高度合作均衡。
  (3)基于前景理论中的“个体在实际收益低于期望收益时将变得风险偏好,在实际收益高于期望收益时将变得风险规避”的结论,构造了agents风险态度与博弈策略协同演化的多agents演化IPD博弈模型。考察了agents分别基于历史收益比较(历史比较)、社会收益比较(社会比较,即群体平均收益比较)进行风险态度调整时,博弈群体的合作演化结果。实验表明,博弈群体在历史比较下将倾向于风险规避行为;因此,agents之间能形成高度合作均衡;但在社会比较下,agents在相互博弈时将倾向于风险偏好行为,仅表现出了较低的合作水平。
  (4)在上述多agents演化IPD博弈模型中进一步引入了agents的局域化博弈以及差异化博弈关系,研究了agents在局部博弈策略以及差异化博弈策略学习下,博弈群体的风险态度调整对合作行为的影响。实验结果表明,在这两种博弈情形下,博弈群体在历史比较下仍呈现出了全局合作均衡,并且在社会比较下呈现出了局部合作行为。此外,在对博弈收益进行高斯扰动后,发现在不确定收益下,博弈群体基于社会比较的局部合作要稳定于其基于历史比较的全局合作。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号