基于策略梯度算法的工作量证明中挖矿困境研究

王甜甜; 于双元; 徐保民

首页> 中文期刊>计算机应用 >基于策略梯度算法的工作量证明中挖矿困境研究

基于策略梯度算法的工作量证明中挖矿困境研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对区块链中工作量证明(PoW)共识机制下区块截留攻击导致的挖矿困境问题,将矿池间的博弈行为视作迭代的囚徒困境(IPD)模型,采用深度强化学习的策略梯度算法研究IPD的策略选择.利用该算法将每个矿池视为独立的智能体(Agent),将矿工的潜入率量化为强化学习中的行为分布,通过策略梯度算法中的策略网络对Agent的行为进行预测和优化,最大化矿工的人均收益,并通过模拟实验验证了策略梯度算法的有效性.实验发现,前期矿池处于相互攻击状态,平均收益小于1,出现了纳什均衡的问题;经过policy gradient算法的自我调整后,矿池由相互攻击转变为相互合作,每个矿池的潜入率趋于0,人均收益趋于1.实验结果表明,policy gradient算法可以解决挖矿困境的纳什均衡问题,最大化矿池人均收益.

著录项

来源
《计算机应用》|2019年第5期|1336-1342|共7页
作者
王甜甜; 于双元; 徐保民;
展开▼
作者单位

北京交通大学计算机与信息技术学院,北京100044;

北京交通大学计算机与信息技术学院,北京100044;

北京交通大学计算机与信息技术学院,北京100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
区块链; 工作量证明机制; 博弈论; 深度强化学习; 策略梯度算法;
入库时间 2022-08-18 14:07:46

相似文献

中文文献
外文文献
专利

1. 基于深度确定性策略梯度算法的战机规避中距空空导弹研究 [J] . 宋宏川 ,詹浩 ,夏露 . 航空工程进展 . 2021,第003期
2. 基于深度确定性策略梯度算法的双轮机器人平衡控制研究 [J] . 刘胜祥 ,林群煦 ,杨智才 . 机械工程师 . 2020,第003期
3. 精准扶贫视野下苗族村寨发展策略思考r——基于怀化学院对口扶贫明中村的个案研究 [J] . 易松华 ,颜娟 . 科技视界 . 2018,第006期
4. 研究型大学全日制工程硕士实践基地发展的困境与策略研究--基于案例大学的实证调研 [J] . 焦磊 ,张乐平 ,陈小平 . 研究生教育研究 . 2016,第004期
5. 研究型大学全日制工程硕士实践基地发展的困境与策略研究——基于案例大学的实证调研 [J] . 焦磊1 ,张乐平1 ,陈小平2 . 研究生教育研究 . 2016,第004期
6. Linux系统上的挖矿病毒单机防御策略 [C] . 贺跃军 ,金升 ,沈欢 . 中国计算机用户协会并行处理分会2017-2018年度石油行业计算机用户年会暨新技术研讨会 . 2018
7. 基于变分推理的策略梯度算法研究 [A] . 张棋 . 2021

基于策略梯度算法的工作量证明中挖矿困境研究

摘要

著录项

相似文献

相关主题

期刊订阅