首页> 中文期刊>电子产品世界 >学贯中西(10):从RL领会如何与不确定性共舞

学贯中西(10):从RL领会如何与不确定性共舞

     

摘要

1前言在上一期里,我们说明了当人类的慢想(创意)与AI的快思(直觉)互相平衡时,最能展现协同创造力。有了AI经验直觉来协助去芜存菁,人类更敢超越经验去进行大跨度的联想和探索。这样的协同组织体系,非常适合与高度不确定的外在环境(Environment)互动,并从外在环境获取最大的回报。这是自然界生物(有机体系)的天赋学习本质,非常接近于AI强化学习(Reinforcement Learning,简称RL)机制。例如,AlphaGo Zero增添了RL,就具有更强大的探索能力,能够在不确定性极大的围棋上打败人类的顶尖高手,如图1。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号