首页> 中国专利> 一种基于深度学习技术的状态空间分解和子目标创建方法

一种基于深度学习技术的状态空间分解和子目标创建方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种基于深度学习技术的状态空间分解和子目标创建方法。根据领域指定的奖励机制,典型的强化学习(RL)代理学习完成指定的任务。为了解决这个问题，开发了一个框架，一个深度RL代理可以使用一个重复的注意机制，从更小的、更简单的域，到更复杂的域。任务以图像和指定目标的指令呈现给代理。这个元控制器通过在状态空间中设计一个较小的子任务序列来引导代理实现它的目标，从而有效地分解目标。

著录项

公开/公告号CN107423813A

专利类型发明专利
公开/公告日2017-12-01

原文格式PDF
申请/专利权人南京晓庄学院;
展开▼

申请/专利号CN201710642392.5
发明设计人王燕清;郑豪;
展开▼

申请日2017-07-31
分类号
代理机构
代理人
地址 211171 江苏省南京市江宁区弘景大道3601号南京晓庄学院信息工程学院
入库时间 2023-06-19 03:56:57

法律信息

法律状态公告日

法律状态信息

法律状态
2018-03-16

实质审查的生效 IPC(主分类):G06N3/04 申请日:20170731

实质审查的生效
2017-12-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于深度学习技术的状态空间分解和子目标创建方法 [P] . 中国专利： CN107423813A . 2017-12-01
2. 基于状态空间分解的双端多状态网络可靠性评估方法 [P] . 中国专利： CN111464400B . 2021.09.24
3. The ‘Property Identification Method’ (“PIM”) is a novel algorithm through which a Real Estate Authority and/or Conveyancing data is created through image-processing a document such as a Council/Shire Rates Notice. This invention establishes a unique algorithm incorporating techniques such deep learning segmentation and computer vision to decode property information. This application utilises computer-implemented technology configured in such manner as to enable conveyancers and real estate agents to automate the creation of client files. [P] . AU2020102233A4 . 2020-10-29

机译： “财产识别方法”（“ PIM”）是一种新颖的算法，通过该算法，可以通过对文件（如市议会/房屋价格通知）进行图像处理来创建房地产管理局和/或产权转让数据。本发明建立了一种独特的算法，该算法结合了诸如深度学习分段和计算机视觉之类的技术来解码属性信息。该应用程序利用以某种方式配置的计算机实现的技术，以使运输商和房地产经纪人能够自动创建客户端文件。
4. A method and arrangement for monitoring the condition of a system by means of a nano technologically based state indicator [P] . 德国专利： DE102014226199A1 . 2016-06-23

机译：一种用于通过基于纳米技术的状态指示器监视系统状态的方法和装置
5. A method and device for calibrating the physics engine of the virtual world simulator used for learning deep learning infrastructure devices, a method for learning a real state network for that purpose, and a learning device using it. [P] . JP6865365B2 . 2021-04-28

机译：一种用于校准用于学习深度学习基础设施设备的虚拟世界模拟器的物理引擎的方法和设备，一种用于为此目的学习真实状态网络的方法，以及使用它的学习设备。