首页> 中国专利> 一种博弈对话中基于对话历史和强化学习的多轮对话方法

一种博弈对话中基于对话历史和强化学习的多轮对话方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种博弈对话中基于对话历史和强化学习的多轮对话方法，属于智能体和强化学习模型领域。该方法包括如下步骤：首先将多轮对话作为一个有限重复博弈的过程，存储已经结束的完整多轮对话，构建既往对话历史信息库；然后在一个新的多轮对话中，基于记忆网络构建对手行动估计模型，用当前对话已经进行的轮次去检索对话历史信息库，通过多步估计产生对手下一步策略的估计向量；最后基于编码‑解码模型融合当前对话的信息和估计向量，做出下一步的应答。本发明在多轮对话过程中，将既往对话历史的估计向量和当前对话历史的回应向量进行融合，能够更充分地利用了历史信息，使得对话机器人(智能体)具备更高的适应性、做出更好的应答。

著录项

公开/公告号CN113111241A

专利类型发明专利
公开/公告日2021-07-13

原文格式PDF
申请/专利权人浙江大学;同盾控股有限公司;
展开▼

申请/专利号CN202110378191.5
发明设计人庄越挺;汤斯亮;程广钊;谭炽烈;肖俊;李晓林;蒋韬;
展开▼

申请日2021-04-08
分类号G06F16/9032(20190101);G06F16/908(20190101);G06N3/04(20060101);G06N3/08(20060101);
代理机构33200 杭州求是专利事务所有限公司;
代理人傅朝栋;张法高
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2023-06-19 11:49:09

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-06

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种博弈对话中基于对话历史和强化学习的多轮对话方法 [P] . 中国专利： CN113111241A . 2021-07-13
2. 对话历史记录管理装置、对话装置和对话历史记录管理方法 [P] . 中国专利： CN104902065A . 2015-09-09
3. Dialogue history management apparatus, dialogue apparatus and dialog history management method [P] . 日本专利： JP6302707B2 . 2018-03-28

机译：对话历史管理设备，对话设备和对话历史管理方法
4. Method for producing interactive dialog model for occupant of motor car, involves obtaining output dialog action based on special model dialog and representing output dialog action by human dialog participant [P] . 德国专利： DE102013209778A1 . 2013-12-05

机译：产生用于汽车乘员的交互式对话模型的方法，包括获得基于特殊模型对话的输出对话动作，并由人工对话参与者表示输出对话动作。
5. GROUP CONVERSATION SERVICE METHOD IN A GROUP CONVERSATION SYSTEM AND A DEVICE THEREOF CAPABLE OF ACCURATELY UNDERSTANDING A GROUP CONVERSATION OF A GROUP CONVERSATION ROOM BY RECEIVING A GROUP CONVERSATION MESSAGE [P] . 韩国专利： KR20130065781A . 2013-06-20

机译：群组对话系统中的群组对话服务方法及其通过接收群组对话消息而能够正确理解群组对话室的群组对话的装置