強化学習の最近の発展 第12回：対話処理における強化学習

南泰浩; 目黒豊美

首页> 外文期刊>计测と制御 >強化学習の最近の発展第12回：対話処理における強化学習

【24h】

強化学習の最近の発展第12回：対話処理における強化学習

机译：强化学习的最新进展第十二期：对话处理中的强化学习

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

これまでの対話システムは，切符を買うことや何かを検索することを目的とする，いわゆるタスク指向型のシステムが多かった．筆者たちは，聞き役のようなあらかじめタスクを想定しない対話システムの作成に取り組んでいる．5章では，POMDPによりこのような対話タスクをモデル化し，強化学習により方策を求める手法にらいて述べる．タスクを想定しない，すなわち，非タスク指向型対話システムに対する強化学習手法は，いまだ確立されたとは言い難いが，筆者たちの取り組みが同じようなことを考えている読者の参考になればと思いあえて紹介することにする．

机译：大多数常规的对话系统是所谓的面向任务的系统，其目的是购买票或寻找东西。作者正在创建一个不会预先承担任务的对话系统，例如听众。在第5章中，使用POMDP对此类对话任务进行建模，并使用强化学习来找到度量。很难说还没有建立面向非任务的对话系统的增强学习方法，该方法不承担任务，即尚未建立，但我希望它对在我们的工作中考虑同一件事的读者有所帮助。我将介绍它。

著录项

来源
《计测と制御》 |2013年第10期|共6页
作者
南泰浩; 目黒豊美;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类自动化元件、部件;
关键词
強化学習; 部分観測マルコフ決定過程;

机译：强化学习;部分観测マルコフ决定过程;

相似文献

外文文献
中文文献
专利

1. 強化学習の最近の発展第12回：対話処理における強化学習 [J] . 南泰浩, 目黒豊美计测と制御 . 2013,第10期

机译：强化学习的最新进展第十二期：对话处理中的强化学习
2. 強化学習の最近の発展第8回：連続空間における強化学習によるマルチロボットシステムの協調行動獲得 [J] . 保田俊行, 大倉和博计测と制御 . 2013,第7期

机译：强化学习的最新进展之八：通过在连续空间中进行强化学习来获得多机器人系统的协作行为
3. 強化学習の最近の発展第8回：連続空間における強化学習によるマルチロボットシステムの協調行動獲得 [J] . 保田俊行, 大倉和博计测と制御 . 2013,第7期

机译：钢筋最近发展的第8日：连续空间中加固学习的增强作用
4. 強化学習に基づく最適経路発見問題における対話型多目的意思決定手法の開発 [C] . 山本　浩之, 林田　智弘, 西崎　一郎, 電気学会研究会資料システム制御合同研究会 . 2018

机译：基于强化学习的最优寻路交互式多目标决策方法的开发
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. 強化学習と脳における報酬系の情報処理(脳化学2,数学者のための分子生物学入門-新しい数学を造ろう-) [O] . 石井信, 柴田和久 2006

机译：大脑中奖励系统的强化学习和信息处理（脑化学2，数学家分子生物学导论-让我们做新的数学-）

強化学習の最近の発展 第12回：対話処理における強化学習

摘要

著录项

相似文献

相关主题

期刊订阅

強化学習の最近の発展第12回：対話処理における強化学習