首页> 外文期刊>電子情報通信学会技術研究報告 >対話データの統計量を用いたPOMDPによる対話制御
【24h】

対話データの統計量を用いたPOMDPによる対話制御

机译:POMDP使用对话数据统计信息进行对话控制

获取原文
获取原文并翻译 | 示例
           

摘要

We propose a method that generates appropriate agent dialogue control for users by training a large amount of human to human dialogue data. We offer two technical points to resolve this issue. One is the automatic acquisition of POMDPs' (partially observable Markov decision process's) state transition probabilities, output probabilities and rewards through DBNs (Dynamic Bayesian Networks) with a large amount of dialogue data, and the other is applying rewards from the emission probabilities of agent actions into POMDPs' reinforcement learning. This paper proposes a method to simultaneously achieve purpose-oriented and stochastic naturalness-oriented action controls. Our experimental results demonstrate the effectiveness of our framework, which shows that the agent can generate both actions without being locked into either of them.%本研究では,ユーザに対してエージェントが適切な行動を決定する対話制御(方策)を人対人の行動系列を記録したデータから自動的に学習する手法を提案する.これを実現するため本稿では次の二つの手法を用いる.(1)エージェント設計者が実現したいデータ中の行動系列(目標行動系列)を選択し,このデータからDBN(Dynamic Bayesian Network)を学習し,POMDP(partially observable Markov decision process)に変換する.このPOMDPの状態遷移確率,出力確率,報酬から方策を学習する.(2)自然な対話を実現するため,学習データの統計的性質に基づく対話制御のための状態,報酬を(1)のDBNとPOMDPに付加する.これにより,目標行動系列を達成しかつデータの統計的特徴を持つ行動を生成する対話制御を実現する.シミュレーション実験により,本手法の有効性を確認した.
机译:我们提出了一种方法,该方法通过训练大量的人与人之间的对话数据来为用户生成适当的代理对话控制。我们提供了两个技术要点来解决此问题。一种是通过大量对话数据通过DBN(动态贝叶斯网络)自动获取POMDP(部分可观察到的马尔可夫决策过程)的状态转换概率,输出概率和奖励,另一种是从代理的发射概率中获取奖励对POMDP的强化学习采取的行动。本文提出了一种同时实现目标导向和随机自然导向动作控制的方法。我们的实验结果证明了我们框架的有效性,表明该代理可以生成两个动作而不会被任何一个锁定。%本研究では,ではーザに対してエージェントが适切な行动を决定する対话制御(方策)を人対人の行动系列を记录したデータから自动的に学习する手法を进行する。これを実现するため本稿では次の二つの手法を用いる。(1)エージェント设计者が実现したいデータ中の行动系列(目标行动系列)を选択し,このデータからDBN(动态贝叶斯网络)を学习し,POMDP(部分可观察到的马尔可夫决策过程)に変换する。 (2)自然な対话を実现するため,学习データの统计的性质に基づく対话制御のための状态,报酬を(1)のDBNとPOMDPに付加する。これにより,目标行动系列を达成しかつデータの统计的特徴を持つ行动を生成する対话制御を実现する。シミュレーション実験により,本手法の有效性を确认した。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号