首页> 外文会议>情報処理学会;情報処理学会全国大会 >言語学的な単位に応じた言い間違いの検出
【24h】

言語学的な単位に応じた言い間違いの検出

机译:根据语言单位检测印刷错误

获取原文

摘要

近年,Amazon Echo[1] やGoogle Home[2] などの音声をインタフェースとした対話システムが増えている.しかし,対話システムは人間と円滑なコミュニケーションを取れているとは言い難い.その理由のひとつに,対話システムは人間の言い間違いをそのまま認識しようとして,誤った応答をしてしまうことが挙げられる.そこで本研究では,対話システムに人間の言い間違いを検出し,人間の意図通りに認識したり,言い間違いを指摘するシステムの開発を目指している[3].現在,言い間違いの検出には深層学習を用いているが,学習に必要な言い間違いのコーパスが少ないことから,実用レベルの検出精度ではない.したがって,本論文では検出システムに必要な言い間違いコーパスの拡張手法を提案する.具体的には,言語学的な単位に応じて,統計ベースのルールを用いた手法と翻訳再翻訳を用いた手法の2 つを用いてコーパスの拡張を行う.拡張の量は,ルールを用いた手法では10 倍,翻訳再翻訳を用いた手法では2 倍程度の拡張を行う.また,実験を行い提案手法が有効であるか考察する.
机译:近年来,诸如Amazon Echo [1]和Google Home [2]的声音 使用语音作为界面的对话系统的数量正在增加。 但是,对话系统是与人的顺畅沟通。 很难说它被服用了。原因之一是 让我们认识故事系统中的人为错误 其中之一是做出错误的响应。所以 在这里,在这项研究中,人为失误是在对话系统中发生的。 发现,识别为人为意图并犯错误 我们的目标是开发指出的系统[3]。目前说 深度学习用于发现错误,但用于学习 实用,因为几乎不需要犯错 不是水平检测精度。因此,本文 检测系统所需的错误陈述语料库的扩展 被提议。具体来说,根据语言单位, 使用基于总计的规则和翻译重新翻译的方法 使用两种方法扩展语料库。扩展量 在基于规则的方法中使用翻译重新翻译10次 使用这种方法,扩展执行约2倍。另外,进行实验 考虑所提出的方法是否有效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号