首页> 外文会议> >Sequence-to-sequence モデルによる日本語臨床会話における音声認識・話者ダイアライゼーションの同時実現
【24h】

Sequence-to-sequence モデルによる日本語臨床会話における音声認識・話者ダイアライゼーションの同時実現

机译:通过顺序到序列模型同时实现日本临床谈话中的语音识别和扬声器二胺

获取原文

摘要

本稿では、診療記録を自動的に作成し、医師の効率的な診察を支援するため、医師と患者の臨床会話から発話内容と話者を推定する。従来、これらを音声から自動的に推定するには、音声認識と話者ダイアライゼーションのためのモデルをそれぞれ別に用意する必要があった。しかし、近年、Sequence-to-Sequence(S2S) 音声認識の枠組みを利用し、音声認識とダイアライゼーションを1 つのモデルで同時に実現する手法が提案されている[1]。具体的には、S2S のモデルとしてRNN-Trunsducer (RNN-T) を採用し、音響特徴量を入力し、単語系列だけでなく、発話が医者か患者のどちらのものかを示すラベルを出力する。しかし、英語の音声を対象としており、日本語での評価は行われていない。
机译:在本文中,我们将自动创建医疗记录和 医生和患者的临床谈话支持一定程度的考试 估计语音内容和扬声器。过去,这些声音 语音识别和扬声器模具自动从声音估计 单独使用模型进行联盟 这是必需的。但是,近年来,序列 - 序列(S2S)使用语音识别框架,语音欣赏 与一个型号和嗜睡同时 已经提出了一种介绍方法[1]。具体而言,S2S. 我们采用RNN-Trunsder(RNN-T)作为模型, 进入声学功能,不仅是单词系列,还有医生 输出表示哪个或患者的标签。 但是,它适用于英语声音和 价格尚未完成。

著录项

  • 来源
    《》||819-820|共2页
  • 会议地点
  • 作者

    小島 淳嗣; 小黒 玲;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号