首页> 外文期刊>電子情報通信学会論文誌 >発音変形依存モデルを用いた講演音声認識
【24h】

発音変形依存モデルを用いた講演音声認識

机译:使用语音相关模型进行语音识别

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本研究では話し言葉の音声認識で問題となる各種変動要因のうち,不明りょうな発音などを中心とrnした発音変形の問題について検討する.一般に発音変形への対処として,一つの表記に対し想定される読みを複rn数登録する方法がとられる.しかし単純に読みを増加させるとマッチングの対象が増加し,逆に認識時に悪影響rnを及ぼす.そこで本研究では発音変形の言語的な偏りを利用するため,発音変形を考慮した形態素解析データにrn基づく言語モデルを提案する.以上を実硯するため,「日本語話し言葉コーパス」(CSJ)の書き起こしテキストrnを利用して,約95万語からなる発音変形のエントリを含む学習テキストを作成,それに基づき言語モデルを学習rnする.CSJに含まれる講演音声の認識実験を行い,4講演の平均で単語誤り率(WER)の改善率は26.5%を達rn成し,話し言葉の認識においては,発音変形への対処が重要であることを示した.また言語モデルや音響モデルrnの教師なし適応法を導入することにより,更なる性能向上を目指した結果,WERが適応なしの場合の21.8%かrnら,言語モデル及び音響モデルの教師なし適応を行った場合で17.6%に減少した.
机译:在这项研究中,我们调查导致语音识别问题的各种因素中,以未知发音为中心的发音转换问题。通常,采用针对具有多个rn数的一种符号注册预期阅读的方法,作为针对发音变换的措施。但是,如果仅增加读数的数量,则匹配对象的数量就会增加,反之,这会对识别产生不利影响。因此,在本研究中,我们提出了一种基于形态学分析数据的基于rn的语言模型,该模型考虑了语音变化,以利用语音变化的语言偏向。为了实现上述目的,使用“日语口语语料库”(CSJ)的转录文本rn来创建包含约95万个单词的发音变化条目的学习文本,并且基于该学习模型来学习语言模型。做。进行了CSJ中包含的语音识别实验,平均4堂课的单词错误率(WER)改善率达到26.5%,在语音识别中,应对发音变形很重要。我证明了。另外,通过针对语言模型和声学模型rn引入一种无监督的自适应方法,我们的目标是进一步提高性能,因此,无自适应的WER占21.8%。完成后,它下降到17.6%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号