首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法
【24h】

符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法

机译:基于合成语音的未指定说话人声学模型的自适应语音编码方法

获取原文
获取原文并翻译 | 示例
       

摘要

現在,IP電話端末から音声認識システムを利用する場合,音声データ通信時における音声圧縮?伸張(符号化)の影響より固定電話と比較して音声認識精度が低下する問題がある.これを回避するため,符号化された多量の音声データを用いて音響モデルを再学習,及び適応する手法が提案されている.しかし,再学習や適応に必要となる多量の音声データを収集することは多大な労力と時間が必要となる.そこで本論文では,音声データの収集を必要としない音響モデル適応手法を提案する.本提案手法は,認識に用いる音響モデルから適応に必要な音声データを自己生成する手法である.本論文ではこの手法を実現するため,音響モデルの各分布より音素波形を合成し適応に用いる「合成音素波形による音響モデルの分布適応法」と連続音声を合成し適応に用いる「連続合成音声を用いた音響モデル適応法」を提案する.符号化方式G723.1を用いた音声認識実験結果より,連続合成音声を用いた音響モデル適応法は適応前の音響モデルの認識精度を改善することが分かった.これらの結果より,提案手法は適応データの収集を必要とせず,符号化音声を高精度に認識する手法として有効であるといえる.
机译:当前,当使用来自IP电话终端的语音识别系统时,由于语音数据通信期间语音压缩/解压缩(编码)的影响,存在语音识别精度低于固定电话的问题。为了避免这种情况,已经提出了一种使用大量编码的音频数据来重新学习和调整声学模型的方法。但是,收集重新学习和适应所需的大量音频数据需要大量的工作和时间。因此,在本文中,我们提出了一种不需要收集音频数据的声学模型自适应方法。提出的方法是一种从用于识别的声学模型中自动生成自适应所需的语音数据的方法。在本文中,为了实现该方法,为了实现该方法,“通过合成语音波形对声学模型进行分布自适应的方法”从声学模型的每个分布中合成语音波形,并将其用于自适应;以及“将连续语音合成并用于自适应的连续合成声音”我们提出了使用的声学模型自适应方法。从使用编码方法G723.1的语音识别实验的结果中发现,使用连续合成语音的声学模型自适应方法提高了自适应之前的声学模型的识别精度。从这些结果可以说,提出的方法不需要收集自适应数据,并且作为用于高精度地识别编码语音的方法是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号