...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル
【24h】

形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル

机译:基于形态学信息和词内位置信息的语音识别语音模型

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

話し言葉における発声変形をモデル化するため、文脈決定木を用いた状態クラスタリングにおいて、音素コンテキストの情報以外に品詞情報を利用する方法と音素の単語内位置情報を利用する方法とを提案する。品詞情報を利用する方法では、話し言葉の音声データから推定した単語継続時間長をもとに、品詞を2つのクラスタに分類する。 各音素についてクラスタ別に初期モデルを構築し、音素コンテキストに関する質問に加えて所属クラスタに関する質問を用いた決定木による状態クラスタリングを行う。 単語内位置情報を利用する方法では、各音素について語頭か語末かそれ以外かを考慮した初期モデルを構築し、音素コンテキストに関する質問に加えて語頭語末に関する質問を用いた決定木による状態クラスタリングを行う。 CSJ (Corpus of Spontaneous Japanese)コーパスを用いた連続音声認識実験を行った結果、品詞情報を利用した方法では単語正解精度がテスト話者7名の平均で最大で2.4ポイント向上し、単語内位置情報を用いたモデルでは単語正解精度が最大で6.1ポイント向上した。
机译:为了对口语中的语音转换进行建模,我们提出了一种使用除语音上下文信息之外的部分词信息的方法以及一种使用上下文确定树在状态聚类中使用语音单词中位置信息的方法。在使用分词信息的方法中,基于从口语单词的语音数据估计的单词持续时间,将分词分为两个聚类。为每个语音的每个群集构建一个初始模型,并使用决策树执行状态群集,该决策树使用有关电话所属群集的问题以及有关语音上下文的问题。在使用词内位置信息的方法中,会考虑一个初始模型,该模型考虑每个语音是否是开头,结尾或其他事物,然后使用决策树执行状态聚类,该决策树除了使用有关电话上下文的问题外,还使用有关单词开头和结尾的问题。 ..由于使用CSJ(自发日语的Corpus)语料库进行了连续的语音识别实验,因此七个测试讲话者的单词正确答案准确度平均提高了最多2.4点,并且通过使用部分歌词信息的方法提高了单词中的位置信息。在模型使用中,单词正确答案的准确性提高了6.1点。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号