首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識
【24h】

基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識

机译:基本周波数情報を用いたダイナミックベイジアンネットワークによる音声認識

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,ダイナミックベイジアンネットワーク(DBN)を用いて,基本周波数情報をHMMに組み込んだモデルを提案する.提案モデルでは,基本周波数の値を量子化し,離散変数としてモデルに組み込む.また,基本周波数を表す変数が音素の種類のみに依存する場合と,音素の種類と1つ前のフレームの自身の値に依存する場合を考える.提案手法の有効性を確認するため,日本語話し言葉コーパス(CSJ)による連続音素認識を行った.モデルの学習と認識にはGMTKを用いた.また,男女別のモデルを用いた場合と,性別非依存のモデルを用いた場合とで実験を行った.実験の結果,混合数1のベースラインモデルに比べて,男女別のモデルでは男性で最大2.7%,女性で3.9%音素正解精度が改善した.また,性別非依存のモデルでは最大3.5%音素正解精度が改善した.また,基本周波数の量子化数が2の場合に,より少ない混合分布数で,ベースラインよりも高い音素正解精度を示すことを確認した.その場合に,基本周波数のフレーム間の依存が重要であることを確認した.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号