...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >DNNの出力確率から構築したサブワード間及び状態間音響距離によるSTDの精度向上
【24h】

DNNの出力確率から構築したサブワード間及び状態間音響距離によるSTDの精度向上

机译:DNNの出力確率から構築したサブワード間及び状態間音響距離によるSTDの精度向上

获取原文
获取原文并翻译 | 示例
           

摘要

近年,音声データや動画データから特定のシーンを検索するために,音声中の検索語検出(STD:Spoken-Term Detection)の研究が盛んに行われている.STDでは高速化のため,検索対象の音声ドキュメントを予めサブワード認識しておき,システムに検索語が与えられると,検索語のサブワード系列と音声ドキュメントのサブワード系列を照合し,検索結果を出力する.照合の際のサブワード間の距離には,edit distanceやサブワード間音響距離などが使用される.本稿では,検索精度の向上を目的として,HMMを構成する各状態において,DNNより出力される確率分布を用いてサブワード聞及び状態間の音響距離を定義する方式を提案する.これまで我々が用いてきたサブワードHMMの統計量に基づくサブワード間音響距離と提案方式による新たな音響距離との比較実験を,NTCIR-9,10で用いられた4つのテストセットを用いて行づた.GMM-HMMによる音声ドキュメントのサブワード認識結果を用いた場合,提案方式により,サブワード間照合で平均+1.27pt,状態間照合で平均+0.24pt,DNN-HMM による音声ドキュメントのサブワード認識結果を用いた場合,サブワード間照合で平均+4.01pt,状態間照合で平均+2.84pt検索精度が向上し,提案方式の有効性を検証できた.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号