首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >分布間距離ベクトルに基づく音響的類似度とサブワード事後確率の併用による音声検索語検出の改善
【24h】

分布間距離ベクトルに基づく音響的類似度とサブワード事後確率の併用による音声検索語検出の改善

机译:通过基于分布间距离矢量和子词后验概率的声学相似度组合来改进语音搜索词检测

获取原文
获取原文并翻译 | 示例
           

摘要

近年,音声や動画などのマルチメディアコンテンツの配信や利用が拡大しており,高い精度のマルチメディア検索技術が望まれている.音声ドキュメント検索に関しては,与えられた検索語が発話されている箇所を音声ドキュメント中から特定する音声検索語検出(Spoken TermDetection:STD)の研究が盛んに行われている.最も基本的なアプローチとして,音声認識結果を元にサブワード(音素や音節)列としてインデキンングを行い,誤認識や未知語の問題に対処するためサブワード単位の誤りを許容して検索語との類似性を評価する方法が用いられることが多い.以前に我々はサブワード単位音響モデルの分布間距離ベクトルという構造的特徴表現に基づく音響的類似度を検索語検出スコアの評価のために用いることを提案し,検索性能を改善した.本研究では更に大語彙音声認識やサブワードレベルの連続音声誌識での信頼度情報を反映して検出スコアを推定し,従来の方法と併用する方法を提案する·評価実験の結果評価用データとして用いたNTCIR10のSDPWSのデータセットでリファレンスの認識結果のみを用いた結果として,NTCIR10 SpokenDoc2 formal-runでの他の方法の結果よりも高い検出精度を得た.
机译:近年来,诸如音频和视频之类的多媒体内容的分发和使用已经扩展,并且需要高精度的多媒体搜索技术。关于语音文档搜索,正在积极地进行对语音搜索项检测(STD)的研究,该语音搜索项检测识别从语音文档说出给定搜索项的部分。最基本的方法是根据语音识别结果将索引作为子词(声音元素或音节)字符串进行索引,并以子词为单位容忍错误,以解决误识别和未知词以及与搜索词相似的问题。通常用于评估。先前,我们提出基于子词单位声学模型的分布距离矢量的结构特征表达式的声学相似性来评估搜索词检测分数,并提高了搜索性能。在这项研究中,我们通过将可靠性信息反映在大词汇量语音识别和子词级连续语音杂志知识中来进一步估计检测分数,并提出一种与常规方法结合使用的方法。由于仅在使用的NTCIR10的SDPWS数据集中使用参考的识别结果,因此与NTCIR10 SpokenDoc2正式运行中的其他方法相比,获得了更高的检测精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号