首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >部分距離空間上の索引を用いたDTW距離順の音声中の検索語検出法
【24h】

部分距離空間上の索引を用いたDTW距離順の音声中の検索語検出法

机译:使用局部距离空间上的索引的DTW距离顺序语音中的搜索词检测方法

获取原文
获取原文并翻译 | 示例
           

摘要

あらまし音声中の検索語検出(Spoken Term Detection; STD)とは,ある特定の検索語が音声データ中の どこで発話されたかを特定するタスクであり,ウェブ上などに音声を含むマルチメディアコンテンツが大量に存 在するようになった現在,活発な研究活動が行われている分野である.STDに対する手法の一つとして,部分距 離空間上の索引付けに基づく方法が提案されている.この手法の大きな特長は,索引に含まれる距離情報に基づ き,尤もらしい候補から順番に検索結果を高速に出力できることである.そのため,従来手法のように検索の際 に,必ずしもしきい値を設定する必要はない.しかし,単純な実装では検索結果が厳密な累積距離順になってい ない,また検索語音節列と発話候補音節列の距離計算の際を直線パスで対応付けるため認識誤り(脱落,挿入) に頑健でないという問題があった.本研究では,距離順計算の厳密化に加え,代替距離尺度と累積距離計算の Dynamic Time Warping (DTW)化の二つの非直線検出のための拡張を行い,性能改善を図った.評価実験の 結果,索引を用いないDTWと同一の検索性能を約3倍高速に達成し,わずかに距離順厳密性の制約を緩めた場 合は約120倍高速な検索が可能なことが分かった.
机译:概述语音术语检测(STD)是一项任务,用于识别音频数据中说出特定搜索术语的位置,并且网络上有大量的多媒体内容,包括音频。作为STD的一种方法,提出了一种基于局部距离空间索引的方法,作为STD的一种方法。其主要特征是可以根据索引中包含的距离信息从最有可能的候选项按顺序高速输出搜索结果,因此,在搜索时阈值并不总是像常规方法那样设置。然而,在一个简单的实现中,搜索结果并不是按照严格的累积距离顺序排列的,并且由于搜索项音节与发音候选音节之间的距离计算与直线路径相关,因此会产生识别错误(丢失,插入)。在本研究中,除了进行更严格的距离排序计算外,我们还将累积距离计算的替代距离范围和动态时间规整(DTW)扩展了两次非线性检测。评估实验的结果是,与不带索引的DTW相同的搜索性能快了大约3倍,而对距离顺序严格性的限制稍有放松,则快了大约120倍。事实证明,它是可搜索的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号