首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討
【24h】

マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討

机译:多流说话人匹配中基于提升的阈值优化方法研究

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本稿では,マルチストリームHMMを用いた話者照合において,ストリーム重みと話者照合スコアの閾値を自動的に最適化する手法について述べる.提案手法では,スペクトル情報と基本周波数(F{sub}0)情報をマルチストリームHMMによって融合して用いる雑音に頑健な話者照合手法において,線形判別分析(LDA)とAdaboostを組み合わせて利用することで,ストリーム重みと閾値を同時に最適化する.提案手法の有効性を確認するため,様々なSN比の白色雑音を重畳した日本語4桁連続数字音声による話者照合実験を行った.実験では,詐称者受理誤り率(FAR: False Acceptance Rate)と本人拒否誤り率(FRR: False Rejection Rate)が等誤り率(EER: Equal Error Rate)となるように照合スコアの閾値を最適化することを目標とした.実験の結果,SN比5~20dBにおいて,FARとFRRがEERとなるように正しくストリーム重みと閾値を最適化できることを確認した.
机译:本文介绍了一种在使用多流HMM的扬声器匹配中自动优化流权重和扬声器匹配分数阈值的方法。在提出的方法中,线性判别分析(LDA)和Adaboost结合使用在噪声稳定的说话人匹配方法中,该方法使用频谱信息和基本频率(F {sub} 0)信息通过多流HMM进行融合。同时优化流的权重和阈值。为了确认所提方法的有效性,我们使用日语4位连续数字语音进行了说话人验证实验,该语音中叠加了各种信噪比的白噪声。在实验中,对整理分数阈值进行了优化,以使错误接受率(FAR)和错误拒绝率(FRR)等于错误率(EER)。目的是这样做。实验结果证实,可以正确优化流的权重和阈值,以使FAR和FRR在SN比为5至20 dB时为EER。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号