...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >短時間パワースペクトルの時間一周波数傾斜の3倍化に基づく音声特徴量を用いた単語認識
【24h】

短時間パワースペクトルの時間一周波数傾斜の3倍化に基づく音声特徴量を用いた単語認識

机译:基于短时功率频谱的时间频率斜率三倍的语音特征量来识别

获取原文
获取原文并翻译 | 示例
           

摘要

音声認識で用いられる代表的な特徴量としてMFCC(Mel Frequency Cepstrum Coefficient)やLPC(Linear Predictive Coefficient)ケプストラムが挙げられるが,雑音がある環境下ではこれらの特徴畳を利用して音声認識を行うと,認識率が著しく低下する. そこで著者らは以前に周波数軸方向のスペクトル傾斜を3値化した値に基づく特徴畳FTTSS(Fourier Transform of Ternalized Spectral Slope)を提案し,その特徴量の耐雑音性についてMFCCとの比較を行い,単語音声認識において有用性を確認することができた.本研究では特徴量の△に代わる特徴畳を提案することを目的に,短時間パワースペクトルの時間軸方向のスペクトル傾斜を3値化することに基づく特徴畳を用い音声認識にもたらす効果を実験的に検証する.
机译:语音识别中使用的MFCC(MEL频率谱系齐数)和LPC(线性预测系数)谱包括在具有噪声的环境中使用这些特征Tatami的噪声识别。识别率显着降低。因此,作者提出了巨大化光谱斜率的特征变换基于先前一直是Tatami FTTS的Tatmerged值的值(Ternalized光谱斜率的傅立叶变换)及其特征量。与MFCC的比较可以与MFCC进行比较,并且可以在语音识别中确认有用性。 在该研究中,为了提出特征量的特征转动到δ的特征,通过使用短时间功率谱的时轴方向的时轴方向的特征倾斜来实验地使用带来语音识别的效果。验证。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号