首页> 外文OA文献 >Exploiting pitch dynamics for speech spectral estimation using a two-dimensional processing framework
【2h】

Exploiting pitch dynamics for speech spectral estimation using a two-dimensional processing framework

机译:利用二维处理框架利用语音谱估计的音高动态

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This thesis addresses the problem of obtaining an accurate spectral representation of speech formant structure when the voicing source exhibits a high fundamental frequency. Our work is inspired by auditory perception and physiological modeling studies implicating the use of temporal changes in speech by humans. Specifically, we develop and evaluate signal processing schemes that exploit temporal change of pitch as a basis for high-pitch formant estimation. As part of our development, we assess the source-filter separation capabilities of several two-dimensional processing schemes that utilize both standard spectrographic and auditory-based time-frequency representations. Our methods show quantitative improvements under certain conditions over representations derived from traditional and homomorphic linear prediction. We conclude by highlighting potential benefits of our framework in the particular application of speaker recognition with preliminary results indicating a performance gender-gap closure on subsets of the TIMIT corpus.
机译:本论文解决了当声源表现出高基频时获得语音共振峰结构的准确频谱表示的问题。我们的工作受到听觉感知和生理模型研究的启发,这些研究暗示人类会使用语音的时间变化。具体来说,我们开发和评估信号处理方案,这些方案利用音调的时间变化作为高音共振峰估计的基础。作为开发的一部分,我们评估了几种二维处理方案的源过滤器分离能力,这些方案利用了标准光谱学和基于听觉的时频表示。我们的方法在某些条件下显示出优于传统和同态线性预测的表示的定量改进。最后,我们通过突出我们的框架在说话人识别的特定应用中的潜在好处来结束,并得出初步结果表明在TIMIT语料库的子集上实现了性别差距的有效消除。

著录项

  • 作者

    Wang Tianyu Tom;

  • 作者单位
  • 年度 2008
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号