首页> 外文会议>EUSIPCO 2008;European signal processing conference >TEXT TEXT-DEPENDENT SPEAKER RECOGNITION BY COMPRESSED FEATURE FEATURE-DYNAMIC DYNAMICS DER S DERIV IVED FROM ED SINUSOIDAL REPRESENT REPRESENTATION OF SPEECH

【24h】

TEXT TEXT-DEPENDENT SPEAKER RECOGNITION BY COMPRESSED FEATURE FEATURE-DYNAMIC DYNAMICS DER S DERIV IVED FROM ED SINUSOIDAL REPRESENT REPRESENTATION OF SPEECH

机译：文本特征相关的说话人识别，通过压缩特征特征动力学从ED的正弦表示法得到

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Prevalent speaker recognition me methods use only spectral thods spectral-envelope based features such as MFCC, ignoring the richspeaker identity information contained in the temporal temporal-spectral dynamics of the entire speech signal. We propose anew feature for speaker recognition based on sinusoidalrepre representation of spe sentation speech ech called compressed spectral d dy- ynamics( namics Sino Sinogram ram-CSD) CSD), which effectively captures suchspectral dynamics and the inherent speaker identity. Thediscriminative pow power of CSD allows er classifica classification tion to r re- emamain simple. The proposed CSD in CSD-MSRI method uses a si sim- mplenearest neigh ple neighbor classifier to deliver bor performance co com- mpetitivepetitive to conventional MFCC+DTW based text text-dependentspeaker recogni recognition methods tion at signif significantly lower icantly co com- mplexity.Plexity.

机译：普遍的说话人识别方法仅使用基于频谱包络的频谱包络特征（例如MFCC），而忽略了整个语音信号的时态时域动态中包含的富说话人身份信息。我们基于语音表达的正弦表示形式，提出了一种新的说话人识别功能，称为压缩频谱动态学（南诺·汉诺·拉姆·CSD），它有效地捕获了这种频谱动态和固有的说话人身份。 CSD的区分电源可以使分类更简单。在CSD-MSRI方法中提出的CSD使用最简单的近邻分类器来提供与基于MFCC + DTW的传统基于文本的依赖于文本的说话者识别方法相竞争的bor性能，显着降低了复杂度。严谨。

著录项

来源
《EUSIPCO 2008;European signal processing conference》|2008年|p.1-5|共5页
会议地点 Lausanne (CH);Lausanne (CH)
作者
Amitava Das; Gokul Chittaranjan; V. Srinivasan;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Integration strategies for audio-visual speech processing: applied to text-dependent speaker recognition [J] . Lucey S., Chen T., Sridharan S., IEEE transactions on multimedia . 2005,第3期

机译：视听语音处理的集成策略：应用于与文本相关的说话人识别
2. The Wavelet and Fourier Transforms in Feature Extraction for Text-Dependent, Filterbank-Based Speaker Recognition [J] . Claude Turner, Anthony Joseph, Murat Aksu, Procedia Computer Science . 2011,第1期

机译：特征提取中的小波和傅立叶变换，用于基于文本的，基于滤波器组的说话人识别
3. Speaker and Channel Factors in Text-Dependent Speaker Recognition [J] . Stafylakis Themos, Kenny Patrick, Alam Md. Jahangir, Audio, Speech, and Language Processing, IEEE/ACM Transactions on . 2016,第1期

机译：文本相关的说话人识别中的说话人和频道因素
4. Text-dependent speaker recognition by compressed feature-dynamics derived from sinusoidal representation of speech [C] . Das Amitava, Chittaranjan Gokul, Srinivasan V. European Signal Processing Conference . 2008

机译：通过从语音的正弦表示得出的压缩特征动力学来识别与文本相关的说话人
5. Compressive nonlinearity for representing speech spectral magnitude to improve noise robustness of automatic speech recognition . [D] . Wong, Brian. 2011

机译：压缩非线性表示语音频谱幅度提高语音自动识别的鲁棒性。
6. One-against-All Weighted Dynamic Time Warping for Language-Independent and Speaker-Dependent Speech Recognition in Adverse Conditions [O] . Xianglilan Zhang, Jiping Sun, Zhigang Luo 2010

机译：不利条件下与语言无关和与说话者相关的语音识别的一对多加权动态时间规整
7. Text-Dependent Speaker Recognition By compressed Feature-Dynamics Derived From Sinusoidal Representation of Speech [O] . Das Amitav 2008

机译：基于语音正弦表示的压缩特征动力学的文本相关说话人识别
8. Speaker Recognition on Lossy Compressed Speech Using the Speex Codec [R] . Stauffer, A. R., Lawson, A. D. 2009

机译：利用speex编解码器对有损压缩语音进行说话人识别

TEXT TEXT-DEPENDENT SPEAKER RECOGNITION BY COMPRESSED FEATURE FEATURE-DYNAMIC DYNAMICS DER S DERIV IVED FROM ED SINUSOIDAL REPRESENT REPRESENTATION OF SPEECH

摘要

著录项

相似文献

相关主题

期刊订阅