首页> 外文期刊>Informatica >Optimization of Formant Feature Based Speech Recognition
【24h】

Optimization of Formant Feature Based Speech Recognition

机译:基于共振峰特征的语音识别优化

获取原文
获取原文并翻译 | 示例
           

摘要

The paper deals with the use of formant features in dynamic time warping based speech recognition. These features can be simply visualized and give a new insight into understanding the reasons of speech recognition errors. The formant feature extraction method, based on the singular prediction polynomials, has been applied in recognition of isolated words. However, the speech recognition performance depends on the order of singular prediction polynomials, whether symmetric or antisymmetric singular prediction polynomials are used for recognition and as well on the fact even or odd order of these polynomials is chosen. Also, it is important to know how informative separate formants are, how the speech recognition results depend on other parameters of the recognition system such as: analysis frame length, number of the formants used in recognition, frequency scale used for representation of formant features, and the preemphasis filter parameters. Properly choosing the processing parameters, it is possible to optimize the speech recognition performance. The aim of our current investigation is to optimize formant feature based isolated word recognition performance by varying processing parameters of the recognition system as well as to find improvements of the recognition system which could make it more robust to white noise. The optimization experiments were carried out using speech records of 111 Lithuanian words. The speech signals were recorded in the conventional room environment (SNR = 30 dB). Then the white noise was generated at a predefined level (65 dB, 60 dB and 55 dB) and added to the test utterances. The recognition performance was evaluated at various noise levels. The optimization experiments allowed us to improve considerably the performance of the formant feature based speech recognition system and made the system more robust to white noise.%Darbe yra nagrin?jamas formantini? po?ymi? naudojimas dinaminiu laiko skal?s kraipymu gr?stame kalbos atpa?inime. ?ie po?ymiai yra lengvai vizualizuojami ir suteikia nauj? ?ini? stengiantis suvokti kalbos atpa?inimo klaid? prie?astis. Izoliuot? ?od?i? atpa?inimui buvo pritaikytas i?sigimusiais prognoz?s polinomais gr?stas formantini? po?ymi? i?skyrimo metodas. Ta?iau, kalbos atpa?inimo tikslumas priklauso nuo to, ar atpa?inimui naudojami i?sigim? prognoz?s polinomai yra simetriniai ar antisimetriniai ir ar jie yra lygin?s ar nelygin?s eil?s. Taip pat svarbu i?tirti, kiek informatyvios yra atskiros formant?s, kaip kalbos atpa?inimo rezultatai priklauso nuo kit? atpa?inimo sistemos parametr?: analiz?s kadro ilgio, atpa?inimui naudojam? forman?i? skai?iaus, formantini? po?ymi? atvaizdavimui naudojamos da?ni? skal?s, pradin?s filtracijos filtro parametr?. Tinkamai parinkus ?iuos atpa?inimo sistemos parametrus galima pagerinti sistemos atpa?inimo tikslum?. ?io tyrimo tikslas yra kei?iant atpa?inimo sistemos parametrus optimizuoti formantiniais po?ymiais gr?sto izoliuot? ?od?i? atpa?inimo tikslum? ir surasti atpa?inimo sistemos patobulinimo būdus, kurie padidint? sistemos atsparum? balto triuk?mo poveikiui. Optimizavimo eksperimentai buvo atliekami naudojant 111 lietuvi? kalbos ?od?i? kalbos signalo ?ra?us. Kalbos signalai buvo ?ra?yti ?prastin?je kambario aplinkoje esant 30 dB signalo/triuk?mo santykiui. Tada buvo generuojamas 65 dB, 60 dB ir 55 dB baltas triuk?mas ir pridedamas prie testini? i?tarim? balso ?ra??. Atpa?inimo tikslumas buvo vertinamas esant ?vairiems u?triuk?minimo lygiams. Atlikti optimizavimo eksperimentai pad?jo ?ymiai pagerinti formantiniais po?ymiais gr?stos kalbos atpa?inimo sistemos tikslum? ir padaryti j? atsparesne balto triuk?mo poveikiui.
机译:本文讨论了共振峰特征在基于动态时间扭曲的语音识别中的使用。这些功能可以简单地可视化,并为了解语音识别错误的原因提供了新的见解。基于奇异预测多项式的共振峰特征提取方法已应用于孤立词的识别。但是,语音识别性能取决于奇异预测多项式的阶数,是将对称或反对称奇异预测多项式用于识别,还取决于选择这些多项式的偶数或奇数阶的事实。同样重要的是,要了解信息丰富的分离共振峰如何,语音识别结果如何取决于识别系统的其他参数,例如:分析帧长,识别中使用的共振峰数,用于表示共振峰特征的频率标度,以及预加重滤波器参数。适当选择处理参数,可以优化语音识别性能。我们当前研究的目的是通过改变识别系统的处理参数来优化基于共振峰特征的孤立单词识别性能,以及发现可以使其对白噪声更加鲁棒的识别系统的改进。使用111个立陶宛语单词的语音记录进行了优化实验。语音信号是在常规的室内环境中记录的(SNR = 30 dB)。然后,以预定水平(65 dB,60 dB和55 dB)产生白噪声,并将其添加到测试话语中。在各种噪声水平下对识别性能进行了评估。优化实验使我们能够大大改善基于共振峰特征的语音识别系统的性能,并使该系统对白噪声更加鲁棒。%Darbe yra nagrin?jamas formantini? po?ymi? naudojimas dinaminiu laiko skal?s kraipymu gr?stame kalbos atpa?inime。 ?ie po?ymiai yra lengvai vizualizuojami ir suteikia nauj?妮stengiantis suvokti kalbos atpa?inimo klaid? prie?astis。伊佐利奥特我吗? atpa?inimui buvo pritaikytas i?sigimusiais预后?s polinomais gr?stas formantini? po?ymi?我?skyrimo metodas。 Ta?iau,kalbos atpa?inimo tikslumas priklauso nuo to,ar atpa?inimui naudojami i?sigim?预后polinomai yra simetriniai ar antisimetriniai ir ar jie yra lygin?s ar nelygin?eil?s。 Taip pat svarbu i?tirti,kiek informatyvios yra atskiros共振峰,kaip kalbos atpa?inimo rezultatai priklauso nuo kit? atpa?inimo sistemos parametr ?: analiz?s kadro ilgio,atpa?inimui naudojam?我吗? skai?iaus,formantini? po?ymi? atvaizdavimui naudojamos da?ni? skal?s,pradin?s filtracijos filtro parametr?。 Tinkamai parinkus?iuos atpa?inimo sistemos parametrus galima pagerinti sistemos atpa?inimo tikslum?。 io tyrimo tikslas yra kei?iant atpa?inimo sistemos parametrus optimizuoti formantiniais po?ymiais gr?sto izoliuot?我吗? atpa?inimo tikslum? ir surasti atpa?inimo sistemos patobulinimobūdus,kurie padidint? Sistemos atsparum? balto triuk?mo poveikiui。最优化111行为? kalbos?od?i? kalbos signalo吗? Kalbos signalai buvo“ ra?yti” prastin“ je kambario aplinkoje esant 30 dB signalo / triuk?mo santykiui。 Tada Buvo Generuojamas 65 dB,60 dB ir 55 dB baltas triuk?mas ir pridedamas prie testini?我塔里木?也吗? Atpa?inimo tikslumas buvo视网膜炎可有效吗?vairiems u?triuk?minimo lygiams。否,您是否可以在eksperimentai网站上找到自己的网站?jo ymiai pagerinti formantiniais po?ymiais gr?stos kalbos atpa?inimo sistemos tikslum?帕德里第(J) atsparesne balto triuk?mo poveikiui。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号