...
首页> 外文期刊>Elektronika >Szczegóły implementacyjne algorytmów do rozpoznawania mowy
【24h】

Szczegóły implementacyjne algorytmów do rozpoznawania mowy

机译:语音识别算法的实现细节

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

This paper presents and compares the speech recognition algorithms in the context of their subsequent implementation on the hardware platform OMAP DSK. The main task was to compare two classical methods used in speech recognition systems GMM vs HMM (GMM - Gaussian Mixtures Models, HMM - Hidden Markov Models). In the article improved Gaussian Mixtures Model called GMM-UBM (Gaussian Mixtures Model Universal Background Model) were described and compared. Preprocessing of the input signal using MFCC and LPCC coefficients (Mel Frequency Cepstral Coefficients, Linear Prediction Cepstral Coefficients) were described. Analyzed data model consists set of 10-elements that represents Polish language digits 0-9. Research is done on a set of 3000 records prepared by our team with disjoint sets of learners and trainees. Methods are compared on the same input data. The same set of input data allows for reliable comparison of these classifiers to choose effective classifier for identifying isolated voice phases.%W artykule zaprezentowano i porównano algorytmy do rozpoznawania mowy w kontekście ich późniejszej implementacji na platformie sprzętowej DSK OMAP. Głównym zadaniem było dogłębne porównanie dwóch klasycznych metod wykorzystywanych w rozpoznawaniu mowy GMM vs HMM (ang. GMM Gaussian Mixtures Models, ang. HMM - Hidden Markov Models). W artykule jest również opisana i porównana metoda ulepszonych mikstur gaussowskich GMM-UBM (ang. GMM UBM - Gaussian Mixtures Model Universal Background Model). Parametryzacja sygnału w oparciu o współczynniki MFCC oraz LPCC (ang. Mel Frequency Cepstral Coefficients, ang. Linear Prediction Cepstral Coefficients) została opisana. Analizowany model składał się ze zbioru 10-elementowego reprezentującego cyfry mowy polskiej 0-9. Badania zostały przeprowadzone na zbiorze 3000 nagrań, które zostały przygotowane przez nasz zespół. Porównanie wyników wykonano dla rozłącznych zbiorów uczących oraz trenujących. Każda z opisywanych metod klasyfikacji operuje na tych samych danych wejściowych. Daje to możliwość miarodajnego porównania jakości tych klasyfikatorów jako skutecznych narzędzi do rozpoznawania izolowanych fraz głosowych.
机译:本文介绍并比较了语音识别算法在硬件平台OMAP DSK上的后续实现。主要任务是比较用于语音识别系统GMM与HMM的两种经典方法(GMM-高斯混合模型,HMM-隐马尔可夫模型)。在这篇文章中,描述并比较了称为GMM-UBM(高斯混合物模型通用背景模型)的改进高斯混合物模型。描述了使用MFCC和LPCC系数(梅尔频率倒谱系数,线性预测倒谱系数)对输入信号进行的预处理。分析的数据模型由代表波兰语数字0-9的10个元素组成。我们的团队与不相关的学习者和受训者一起编写的3000条记录集已完成研究。方法在相同的输入数据上进行比较。同一组输入数据可对这些分类器进行可靠比较,以选择有效的分类器,以识别孤立的语音相位。%W GMM vs. HMM(ang。GMM高斯混合模型,ang。HMM-隐马尔可夫模型)GMM vs HMM。 GMM-UBM(ang。GMM UBM-高斯混合模型通用背景模型)。 MFCC oraz LPCC的Parametriczacjasygnałuw oparciu owspółczynniki参数(ang。Mel频率倒谱系数,ang。线性预测倒谱系数)zostałaopisana。 Analizowany模型składałsięze zbioru 10-elementowegoreprezentującegocyfry mowy polskiej 0-9。 Badaniazostałyprzeprowadzone na zbiorze 3000nagrań,którezostałyprzygotowane przez naszzespół。 Porównaniewynikówwykonano dlarozłącznychzbiorówuczącychoraztrenujących。 Każdaz opisywanych metod klasyfikacji operuje na tych samych danychwejściowych。 Daje tomożliwośćmiarodajnegoporównaniajakościtychklasyfikatorówjako skutecznychnarzędzido rozpoznawania izolowanych frazgłosowych。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号