首页> 外文期刊>Pomiary Automatyka Kontrola >Evaluation of speech corpora for speech and speaker recognition systems
【24h】

Evaluation of speech corpora for speech and speaker recognition systems

机译:语音和说话者识别系统的语音语料库评估

获取原文
获取原文并翻译 | 示例

摘要

Tworzenie zaawansowanych technik przetwarzania oraz rozpoznawania mowy wiąże się z koniecznością pracy z rzeczywistymi próbkami głosu. Dostęp do różnorodnych zbiorów sygnałów mowy jest w tej sytuacji niezwykle pomocny. Posiadając tego typu zasoby, możliwe jest szybsze wykrywanie błędów, jak również lepsze oszacowanie parametrów algorytmów. Celem niniejszego artukułu jest zaprezentowanie dostępnych zbiorów próbek głosu. Dostępne bazy mowy różnią się między sobą między innym jakością, warunkami nagrywania oraz możliwymi zastosowaniami. Część baz zawiera rejestrowane rozmowy telefoniczne, z kolei inne zawierają wypowiedzi zarejestrowane przy użyciu wielu mikrofonów wysokiej jakości. Wykorzystywanie publicznych baz danych ma jeszcze jedną ważną zaletę - umożliwia porównywanie algorytmów stworzonych przez różne ośrodki badawcze, wykorzystujące tę samą metodologię. Uzyskiwane wyniki są prezentowane w postaci benchmarków, co umożliwia szybkie porównywanie opracowanych rozwiązań. Z tego powodu, wybór odpowiedniej bazy mowy jest kluczowy z punktu widzenia skuteczności działania systemu. Każdy ze zbiorów został przedstawiony w formie tabeli. Tabele zawierają opis cech pomocnych podczas wyboru odpowiedniego zbioru próbek głosu.%Creating advanced speech processing and speech recognition techniques involves the need of working with real voice samples. Access to various speech corpora is extremely helpful in such a situation. Having this type of resources available during the development process, it is possible to detect errors quicker, as well as estimate algorithm parameters better. Selecting a proper voice sample set is a key element in the development of a speech processing application. Each speech corpus has been adapted to support different aspects of speech processing. The goal of this paper is to present available speech corpora. Each of them is shown in the form of a table. The tables contain the description of features helpful in choosing a suitable set of voice samples.
机译:创建高级语音处理和识别技术需要使用真实的语音样本。在这种情况下,访问各种语音信号集非常有帮助。使用这种类型的资源,可以更快地检测错误,以及更好地估计算法参数。本文的目的是介绍可用的语音样本集。可用的语音基础在其他质量,录音条件和可能的应用中有所不同。一些数据库包含记录的电话交谈,而其他数据库包含使用许多高质量麦克风记录的语句。使用公共数据库还有另一个重要优势-它使您可以比较使用相同方法由不同研究中心创建的算法。所获得的结果以基准的形式表示,从而可以快速比较已开发的解决方案。因此,从系统性能的角度来看,选择正确的语音库至关重要。每个集合以表格的形式呈现。下表提供了有助于您选择合适的语音样本的功能的描述创建高级语音处理和语音识别技术需要使用真实的语音样本。在这种情况下,访问各种语音语料库非常有帮助。通过在开发过程中使用这种类型的资源,可以更快地检测错误,并更好地估计算法参数。选择合适的语音样本集是语音处理应用程序开发中的关键要素。每个语音语料库已被适配为支持语音处理的不同方面。本文的目的是提出可用的语音语料库。它们每个都以表格的形式显示。下表包含有助于选择合适的语音样本集的功能描述。

著录项

  • 来源
    《Pomiary Automatyka Kontrola》 |2014年第6期|373-375|共3页
  • 作者

    Jacek SLIMOK; Jan KOTAS;

  • 作者单位

    SILESIAN UNIVERSITY OF TECHNOLOGY, FACULTY OF AUTOMATIC CONTROL, ELECTRONICS AND COMPUTER SCIENCE Akademicka Street 16, 44-100 Gliwice, Poland;

    SILESIAN UNIVERSITY OF TECHNOLOGY, FACULTY OF AUTOMATIC CONTROL, ELECTRONICS AND COMPUTER SCIENCE Akademicka Street 16, 44-100 Gliwice, Poland;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    speech recognition; speech processing; speech corpora;

    机译:语音识别;语音处理;语料库;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号