首页> 外文会议>IEEE East-West Design amp;amp;amp; Test Symposium >Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task

【24h】

Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task

机译：在俄语中构建测试语音数据集以便文档检索任务

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

The article presents a technique of creation of speech dataset which is applied for test of spoken document retrieval methods. The dataset includes radio news audio files with speech on Russian language, textual files with spoken words, textual files with recognition words from CMU Pocketsphinx and a set of queries with indication of relevant documents. Query words from the set is labeled with types of recognition errors which are determined word replacement, word distortion, word split and word deletion. The dataset contains expert's indication of documents which are relevant to queries.

机译：该物品介绍了一种创建语音数据集的技术，用于测试口头文档检索方法。该数据集包括俄语语言上的语音，带有语音的无线电新闻音频文件，具有来自CMU Pocketsphinx的识别词的文本文件，以及一组具有相关文档的查询。查询集合中的单词标有类型的识别错误，这些错误是确定的单词替换，单词失真，单词拆分和单词删除。 DataSet包含专家对与查询相关的文档的指示。

著录项

来源
《IEEE East-West Design amp;amp;amp; Test Symposium 》|2018年|929p|共4页
会议地点
作者
Alexandra Tatarinova; Dmitriy Prozorov;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP3-53;
关键词
Speech recognition; Dictionaries; Task analysis; Acoustics; Histograms; Hidden Markov models;

机译：语音识别;词典;任务分析;声学;直方图;隐藏的马尔可夫模型;

相似文献

外文文献
中文文献
专利

1. Improving Keyword Recognition of Spoken Queries by Combining Multiple Speech Recognizer's Outputs for Speech-driven WEB Retrieval Task [J] . Masahiko MATSUSHITA, Hiromitsu NISHIZAKI, Takehito UTSURO, IEICE Transactions on Information and Systems . 2005 ,第3期

机译：通过组合多个语音识别器的输出以执行语音驱动的WEB检索任务，提高口语查询的关键字识别
2. SYLLABLE-BASED CHINESE TEXT/SPOKEN DOCUMENT RETRIEVAL USING TEXT/SPEECH QUERIES [J] . BO-REN BAI, BERLIN CHEN, HSIN-MIN WANG International Journal of Pattern Recognition and Artificial Intelligence . 2000 ,第5期

机译：基于文本/语音查询的基于音节的中文文本/语音文档检索
3. Statistical language models for query-by-example spoken document retrieval [J] . Paula Lopez-Otero, Javier Parapar, Alvaro Barreiro Multimedia Tools and Applications . 2020 ,第11a12期

机译：逐个示例统计语言模型进行查询语音文档检索
4. Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task [C] . Alexandra Tatarinova, Dmitriy Prozorov IEEE East-West Design and Test Symposium . 2018

机译：以俄语为语音文档检索任务构建测试语音数据集
5. Audio parsing and rapid speaker adaptation in speech recognition for spoken document retrieval. [D] . Zhou, Bowen. 2003

机译：语音识别中的音频解析和快速的说话人自适应，可用于语音文档检索。
6. Fast mapping semantic features: Performance of adults with normal language history of disorders of spoken and written language and attention deficit hyperactivity disorder on a word learning task [O] . Mary Alt, Michelle L. Gutmann -1

机译：快速映射语义特征：正常的语言口语和书面语言的障碍病史注意缺陷多动障碍的成年人的表现就一个字学习任务
7. Cross-Language Spoken Document Retrieval Using HMM-Based Retrieval Model with Multi-Scale Fusion [O] . Wai-kit Lo, Helen Meng, P. C. Ching 2009

机译：使用基于HMM的多尺度融合检索模型进行跨语言语音文档检索

Building Test Speech Dataset on Russian Language for Spoken Document Retrieval Task

摘要

著录项

相似文献

相关主题

期刊订阅