首页> 外文会议>Spoken dialogue systems for ambient environments >Impact of a Newly Developed Modern Standard Arabic Speech Corpus on Implementing and Evaluating Automatic Continuous Speech Recognition Systems

【24h】

Impact of a Newly Developed Modern Standard Arabic Speech Corpus on Implementing and Evaluating Automatic Continuous Speech Recognition Systems

机译：新开发的现代标准阿拉伯语语音语料库对实施和评估自动连续语音识别系统的影响

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

Being current formal linguistic standard and only acceptable form of Arabic language for all native speakers, Modern Standard Arabic (MSA) still lacks sufficient spoken corpora compared to other forms like Dialectal Arabic. This paper describes our work towards developing a new speech corpus for MSA, which can be used for implementing and evaluating any Arabic automatic continuous speech recognition system. The speech corpus contains 415 (367 training and 48 testing) sentences recorded by 42 (21 male and 21 female) Arabic native speakers from 11 countries representing three major regions (Levant, Gulf, and Africa). The impact of using this speech corpus on overall performance of Arabic automatic continuous speech recognition systems was examined. Two development phases were conducted based on the size of training data, Gaussian mixture distributions, and tied states (senones). Overall results indicate that larger training data size result higher word recognition rates and lower Word Error Rates (WER).

机译：作为当前的正式语言标准，并且是所有母语人士只能接受的阿拉伯语形式，与其他方言（如方言阿拉伯语）相比，现代标准阿拉伯语（MSA）仍缺乏足够的口语语料。本文介绍了我们为MSA开发新的语料库的工作，该语料库可用于实现和评估任何阿拉伯语自动连续语音识别系统。语音语料库包含来自11个国家的42个语言（分别来自黎凡特，海湾和非洲）的42位（21位男性和21位女性）阿拉伯语母语人士录制的415（367条培训和48条测试）句子。研究了使用该语音语料库对阿拉伯自动连续语音识别系统整体性能的影响。根据训练数据的大小，高斯混合分布和束缚态（senones）进行了两个开发阶段。总体结果表明，较大的训练数据量会导致较高的单词识别率和较低的单词错误率（WER）。

著录项

来源
《Spoken dialogue systems for ambient environments》|2010年|p.1-12|共12页
会议地点 Gotemba(JP);Gotemba(JP);Gotemba(JP)
作者
Mohammad A.M. Abushariah; Raja N. Ainon; Roziati Zainuddin; Bassam A. Al-Qatab; Assal A.M. Alqudah;
展开▼
作者单位

Faculty of Computer Science and Information Technology, University of Malaya, 50603, Kuala Lumpur, Malaysia,Department of Computer Information Systems, King Abdullah II School for Information Technology, University of Jordan, 11942, Amman, Jordan;

Faculty of Computer Science and Information Technology, University of Malaya, 50603, Kuala Lumpur, Malaysia;

Faculty of Computer Science and Information Technology, University of Malaya, 50603, Kuala Lumpur, Malaysia;

Faculty of Computer Science and Information Technology, University of Malaya, 50603, Kuala Lumpur, Malaysia;

Faculty of Computer Science and Information Technology, University of Malaya, 50603, Kuala Lumpur, Malaysia;

展开▼
会议组织
原文格式 PDF
正文语种 eng
中图分类人工智能理论;
关键词
modern standard arabic; text corpus; speech corpus; phonetically rich; phonetically balanced; automatic continuous speech recognition;

机译：现代标准阿拉伯语语料库语料库语音丰富；语音平衡自动连续语音识别;

相似文献

外文文献
中文文献
专利

1. Modern standard Arabic speech corpus for implementing and evaluating automatic continuous speech recognition systems [J] . Mohammad Abd-Alrahman Mahmoud Abushariah, Raja Noor Ainon, Roziati Zainuddin, Journal of the Franklin Institute . 2012,第7期

机译：用于实现和评估自动连续语音识别系统的现代标准阿拉伯语语音语料库
2. Arabic Speaker-Independent Continuous Automatic Speech Recognition Based on a Phonetically Rich and Balanced Speech Corpus [J] . Mohammad Abushariah, Raja Ainon, Roziati Zainuddin, The international arab journal of information technology . 2012,第1期

机译：基于语音丰富均衡的语料库的阿拉伯语独立于说话人的连续自动语音识别
3. Development of the Arabic Loria Automatic Speech Recognition system (ALASR) and its evaluation for Algerian dialect [J] . Mohamed Amine Menacer, Odile Mella, Dominique Fohr, Procedia Computer Science . 2017,第1期

机译：阿拉伯语Loria自动语音识别系统（ALASR）的开发及其对阿尔及利亚方言的评估
4. Impact of a Newly Developed Modern Standard Arabic Speech Corpus on Implementing and Evaluating Automatic Continuous Speech Recognition Systems [C] . Mohammad A. M. Abushariah, Raja N. Ainon, Roziati Zainuddin, International Workshop on Spoken Dialogue Systems Technology . 2010

机译：新制定的现代标准阿拉伯语语音语料库对自动连续语音识别系统的影响
5. A multimodal fusion approach for automatic postal address recognition system using Optical Character Recognition (OCR) and Automatic Speech Recognition (ASR) techniques. [D] . Singh, Amriteshwar. 2011

机译：一种使用光学字符识别（OCR）和自动语音识别（ASR）技术的自动邮政地址识别系统的多模式融合方法。
6. The Effect of Modern Standard Arabic Orthography on Speech Production by Arab Children With Hearing Loss [O] . Tova Most, Iris Levin, Marwa Sarsour -1

机译：现代标准阿拉伯语正字法对阿拉伯听力障碍儿童言语表达的影响
7. The effects of speakers' gender, age, and region on overall performance of Arabic automatic speech recognition systems using the phonetically rich and balanced Modern Standard Arabic speech corpus [O] . Sawalha M, Abu Shariah M 2013

机译：发言者的性别，年龄和地区对使用语音丰富和平衡的现代标准阿拉伯语言语料库的阿拉伯语自动语音识别系统整体表现的影响

Impact of a Newly Developed Modern Standard Arabic Speech Corpus on Implementing and Evaluating Automatic Continuous Speech Recognition Systems

摘要

著录项

相似文献

相关主题

期刊订阅