Open domain continuous filipino speech recognition with code-switching

机译：带代码切换的开放域连续菲律宾语音识别

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

It is widely known that database quality has a huge impact on speech recognition system performance, most especially when the expected domain is well represented. In this paper, we use this idea as leverage for a data-driven solution to the problem of code-switching in Filipino. Practical Filipino conversations often contain English and other loan words in varying frequencies, demanding better training of parameters and models for its speech recognition system. We alleviate the underrepresentation of loan words through the development of a new speech database for training, and applied appropriate data analysis to make reliable evaluation results. The best system was searched via lattice rescoring from a cross-validation set containing almost three hours of unknown speech data. The description and results of our experiments serve as a new and competent baseline model for succeeding future developments.

机译：众所周知，数据库质量对语音识别系统的性能有很大的影响，尤其是当期望的域被很好地表示时。在本文中，我们将这种想法用作解决菲律宾代码转换问题的数据驱动解决方案的杠杆。实用的菲律宾对话通常包含不同频率的英语和其他借词，要求对其语音识别系统进行更好的参数和模型训练。我们通过开发新的语音数据库进行培训来减轻外来词不足的表现，并应用适当的数据分析来得出可靠的评估结果。最好的系统是通过从包含几乎三个小时的未知语音数据的交叉验证集中进行格点搜索来搜索的。我们的实验说明和结果可作为未来成功开发的新的，能胜任的基线模型。

著录项

来源
《IEEE International Symposium on Circuits and Systems》|2014年|2301-2304|共4页
会议地点
作者
Ang Federico; Miyanaga Yoshikazu; Guevara Rowena Cristina; Cajote Rhandley; Bayona Michael Gringo Angelo;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Acoustics; Databases; Decoding; Hidden Markov models; Speech; Speech recognition; Training; Filipino speech; HMM; automatic speech recognition; code-switching;

机译：声学;数据库;解码;隐藏的马尔可夫模型;言语;语音识别;训练;菲律宾语HMM;自动语音识别;代码转换;

相似文献

外文文献
中文文献
专利

1. Open Domain Continuous Filipino Speech Recognition: Challenges and Baseline Experiments [J] . Federico ANG, Rowena Cristina GUEVARA, Yoshikazu MIYANAGA, IEICE transactions on information and systems . 2014,第9期

机译：开放域连续菲律宾语音识别：挑战和基线实验
2. Open Domain Continuous Filipino Speech Recognition: Challenges and Baseline Experiments [J] . Federico ANG, Rowena Cristina GUEVARA, Yoshikazu MIYANAGA, IEICE transactions on information and systems . 2014,第9期

机译：开放域连续菲律宾语音识别：挑战和基线实验
3. Acoustic data augmentation for Mandarin-English code-switching speech recognition [J] . Applied Acoustics . 2020,第Apra期

机译：声学数据增强，用于普通话-英语代码转换语音识别
4. Open domain continuous filipino speech recognition with code-switching [C] . Ang Federico, Miyanaga Yoshikazu, Guevara Rowena Cristina, IEEE International Symposium on Circuits and Systems . 2014

机译：开放域连续菲律宾语音识别与代码切换
5. The Upstart algorithm for pattern recognition in continuous, multiclass domains. [D] . Fanguy, Ronnie Anthony. 2001

机译：用于连续多类域中模式识别的Upstart算法。
6. Initial evaluation of a continuous speech recognition program for radiology [O] . KM Kanal, NJ Hangiandreou, AM Sykes, 2001

机译：放射学连续语音识别程序的初步评估
7. Audio-Visual Large Vocabulary Continuous Speech Recognition In The Broadcast Domain [O] . S Basu, C Neti, N Rajput, 1999

机译：广播领域中的视听大词汇连续语音识别
8. Use of Computer Speech Understanding in Training: A Preliminary Investigation of a Limited Continuous Speech Recognition Capability. [R] . Porter, J. E., Grady, M. W., Hicklin, M. B., 1977

机译：计算机语音理解在训练中的运用：有限连续语音识别能力的初步研究。

Open domain continuous filipino speech recognition with code-switching

摘要

著录项

相似文献

相关主题

期刊订阅