首页> 中文学位 >基于CNN的藏族学生国家通用语发音偏误检测研究
【6h】

基于CNN的藏族学生国家通用语发音偏误检测研究

代理获取

目录

展开▼

摘要

在当今这个大发展、大融合的社会,需要人们能够说一口标准的国家通用语,以便对话双方能够精准理解,因此提升国家通用语发音水平已经成了个人发展要求。近年来,随着中国西部大开发计划的实施,与内地的经济和文化交流不断加强深入,藏区经济得到了快速发展。在这样的大背景下,藏族人民对学习国家通用语的需求越来越大,有效的帮助藏语语者学习好国家通用语显得尤为重要。因此,有必要针对藏语语者说国家通用语的发音偏误自动检测技术深入系统地研究。同时,发音偏误自动检测是面向计算机辅助语音训练系统(computerassistedpronunciationtrainingsystem,CAPT)的核心技术,其研究成果对补充现有的学习资源,为学习者提供无障碍的、减少焦虑的和个性化的学习方式,具有重要的意义和实用价值,应用前景广阔。  本文以藏母语人群的国家通用语发音为研究对象,以声母、韵母和声调发音偏误为研究内容,结合语言语音学知识和深度学习技术,对藏母语人群的国家通用语发音偏误自动检测技术方法进行了深入研究。文章主要工作和创新点如下:  语料库数据标注。对本文使用的语料库采用扩展声韵母的标注方式,使每个音节都具有严格的“声-韵-调”三元结构,为此扩展出了7个零声母;并且根据这种三元结构将发音偏误分为声母发音偏误、韵母发音偏误和声调发音偏误三大类别;根据各自的结构特点,又将这三类偏误细分为了64种发音偏误。  国家通用语发音偏误检测。结合链接时序分类技术和神经网络技术,搭建了基于端到端的发音偏误检测模型,并在该模型下完成了藏族学生说国家通用语的发音偏误检测实验。实验结果表明,实验取得了88.35%的正确检测率和14.91%的联合错误率;能够有效的从声母、韵母和声调三个角度检测出藏族学生说国家通用语时的发音偏误信息。  语料库的设计与建立。根据汉藏双语的发音特点及规律设计了PSC-test-1语音数据库,共有2268句语音数据和10个说话人,该语音数据库用来测试系统性能。从4个开源的国家通用语标准发音语音数据库中筛选出了PSC-train-1数据集,用于训练声学模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号