首页> 中国专利> 一种基于多任务学习的多语种识别模型的构建和训练方法

一种基于多任务学习的多语种识别模型的构建和训练方法

摘要

本发明涉及一种多任务的语种识别的模型构建方法和训练方法,包括:使用无监督预训练方式对wav2vec模型进行第一次预训练;根据包括语种识别和数据有效识别在内的任务要求建立包含多语种样本数据的训练样本集;采用训练样本集中的样本数据对第一次预训练好的wav2vec模型再进行第二次预训练;针对于所述任务要求对第二次预训练好的wav2vec模型进行适应性微调后构建出最终的多语种识别模型;再次采用训练样本集中样本数据对所述多语种识别模型进行训练,使多语种识别模型能够同时识别输入语音数据的语种和话音有效性。本发明实现了对语种识别和有效话音识别两种任务的同时识别,提高了语种识别的准确率和识别效率。

著录项

  • 公开/公告号CN113889090A

    专利类型发明专利

  • 公开/公告日2022-01-04

    原文格式PDF

  • 申请/专利权人 北京中科智加科技有限公司;

    申请/专利号CN202111152422.7

  • 发明设计人 陈玮;冯少辉;张建业;

    申请日2021-09-29

  • 分类号G10L15/06(20130101);G10L15/16(20060101);G10L15/00(20130101);G06N3/08(20060101);G06N3/04(20060101);G06K9/62(20060101);

  • 代理机构11386 北京天达知识产权代理事务所(普通合伙);

  • 代理人李明里

  • 地址 100083 北京市海淀区学院路51号10层1010、1011室

  • 入库时间 2023-06-19 13:32:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号