首页> 中国专利> 一种基于多任务学习的多语种识别模型的构建和训练方法

一种基于多任务学习的多语种识别模型的构建和训练方法

页面导航

摘要
著录项
相似文献

摘要

本发明涉及一种多任务的语种识别的模型构建方法和训练方法，包括：使用无监督预训练方式对wav2vec模型进行第一次预训练；根据包括语种识别和数据有效识别在内的任务要求建立包含多语种样本数据的训练样本集；采用训练样本集中的样本数据对第一次预训练好的wav2vec模型再进行第二次预训练；针对于所述任务要求对第二次预训练好的wav2vec模型进行适应性微调后构建出最终的多语种识别模型；再次采用训练样本集中样本数据对所述多语种识别模型进行训练，使多语种识别模型能够同时识别输入语音数据的语种和话音有效性。本发明实现了对语种识别和有效话音识别两种任务的同时识别，提高了语种识别的准确率和识别效率。

著录项

公开/公告号CN113889090A

专利类型发明专利
公开/公告日2022-01-04

原文格式PDF
申请/专利权人北京中科智加科技有限公司;
展开▼

申请/专利号CN202111152422.7
发明设计人陈玮;冯少辉;张建业;
展开▼

申请日2021-09-29
分类号G10L15/06(20130101);G10L15/16(20060101);G10L15/00(20130101);G06N3/08(20060101);G06N3/04(20060101);G06K9/62(20060101);
代理机构11386 北京天达知识产权代理事务所(普通合伙);
代理人李明里
地址 100083 北京市海淀区学院路51号10层1010、1011室
入库时间 2023-06-19 13:32:21

相似文献

专利
中文文献
外文文献

1. 一种基于多任务学习的多语种识别模型的构建和训练方法 [P] . 中国专利： CN113889090A . 2022-01-04
2. 一种基于联邦学习与多任务学习的模型训练方法 [P] . 中国专利： CN112348199A . 2021-02-09
3. METHOD FOR AUTOMATIC CONSTRUCTION OF ACRONYM DICTIONARY BASED ON ACRONYM TYPE, RECORDING MEDIUM THEREOF AND APPARATUS FOR AUTOMATIC CONSTRUCTION OF ACRONYM DICTIONARY BASED ON ACRONYM TYPE [P] . 韩国专利： KR20080026931A . 2008-03-26

机译：一种基于字典类型的字典自动构建方法，其记录介质及基于字典类型的字典自动构建方法
4. A method of producing a recombinant elastomeric domain of Trib-2mut, a genetic engineering construct pGDTrib2mut, determining the biosynthesis of Trib-2mut in E. coli cells, a strain producing E. coli M15 / pGDTrib2mut and a method for producing a polymer material based on this protein [P] . 俄罗斯专利： RU2015139343A . 2017-03-21

机译：一种产生Trib-2mut重组弹性体结构域的方法，一种基因工程构建体pGDTrib2mut，确定大肠杆菌细胞中Trib-2mut的生物合成，一种产生大肠杆菌M15 / pGDTrib2mut的菌株以及一种基于聚合物的聚合物材料的制备方法在这种蛋白质上
5. METHOD AND APPARATUS FOR TRAINING A CHARACTER DETECTOR BASED ON WEAK SUPERVISION, SYSTEM AND MEDIUM [P] . 美国专利： US2020250416A1 . 2020-08-06

机译：一种基于弱监督的字符检测器训练方法及装置，系统和介质