首页> 中国专利> 音频数据的预训练、模型训练方法、装置、设备及介质

音频数据的预训练、模型训练方法、装置、设备及介质

页面导航

摘要
著录项
相似文献

摘要

本申请提供一种音频数据的预训练、模型训练方法、装置、设备及介质，涉及音频处理技术领域。该方法包括：预训练模型包括：掩码层、第一编码层以及第一前馈层，所述方法包括：采用所述掩码层，对样本音频数据进行掩码处理，得到掩码声学特征；采用所述第一编码层对所述掩码声学特征进行所述第一编码层对应音频任务的编码处理；采用所述第一前馈层对所述编码处理后的声学特征进行掩码重构处理，得到重构预测结果；根据所述重构预测结果，对所述掩码层的掩码参数进行更新，得到目标预训练模型。相对于现有技术，避免了由于样本音频数据质量不高等问题，导致学习到的音频表示的鲁棒性不足的问题。

著录项

公开/公告号CN111899759B

专利类型发明专利
公开/公告日2021-09-03

原文格式PDF
申请/专利权人北京嘀嘀无限科技发展有限公司;
展开▼

申请/专利号CN202010733155.1
发明设计人张睿雄;邹伟;李先刚;
展开▼

申请日2020-07-27
分类号G10L25/03(20130101);G10L19/16(20130101);G06N3/08(20060101);G06N3/04(20060101);G06K9/62(20060101);
代理机构11646 北京超成律师事务所;
代理人裴素英
地址 100193 北京市海淀区东北旺西路8号院34号楼
入库时间 2022-08-23 12:24:48

相似文献

专利
中文文献
外文文献

1. 音频数据的预训练、模型训练方法、装置、设备及介质 [P] . 中国专利： CN111899759B . 2021.09.03
2. 多模态预训练模型的训练方法、装置、设备及存储介质 [P] . 中国专利： CN114005012A . 2022-02-01
3. ULTRASOUND DIAGNOSTIC IMAGING TRAINING APPARATUS, ULTRASOUND DIAGNOSTIC IMAGING APPARATUS, IDENTIFICATION MODEL TRAINING METHOD, NON-TRANSITORY RECORDING MEDIUM STORING COMPUTER READABLE TRAINING PROGRAM, AND ULTRASOUND DIAGNOSTIC APPARATUS [P] . US2021103773A1 . 2021-04-08

机译：超声诊断成像训练装置，超声诊断成像装置，识别模型训练方法，非暂时记录介质存储计算机可读训练程序，以及超声诊断设备
4. PRE-TRAINING METHOD FOR EMOTION ANALYSIS MODEL APPARATUS AND ELECTRONIC DEVICE [P] . KR20210086940A . 2021-07-09

机译：情绪分析模型装置和电子设备的预训练方法
5. MEDICAL MODEL TRAINING METHOD AND APPARATUS, MEDICAL IDENTIFICATION METHOD AND APPARATUS, DEVICE, AND MEDIUM [P] . 世界知识产权组织专利： WO2019136806A1 . 2019-07-18

机译：医学模型训练方法和设备，医学鉴定方法和设备，装置和介质