首页> 中国专利> 文本纠错模型的训练方法、文本纠错处理方法和装置

文本纠错模型的训练方法、文本纠错处理方法和装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本申请公开了文本纠错模型的训练方法、文本纠错处理方法和装置，涉及自然语言处理和深度学习技术领域。方案为：获取目标文本，对目标文本中的部分文本片段进行掩码，得到掩码文本，采用文本预测模型对掩码文本进行预测，得到源文本，若源文本与目标文本不匹配，则根据目标文本对源文本进行标注，得到标注的训练样本，采用标注的训练样本对文本纠错模型进行训练。本申请中基于无标注的目标文本，将预测错误的源文本采用对应的目标文本进行标注，得到标注的训练样本，实现了训练样本的自动生成，提高了样本生成的效率，进而提高了模型的训练效果，解决了现有技术中基于人工标注生成训练样本，效率低下，模型训练效果差的技术问题。

著录项

公开/公告号CN111950292A

专利类型发明专利
公开/公告日2020-11-17

原文格式PDF
申请/专利权人北京百度网讯科技有限公司;
展开▼

申请/专利号CN202010574805.2
发明设计人王硕寰;刘佳祥;欧阳轩;孙宇;
展开▼

申请日2020-06-22
分类号G06F40/30(20200101);G06F40/253(20200101);G06F40/117(20200101);G06K9/62(20060101);G06N20/00(20190101);
代理机构11201 北京清亦华知识产权代理事务所(普通合伙);
代理人石茵汀
地址 100085 北京市海淀区上地十街10号百度大厦2层
入库时间 2023-06-19 08:55:10

法律信息

法律状态公告日

法律状态信息

法律状态
2023-06-27

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 文本纠错模型的训练方法、文本纠错处理方法和装置 [P] . 中国专利： CN111950292A . 2020-11-17
2. 文本纠错模型训练、文本纠错方法及相关装置 [P] . 中国专利： CN112395864B . 2021.04.06
3. TEXT PROCESSING MODEL TRAINING METHOD, AND TEXT PROCESSING METHOD AND APPARATUS [P] . WO2021047286A1 . 2021-03-18

机译：文本处理模型训练方法和文本处理方法和装置
4. METHOD AND DEVICE FOR ERROR CORRECTION MODEL TRAINING AND TEXT ERROR CORRECTION [P] . 世界知识产权组织专利： WO2014117549A1 . 2014-08-07

机译：纠错模型训练和文本错误纠正的方法和装置
5. METHOD AND DEVICE FOR ERROR CORRECTION MODEL TRAINING AND TEXT ERROR CORRECTION [P] . 美国专利： US2014214401A1 . 2014-07-31

机译：纠错模型训练和文本错误纠正的方法和装置