首页> 中国专利> 一种用于训练英语语法改错模型的文本数据生成方法

一种用于训练英语语法改错模型的文本数据生成方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及数据生成技术领域，尤其是一种用于训练英语语法改错模型的文本数据生成方法，其步骤为：(1)句子错误数量的引入；(2)确定错误类型；(3)根据错误类型进行相应的Word Tree替换；(4)利用WMT11单语言数据与One‑Billion‑Word单语言数据生成作为语法改错模型预训练数据，本发明有效提高语法改错模型的效果。

著录项

公开/公告号CN110399936A

专利类型发明专利
公开/公告日2019-11-01

原文格式PDF
申请/专利权人北京先声智能科技有限公司;
展开▼

申请/专利号CN201910719334.7
发明设计人徐书尧;秦龙;陈进;
展开▼

申请日2019-08-06
分类号G06K9/62(20060101);G06F17/27(20060101);G06F17/28(20060101);
代理机构11677 北京中企讯知识产权代理有限公司;
代理人熊亮
地址 100000 北京市海淀区上庄乡上庄村北京市西郊农场机关10幢平房1027
入库时间 2024-02-19 14:26:01

法律信息

法律状态公告日

法律状态信息

法律状态
2019-11-26

实质审查的生效 IPC(主分类):G06K9/62 申请日:20190806

实质审查的生效
2019-11-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种用于训练英语语法改错模型的文本数据生成方法 [P] . 中国专利： CN110399936A . 2019-11-01
2. 一种改错模型训练方法、装置和文本改错方法、装置 [P] . 中国专利： CN103970765A . 2014-08-06
3. BACKLASH AMOUNT MEASUREMENT DEVICE, TRAINED LEARNING MODEL GENERATION DEVICE, TRAINING DATA GENERATION DEVICE, BACKLASH AMOUNT MEASUREMENT METHOD, TRAINED LEARNING MODEL GENERATION METHOD, TRAINING DATA GENERATION METHOD, BACKLASH AMOUNT MEASUREMENT PROGRAM, TRAINED LEARNING MODEL GENERATION PROGRAM, AND LEARNING DATA GENERATION PROGRAM [P] . WO2021260921A1 . 2021-12-30

机译：返回速度测量设备，训练学习模型生成装置，训练数据生成装置，训练量测量方法，训练学习模型生成方法，培训数据生成方法，训练量测量程序，训练学习模型生成程序，以及学习数据生成程序
4. ANNOTATED TEXT DATA EXPANDING METHOD, ANNOTATED TEXT DATA EXPANDING COMPUTER-READABLE STORAGE MEDIUM, ANNOTATED TEXT DATA EXPANDING DEVICE, AND TEXT CLASSIFICATION MODEL TRAINING METHOD [P] . 美国专利： US2019317986A1 . 2019-10-17

机译：带注释的文本数据扩展方法，带注释的文本数据扩展计算机可读存储介质，带注释的文本数据扩展设备以及文本分类模型训练方法
5. ANNOTATION ADDED TEXT DATA EXPANDING METHOD, ANNOTATION ADDED TEXT DATA EXPANDING PROGRAM, ANNOTATION ADDED TEXT DATA EXPANDING APPARATUS, AND TRAINING METHOD OF TEXT CLASSIFICATION MODEL [P] . 日本专利： JP2019185551A . 2019-10-24

机译：注释附加文本数据扩展方法，注释附加文本数据扩展程序，注释附加文本数据扩展设备以及文本分类模型的训练方法