首页> 中国专利> 数据处理方法、文本识别模型的生成方法和文本识别方法

数据处理方法、文本识别模型的生成方法和文本识别方法

页面导航

摘要
著录项
相似文献

摘要

本申请提出一种数据处理方法、文本识别模型的生成方法和文本识别方法，其中，数据处理方法包括：对待处理文本进行分词处理，得到分词结果；对分词结果中的分词进行编码，得到分词结果的编码，其中，分词结果的编码包括至少两类编码，至少两类编码中各类编码为分词关于各类字符的编码，各类字符中至少一类字符属于数学字符；根据分词结果的编码，确定训练样本。本申请获得的训练样本所训练的模型，能够提高处理数学相关自然语言处理任务的能力。

著录项

公开/公告号CN113033200B

专利类型发明专利
公开/公告日2021-08-24

原文格式PDF
申请/专利权人北京世纪好未来教育科技有限公司;
展开▼

申请/专利号CN202110581037.8
发明设计人宁亚光;
展开▼

申请日2021-05-27
分类号G06F40/289(20200101);G06F40/126(20200101);G06F40/216(20200101);G06F16/35(20190101);G06N3/08(20060101);
代理机构11313 北京市铸成律师事务所;
代理人王姗姗;郭丽祥
地址 100080 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
入库时间 2022-08-23 12:20:59

相似文献

专利
中文文献
外文文献

1. 数据处理方法、文本识别模型的生成方法和文本识别方法 [P] . 中国专利： CN113033200B . 2021.08.24
2. 文本识别模型训练方法、文本识别方法、装置及电子设备 [P] . 中国专利： CN113963358B . 2022.03.04
3. JUDICIAL TEXT RECOGNITION METHOD, TEXT RECOGNITION MODEL OBTAINING METHOD, AND RELATED DEVICE [P] . WO2021051957A1 . 2021-03-25

机译：司法文本识别方法，文本识别模型获取方法和相关设备
4. TEXT RECOGNITION MODEL ESTABLISHING METHOD AND DEVICE [P] . 世界知识产权组织专利： WO2017143973A1 . 2017-08-31

机译：文本识别模型的建立方法和装置
5. TEXT SUBTITLE DATA PROCESSING METHOD AND AN APPARATUS THEREOF FOR GENERATING A THREE-DIMENSIONAL SUBTITLE GENERATED FROM TEXT SUBTITLE DATA [P] . 韩国专利： KR20110018261A . 2011-02-23

机译：用于生成从文本字幕数据生成的三维字幕的文本字幕数据处理方法及其装置