首页> 中国专利> 数据处理方法、文本识别模型的生成方法和文本识别方法

数据处理方法、文本识别模型的生成方法和文本识别方法

摘要

本申请提出一种数据处理方法、文本识别模型的生成方法和文本识别方法,其中,数据处理方法包括:对待处理文本进行分词处理,得到分词结果;对分词结果中的分词进行编码,得到分词结果的编码,其中,分词结果的编码包括至少两类编码,至少两类编码中各类编码为分词关于各类字符的编码,各类字符中至少一类字符属于数学字符;根据分词结果的编码,确定训练样本。本申请获得的训练样本所训练的模型,能够提高处理数学相关自然语言处理任务的能力。

著录项

  • 公开/公告号CN113033200B

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 北京世纪好未来教育科技有限公司;

    申请/专利号CN202110581037.8

  • 发明设计人 宁亚光;

    申请日2021-05-27

  • 分类号G06F40/289(20200101);G06F40/126(20200101);G06F40/216(20200101);G06F16/35(20190101);G06N3/08(20060101);

  • 代理机构11313 北京市铸成律师事务所;

  • 代理人王姗姗;郭丽祥

  • 地址 100080 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室

  • 入库时间 2022-08-23 12:20:59

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号