首页> 中国专利> 一种中文文本纠错方法、系统、终端设备及存储介质

一种中文文本纠错方法、系统、终端设备及存储介质

摘要

本申请涉及一种中文文本纠错方法、系统、终端设备及存储介质,属于自然语言处理技术领域,其方法包括以下步骤:接收初始文档,对所述初始文档进行预处理,得到待处理文本;基于预设的第一模型对所述待处理文本进行错误标记处理,得到第一文本;基于预设的第二模型对所述第一文本进行初步纠错处理,纠正第一文本中的错误字符,得到第二文本;基于预设的第三模型对所述第二文本进行精调纠错处理,调整所述第二文本的文本长度,得到最终文本。本申请具有通过三阶段的模型对待处理文本分别进行错误字符标注、错误字符纠正以及多字和少字纠正,提升文本纠正精度的效果。

著录项

  • 公开/公告号CN114510925A

    专利类型发明专利

  • 公开/公告日2022-05-17

    原文格式PDF

  • 申请/专利权人 森纵艾数(北京)科技有限公司;

    申请/专利号CN202210088920.8

  • 发明设计人 聂海姣;吴高丽;邱银贵;

    申请日2022-01-25

  • 分类号G06F40/232;G06F40/205;G06F16/35;G06N3/04;G06N3/08;

  • 代理机构北京维正专利代理有限公司;

  • 代理人谢明晖

  • 地址 101300 北京市顺义区赵全营镇兆丰产业基地园盈路7号

  • 入库时间 2023-06-19 15:22:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-17

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号