首页> 中国专利> 基于最长公共子序列的文本段落识别对比方法及系统

基于最长公共子序列的文本段落识别对比方法及系统

摘要

本申请公开了一种基于最长公共子序列的文本段落识别对比方法及系统。该文本段落识别对比方法包括:获取第一文本字符串和第二文本字符串;对所述第一文本字符串和所述第二文本字符串进行段落识别;对所述第一文本字符串和所述第二文本字符串进行段落顺序调整;将段落顺序调整后的所述第一文本字符串和所述第二文本字符串进行对比,获得差异项。该文本段落识别对比系统包括:前端、转换模块、段落识别模块、以及对比模块。本申请解决了解决了现有的文档对比工具无法对不能获取段落信息的文档进行对比、以及无法对段落对调情况进行很好的处理的问题。

著录项

  • 公开/公告号CN108734110B

    专利类型发明专利

  • 公开/公告日2022-08-09

    原文格式PDF

  • 申请/专利权人 达而观信息科技(上海)有限公司;

    申请/专利号CN201810374933.5

  • 发明设计人 李瀚清;高翔;纪达麒;陈运文;

    申请日2018-04-24

  • 分类号G06F40/10(2020.01);G06V30/418(2022.01);G06V30/148(2022.01);G06V30/19(2022.01);

  • 代理机构北京知果之信知识产权代理有限公司 11541;北京知果之信知识产权代理有限公司 11541;

  • 代理人唐海力;李志刚

  • 地址 201203 上海市浦东新区亮秀路112号Y1座515室

  • 入库时间 2022-09-06 00:40:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号