首页> 中国专利> 基于映射-化简和分词及邻接排序去重方法

基于映射-化简和分词及邻接排序去重方法

摘要

本发明公开了一种基于Map-Reduce和分词及邻接排序去重方法,通过基于Hadoop的Map-Reduce分布式框架下采用SNM方法的基础上的一种分词排序的邻接排序去重方法,解决了在运用信息抽取技术进行信息抽取时抽取获得的数据存在着数据大量重复的问题,并且设计对数据进行分布式处理,根据字段匹配方法计算记录间的相似度判断记录是否重复,提高整体的去重运行效率。

著录项

  • 公开/公告号CN102163226B

    专利类型发明专利

  • 公开/公告日2013-03-13

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN201110090766.X

  • 申请日2011-04-12

  • 分类号

  • 代理机构杭州裕阳专利事务所(普通合伙);

  • 代理人江助菊

  • 地址 310027 浙江省杭州市西湖区浙大路38号

  • 入库时间 2022-08-23 09:13:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-06-19

    专利实施许可合同备案的生效 IPC(主分类):G06F 17/30 合同备案号:2013330000105 让与人:浙江大学 受让人:银江股份有限公司 发明名称:基于映射-化简和分词及邻接排序去重方法 申请公布日:20110824 授权公告日:20130313 许可种类:普通许可 备案日期:20130425 申请日:20110412

    专利实施许可合同备案的生效、变更及注销

  • 2013-06-19

    专利实施许可合同备案的生效 IPC(主分类):G06F 17/30 合同备案号:2013330000112 让与人:浙江大学 受让人:苏州龙唐信息科技有限公司 发明名称:基于映射-化简和分词及邻接排序去重方法 申请公布日:20110824 授权公告日:20130313 许可种类:普通许可 备案日期:20130426 申请日:20110412

    专利实施许可合同备案的生效、变更及注销

  • 2013-03-13

    授权

    授权

  • 2011-10-05

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20110412

    实质审查的生效

  • 2011-08-24

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号