首页> 中国专利> 一种考虑概念抽象度的浅层分析自动文档综述方法

一种考虑概念抽象度的浅层分析自动文档综述方法

摘要

本发明涉及一种考虑概念抽象度的浅层分析自动文档综述方法,属于信息检索、情报科学领域。其特征在于:首先对于文档进行预处理并设定抽象度值,然后通过多义词消歧处理把文档中的句子用概念矢量模型表示,再将句子聚类成多个主题相似的簇,接着根据从文集中抽取出的主题词个数确定综述的压缩比,之后确定句子的抽象度,继而依据IMMRA值依次从聚类簇中选取压缩比要求数量个文摘句,最后对抽取的文摘句进行排序并输出综述文档。有益效果:实现了考虑抽象度的自动文档综述,降低自动综述文摘因概念包含关系引起的信息冗余或缺失;方法可以根据主题的数量自适应调整文摘的长度,还可以根据用户的抽象度需求调节综述的归纳度,具有很好的适应性。

著录项

  • 公开/公告号CN101382962B

    专利类型发明专利

  • 公开/公告日2011-03-02

    原文格式PDF

  • 申请/专利权人 西北工业大学;

    申请/专利号CN200810231990.4

  • 发明设计人 郭雷;王晓东;方俊;

    申请日2008-10-29

  • 分类号G06F17/30(20060101);

  • 代理机构61204 西北工业大学专利中心;

  • 代理人王鲜凯

  • 地址 710072 陕西省西安市友谊西路127号

  • 入库时间 2022-08-23 09:06:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-09-03

    专利权的转移 IPC(主分类):G06F 17/30 变更前: 变更后: 登记生效日:20140813 申请日:20081029

    专利申请权、专利权的转移

  • 2011-03-02

    授权

    授权

  • 2009-05-06

    实质审查的生效

    实质审查的生效

  • 2009-03-11

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号