首页> 中国专利> 一种使用本体进行文本文档自动分类的方法

一种使用本体进行文本文档自动分类的方法

摘要

本发明涉及一种使用本体进行文本文档自动分类的方法,该方法包括:首先,使用带权重的关键词集合表示文本文档的特征信息;然后,使用经过本体消歧和本体扩展处理后的本体来表示分类目录的特征信息,并通过分析本体结构特征将本体被转化为带权重的词义集合;最后,使用Earth Mover’s Distance方法计算文本文档的关键词集合和本体权重词义集合之间的语义相似值,并进一步计算文本文档和分类目录之间的相似值,根据文本文档和分类目录之间的相似值来进行文本文档的分类和排序。使用本发明方法能够进行文本文档的自动分类,并提高文本文档分类的准确率。

著录项

  • 公开/公告号CN101944099B

    专利类型发明专利

  • 公开/公告日2012-05-30

    原文格式PDF

  • 申请/专利权人 西北工业大学;

    申请/专利号CN201010210107.0

  • 发明设计人 郭雷;方俊;

    申请日2010-06-24

  • 分类号G06F17/30(20060101);G06F17/27(20060101);

  • 代理机构61204 西北工业大学专利中心;

  • 代理人王鲜凯

  • 地址 710072 陕西省西安市友谊西路127号

  • 入库时间 2022-08-23 09:10:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-09-03

    专利权的转移 IPC(主分类):G06F 17/30 变更前: 变更后: 登记生效日:20140814 申请日:20100624

    专利申请权、专利权的转移

  • 2012-06-27

    著录事项变更 IPC(主分类):G06F 17/30 变更前: 变更后: 申请日:20100624

    著录事项变更

  • 2012-05-30

    授权

    授权

  • 2011-03-09

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20100624

    实质审查的生效

  • 2011-01-12

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号