首页> 中国专利> 一种使用优化的向量空间模型实现文档自动分类的方法

一种使用优化的向量空间模型实现文档自动分类的方法

摘要

本发明涉及一种使用优化的向量空间模型实现文档自动分类的方法,该方法包括以下步骤:⑴对已知文章进行预处理:去除无意义字符并判断标题;⑵对已知文章进行词频优化处理;⑶对已知文章关键词进行关联度优化;⑷获得已知文章的主轴:根据优化后的关键词及其权重得到已知文章的主轴;⑸获得类的主轴:手动整理出多个类的训练文档,对每一篇训练文章按照步骤⑴~⑷获得训练文档的内容主轴,然后按向量的加法将其整理成多个类的主轴;⑹对未知文章分类:计算未知文章的主轴与多个类的主轴之间的相似度;ⅱ分类:当相似度大于设定的阈值时,则判定该未知文章属于该多个类中的某个类或某几个类。本发明可对大量文档信息进行分类并剔除一些不准确检索内容。

著录项

  • 公开/公告号CN105354184B

    专利类型发明专利

  • 公开/公告日2018-04-20

    原文格式PDF

  • 申请/专利权人 甘肃智呈网络科技有限公司;

    申请/专利号CN201510707947.0

  • 申请日2015-10-28

  • 分类号

  • 代理机构兰州中科华西专利代理有限公司;

  • 代理人李艳华

  • 地址 730000 甘肃省兰州市兰州新区产业孵化大厦12楼1217室

  • 入库时间 2022-08-23 10:10:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-20

    授权

    授权

  • 2016-03-23

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20151028

    实质审查的生效

  • 2016-02-24

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号