首页> 中国专利> 一种基于说明书的专利分类方法

一种基于说明书的专利分类方法

摘要

本发明公开了一种基于说明书的专利分类方法,属于文本处理与数据挖掘领域。首先对专利说明书进行文本预处理;其后构建倒排索引文件,利用信息增益和词频相结合的特征选择方法来选取特征词;进一步利用的改进过的TF‑IDF公式计算特征词权重,并构建专利特征向量;然后构建训练专利领域集合;最后利用优化过的KNN分类器对专利进行分类。该项研究为专利文献分类提供了新的思路,也为进一步研究专利文献智能检索等奠定了基础。

著录项

  • 公开/公告号CN107122382B

    专利类型发明专利

  • 公开/公告日2021-03-23

    原文格式PDF

  • 申请/专利权人 江苏大学;

    申请/专利号CN201710082677.8

  • 发明设计人 朱玉全;金健;佘远程;石亮;

    申请日2017-02-16

  • 分类号G06F16/35(20190101);G06F40/289(20200101);G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 212013 江苏省镇江市京口区学府路301号

  • 入库时间 2022-08-23 11:36:43

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号