首页> 中国专利> 一种技术图谱中技术领域的自动识别方法

一种技术图谱中技术领域的自动识别方法

摘要

本发明涉及一种技术图谱中技术领域的自动识别方法,包括数据集准备、数据预处理、分类模型样本准备步骤、多标签分类模型构建、技术领域识别步骤。与现有技术相比,本发明针对传统关键字检索存在的缺点,构建了多标签分类的训练集,充分考虑文档之间的语义相似性,解决多义词、近义词等问题,可以排除文档中的噪音影响。构建的融合的多标签分类模型,充分利用了各分类算法的优势,排除了单一算法在某些情况下存在的缺陷,提高了分类的准确率,其自动化标注的方式克服了人工标引的缺点,极大提高了多标签文档分类的效率。

著录项

  • 公开/公告号CN111813933A

    专利类型发明专利

  • 公开/公告日2020-10-23

    原文格式PDF

  • 申请/专利权人 国网上海市电力公司;

    申请/专利号CN202010558503.6

  • 申请日2020-06-18

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F40/289(20200101);G06F40/30(20200101);

  • 代理机构31225 上海科盛知识产权代理有限公司;

  • 代理人王怀瑜

  • 地址 200122 上海市浦东新区自由贸易试验区源深路1122号

  • 入库时间 2023-06-19 08:38:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号