首页> 中国专利> 一种基于拓扑特征扩展的知识主题短文本层次分类方法

一种基于拓扑特征扩展的知识主题短文本层次分类方法

摘要

本发明一种基于拓扑特征扩展的知识主题短文本层次分类方法,能够有效的对知识主题短文本进行组织和管理,解决互联网海量知识短文本造成的信息过载问题。其包括以下步骤:1)初始文本特征构建;2)基于拓扑特征的短文本特征扩展;3)异构知识主题间的迁移学习方法。通过采集多个知识主题对应的短文本长度做初步的量化统计和分析,明确了知识主题短文本文本特征的稀疏程度。通过短文本之间的词共现情况构建并分析知识主题短文本网络,最终选取社区特征有效扩展文本特征。通过计算知识主题之间的KL散度来度量域的差异性,进而选择辅助数据;将层次分类问题转换为多分类问题,有效的对知识主题短文本进行组织和管理。

著录项

  • 公开/公告号CN106991127B

    专利类型发明专利

  • 公开/公告日2020-01-10

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN201710129359.2

  • 申请日2017-03-06

  • 分类号G06F16/35(20190101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人李宏德

  • 地址 710049 陕西省西安市碑林区咸宁西路28号

  • 入库时间 2022-08-23 10:48:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-01-10

    授权

    授权

  • 2017-08-22

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170306

    实质审查的生效

  • 2017-08-22

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20170306

    实质审查的生效

  • 2017-07-28

    公开

    公开

  • 2017-07-28

    公开

    公开

  • 2017-07-28

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号