首页> 中国专利> 一种单双点平滑结合的流形正则化半监督文本分类方法

一种单双点平滑结合的流形正则化半监督文本分类方法

摘要

本发明公开了一种单双点平滑结合的流形正则化半监督文本分类方法,包括:1)采集包含已标记文本样本、未标记文本样本的真实样本数据集;2)通过无监督学习方法FCM获得实例位于非边缘区域的概率,并且通过实例与其近邻点之间的归一化距离来获取实例的局部密度;3)利用步骤(2)中获得的概率和局部密度在MR中的第三项的双点平滑约束中加入单点平滑约束;4)利用平方损失或者铰链损失函数制定一个统一的分类目标函数;5)设置其中的正则化参数和核函数等参数,并学习获得文本分类函数;6)输入待分类文本数据,利用文本分类函数进行分类,获得文本的类别。本发明在测试集上的错误率具有显著地改善,能将每个单点行为与其近邻的行为联系起来。

著录项

  • 公开/公告号CN111581380A

    专利类型发明专利

  • 公开/公告日2020-08-25

    原文格式PDF

  • 申请/专利权人 南京理工大学紫金学院;

    申请/专利号CN202010353920.7

  • 发明设计人 沈雅婷;

    申请日2020-04-29

  • 分类号G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构32337 江苏吾索律师事务所;

  • 代理人曾昭昱

  • 地址 210046 江苏省南京市栖霞区文澜路89号

  • 入库时间 2023-12-17 11:45:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-25

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号