首页> 中国专利> 一种面向服务数据聚类的短文本优化主题模型方法

一种面向服务数据聚类的短文本优化主题模型方法

摘要

一种面向服务数据聚类的短文本优化主题模型方法,首先设计一种以BTM主题模型为基础的词对模型,该模型利用词向量筛选词对信息,改善词对主题模型耗时较长的缺点;同时,通过一种基于主题分布信息的概率采样策略,来寻找训练过程中对当前采样主题关联度高的代表词对,并通过调节词对在采样过程中的权重信息,降低噪声问题带来的干扰;之后,将模型训练的得到的文档主题分布作为服务特征向量,利用一种优化的DPC算法(sDPC),完成对服务描述文档的聚类操作。本发明提高服务聚类精度,解决服务聚类问题中由服务描述文档带来的稀疏性与噪声问题。

著录项

  • 公开/公告号CN113361270A

    专利类型发明专利

  • 公开/公告日2021-09-07

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202110570274.4

  • 申请日2021-05-25

  • 分类号G06F40/284(20200101);G06K9/62(20060101);

  • 代理机构33241 杭州斯可睿专利事务所有限公司;

  • 代理人王利强

  • 地址 310014 浙江省杭州市下城区朝晖六区潮王路18号

  • 入库时间 2023-06-19 12:29:04

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号