首页> 中国专利> 一种基于深度语义特征学习的短文本聚类方法

一种基于深度语义特征学习的短文本聚类方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于深度语义特征学习的短文本聚类方法，包括：通过传统的特征降维在局部信息保存的约束下对原始特征进行降维表示，并对得到的低维实值向量进行二值化，做为卷积神经网络结构的监督信息进行误差反向传播训练模型；采用外部大规模语料无监督训练词向量，并对文本中每个词按词序进行向量化表示，做为卷积神经网络结构的初始化输入特征学习文本的隐式语义特征；得到深度语义特征表示后，采用传统的K均值算法对文本进行聚类。本发明的方法不需要额外的自然语言处理等专业知识，设计简单且可学习深度的语义特征，并且，学习到的语义特征具有无偏性，可更有效地达到较好的聚类性能。

著录项

公开/公告号CN104915386B

专利类型发明专利
公开/公告日2018-04-27

原文格式PDF
申请/专利权人中国科学院自动化研究所;
展开▼

申请/专利号CN201510270028.1
发明设计人徐博;许家铭;郝红卫;田冠华;王方圆;
展开▼

申请日2015-05-25
分类号G06F17/30(20060101);G06F17/27(20060101);
代理机构11021 中科专利商标代理有限责任公司;
代理人宋焰琴
地址 100190 北京市海淀区中关村东路95号
入库时间 2022-08-23 10:10:24

法律信息

法律状态公告日

法律状态信息

法律状态
2018-04-27

授权

授权
2015-10-14

实质审查的生效 IPC(主分类):G06F17/30 申请日:20150525

实质审查的生效
2015-09-16

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于深度语义特征学习的短文本聚类方法 [P] . 中国专利： CN104915386B . 2018.04.27
2. 一种基于深度语义路径搜索的短文本聚类方法 [P] . 中国专利： CN107273426B . 2019.07.16
3. METHOD FOR AUTOMATIC ITERATIVE CLUSTERISATION OF ELECTRONIC DOCUMENTS ACCORDING TO SEMANTIC SIMILARITY, METHOD FOR SEARCH IN PLURALITY OF DOCUMENTS CLUSTERED ACCORDING TO SEMANTIC SIMILARITY AND COMPUTER-READABLE MEDIA [P] . 俄罗斯专利： RU2556425C1 . 2015-07-10

机译：一种基于语义相似度的电子文档自动迭代聚类的方法，一种基于语义相似度的聚类文档的多种搜索方法及计算机可读介质
4. NEWS SENTENCE CLUSTERING METHOD BASED ON SEMANTIC SIMILARITY, DEVICE, AND STORAGE MEDIUM [P] . 世界知识产权组织专利： WO2019056692A1 . 2019-03-28

机译：基于语义相似度，设备和存储媒介的新闻句子聚类方法
5. METHOD OF CLUSTERING OF SEARCH RESULTS DEPENDING ON SEMANTICS [P] . 俄罗斯专利： RU2564629C1 . 2015-10-10

机译：基于语义的搜索结果的聚类方法