融合统计和结构相似度的文档聚类

郑重

首页> 中文期刊> 《信息技术与信息化》 >融合统计和结构相似度的文档聚类

融合统计和结构相似度的文档聚类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一个新的文档聚类框架,在这个框架下,从统计和结构两个方面对词条之间的交互进行建模.首先根据观测词条推断隐含词条,补充和细化文档中每个词条的权重.基于丰富的文档向量表示方法,便可以轻松地获得统计语义的相似度.同时,我们使用现有的依赖解析器提取词条之间的显式语义依赖,并用文档结构表示每个文档.接着采用结构匹配技术来获取结构语义的相似度.然后,将语义相似度和结构相似度通过线性组合,作为任意两个文档之间的最终相似度.最后,我们利用CLUTO聚类工具对文献进行聚类,并针对英语和汉语语料库进行了综合实验,实验结果表明,相比于现有基准,该方法在多个指标上都有显著的提升.

著录项

来源
《信息技术与信息化》 |2021年第4期|132-135|共4页
作者
郑重;
展开▼
作者单位

武汉中原电子信息有限公司湖北武汉 430074;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
文档聚类; 相似度; 词条权重; 结构匹配;

相似文献

中文文献
外文文献
专利

1. 融合模拟退火的遗传算法在文档聚类中的应用 [J] . 白曦 ,吕晓枫 ,孙吉贵 . 计算机工程与应用 . 2006,第023期
2. 融合CNN和结构相似度计算的排比句识别及应用 [J] . 穆婉青 ,廖健 ,王素格 . 中文信息学报 . 2018,第002期
3. 基于结构相似度的图像融合客观评价指标 [J] . 谭惜姿 ,陆伟 . 淮阴师范学院学报（自然科学版） . 2018,第003期
4. 基于加权多融合偏好与结构相似度的协同过滤算法 [J] . 何顺 ,王淑娟 ,雷建云 . 计算机工程 . 2016,第010期
5. 基于改进结构相似度的区域划分图像融合技术研究 [J] . 李玲玲 ,王蕙 ,闫成新 . 计算机应用研究 . 2014,第006期
6. 融合CNN和结构相似度计算的排比句识别及应用 [C] . 穆婉青 ,廖健 ,王素格 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. XML文档结构相似度研究及在文档聚类中应用 [A] . 李丽娟 . 2007

融合统计和结构相似度的文档聚类

摘要

著录项

相似文献

相关主题

期刊订阅