基于语义的短文本聚类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

针对短文本聚类过程中存在的三个主要挑战:特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性，提出了一种基于语义的短文本聚类算法。该算法通过词语集合表示短文本，缓解了短文本特征关键词的稀疏性问题;利用短文本集的频繁项集和语义相似度来获取聚类中心，有效克服了传统聚类算法对聚类中心敏感的缺点，解决了簇的理解性问题;借助汉语语义相似度间接计算短文本数据之间的相似度，避免了高维空间的运算。同时在挖掘频繁项集的过程中，针对串行频繁项集挖掘算法效率低下的问题，本文又提出了一种新的基于MapReduce编程框架的并行频繁项集挖掘算法。实验结果表明，本文提出的并行频繁项集挖掘算法可以高效的挖掘频繁项集，从语义角度出发实现的短文本聚类算法明显优于传统的文本聚类算法。

著录项

作者
赵彬;
展开▼
作者单位

辽宁工程技术大学;

展开▼
授予单位辽宁工程技术大学;
学科计算机技术
授予学位硕士
导师姓名邱云飞;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
短文本聚类; 语义相似度; 频繁项集; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 基于语义的短文本消重算法研究 [J] . 蒋旦 ,张翔 . 网络新媒体技术 . 2017,第001期
2. 基于语义的短文本消重算法研究 [J] . 蒋旦 ,张翔 . 网络新媒体技术 . 2017,第001期
3. 基于语义的KNN短文本分类算法研究 [J] . 张素智 ,刘婧姣 . 郑州轻工业学院学报（自然科学版） . 2012,第006期
4. 基于语义和图的文本聚类算法研究 [J] . 蒋旦 ,周文乐 ,朱明 . 中文信息学报 . 2016,第005期
5. 基于语义特征的模糊聚类算法研究 [J] . 张野 ,于湛麟 ,宋微 . 信息技术 . 2014,第012期
6. 一种基于短文本的独立语义特征抽取算法 [C] . 胡佳妮 ,郭军 ,徐蔚然 . 2007年全国网络与信息安全技术研讨会 . 2007
7. 基于语义树的短文本相似度算法研究与应用 [A] . 郭炳元 . 2019

基于语义的短文本聚类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅