首页> 中文学位 >K-medoids聚类算法及在社会标签系统中的应用研究
【6h】

K-medoids聚类算法及在社会标签系统中的应用研究

代理获取

摘要

Web2.0技术的日益盛行,随之而来的便是更加丰富的新型数据和大量网络用户。如何利用标签特性,结合数据挖掘的相关技术,挖掘用户的兴趣信息,从而更好地理解用户、发现用户的行为规律,据此提供针对不同用户的个性化服务具有重要的理论和现实意义。本文将对社会化标签环境下的用户进行分析,具体包括以下几个方面:
   1、深入分析研究K-medoids算法,针对传统K-medoids算法所存在的初始中心点选择敏感、大数据集聚类应用中性能低下等问题,提出从初始中心和运行效率上对其进行改进,改进策略为:首先使用簇内微调的方式对初始中心进行优化处理并划分后,再采取逐步扩展中心候选集的方式来降低中心替换的时间复杂度。分别从理论和UCI数据集上的实验进行了验证,实验结果表明改进的算法取得了更好的聚类质量,且在运行效率上有了很大的提高。
   2、K-medoids聚类在标签用户特征分析中的应用。首先,对于个体用户,先对标签系统中个性化用户建模技术进行研究,针对现有模型构建方法中所存在的问题,设计了一种新的建模方法一基于标签与标签组相结合的用户建模方法(Tag Combined with Tag-Pair,简称TCTP法):该方法将自然法与共现法相结合,综合他们各自的优势,既考虑了能体现用户兴趣特点的单个标签,又将经常联合使用的标签对加进来,Bibsonomy数据集实验验证了该方法较自然法和共现法取得了更好的结果;其次,对由TCTP法构建的用户兴趣模型进行了分析,了解个体用户的特征;最后,把K-medoids及其改进算法应用到标签系统中,对用户进行聚类,以验证该算法在Web2.0应用环境下的有效性,并对群体用户的特征进行了分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号