首页> 中文学位 >基于用户聚类和语义词典的微博推荐系统
【6h】

基于用户聚类和语义词典的微博推荐系统

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题背景

1.2 本文的主要工作

1.3 本文的组织结构

1.4 本章小结

第2章 相关技术综述

2.1 中文分词

2.1.1 中文分词简介及作用

2.1.2 中文分词算法

2.1.3 ICTCLAS中文分词系统

2.2 个性化推荐

2.2.1 基于内容的推荐

2.2.2 协同过滤推荐

2.2.3 混合推荐

2.3 聚类分析

2.3.1 聚类算法综述

2.3.2 聚类算法分类

2.3.3 基于划分的聚类算法

2.4 文本相似性度量

2.4.1 基于向量空间模型的TF-IDF方法

2.4.2 隐性语义索引法

2.4.3 基于属性论的文本相似度计算方法

2.4.4 基于汉明距离的文本相似度计算方法

2.4.5 基于语义理解的相似度计算方法

2.5 本章小结

第3章 基于用户兴趣模型的聚类算法

3.1 问题描述

3.2 基于内容的用户兴趣建模

3.2.1 用户兴趣模型定义

3.2.2 用户兴趣建模

3.3 基于用户兴趣模型的聚类算法

3.3.1 用户-关键词模型的建立

3.3.2 K-Means聚类算法

3.3.3 改进的K-Means聚类算法

3.4 实验结果分析

3.4.1 实验设计和评价标准

3.4.2 实验结果

3.5 本章小结

第4章 基于语义词典的相似性算法

4.1 问题描述

4.2 基于语义词典的短文本相似性算法

4.2.1 基于知网的词汇相似度计算

4.2.2 微博语义相似度计算

4.3 改进的基于语义词典的微博相似性算法

4.3.1 微博语义相似性算法的优缺点

4.3.2 改进的微博语义相似性算法

4.4 实验结果分析

4.4.1 实验设计和评价标准

4.4.2 实验结果

4.5 本章小结

第5章 系统设计与实现

5.1 微博系统概述

5.1.1 系统架构

5.1.2 基本功能实现

5.2 微博数据的抓取和分析

5.2.1 新浪微博API介绍

5.2.2 微博数据的抓取

5.3 订阅推荐功能实现

5.3.1 功能概述

5.3.2 具体实现

5.4 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

微博作为信息分享和传播的网络平台,近年来得到了广泛的应用。如何让用户在海量的微博中获取到感兴趣的微博内容成为了微博平台新的研究方向。目前的一些微博推荐系统大都针对用户进行推荐,而对于微博平台来说,由于微博文本长度较短,用户兴趣多样,因此针对用户的推荐效果并不理想。
   本文提出了针对于微博的推荐系统,用户在浏览微博时可以订阅感兴趣的微博,系统将针对用户订阅的微博,结合用户的兴趣,推荐相关的微博。这样的推荐一方面更有针对性,推荐效果更好;另一方面也通过对于微博的推荐将类似的微博聚集起来形成了用户所感兴趣的话题。
   本文的推荐系统基于用户聚类和短文本相似性算法实现。首先通过收集用户过往所发表的微博为用户建立兴趣模型,在此基础之上对用户进行聚类。然后收集与当前用户所在同一簇中的用户所发表的微博,与用户订阅的微博进行相似度计算,将相似度较高的微博推荐给用户。在聚类算法中,本文改进了K-Means算法,解决了K-Means算法对于初始中心选取的依赖性这一问题。在相似性计算中,本文在短文本语义相似性的基础上,加入了单词权重和词序的因素,提高了相似性计算的准确率。
   实验结果表明,本文改进的K-Means聚类算法,在正确率和运行时间上都优于传统的K-Means算法。改进的微博相似性算法相比于语义相似性算法具有更好的区分度和准确率。最后,本文搭建了一个微博系统,融合了改进的聚类算法和文本相似性算法,实现了对于微博的订阅推荐功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号