声明
摘要
第1章 绪论
1.1 课题背景
1.2 本文的主要工作
1.3 本文的组织结构
1.4 本章小结
第2章 相关技术综述
2.1 中文分词
2.1.1 中文分词简介及作用
2.1.2 中文分词算法
2.1.3 ICTCLAS中文分词系统
2.2 个性化推荐
2.2.1 基于内容的推荐
2.2.2 协同过滤推荐
2.2.3 混合推荐
2.3 聚类分析
2.3.1 聚类算法综述
2.3.2 聚类算法分类
2.3.3 基于划分的聚类算法
2.4 文本相似性度量
2.4.1 基于向量空间模型的TF-IDF方法
2.4.2 隐性语义索引法
2.4.3 基于属性论的文本相似度计算方法
2.4.4 基于汉明距离的文本相似度计算方法
2.4.5 基于语义理解的相似度计算方法
2.5 本章小结
第3章 基于用户兴趣模型的聚类算法
3.1 问题描述
3.2 基于内容的用户兴趣建模
3.2.1 用户兴趣模型定义
3.2.2 用户兴趣建模
3.3 基于用户兴趣模型的聚类算法
3.3.1 用户-关键词模型的建立
3.3.2 K-Means聚类算法
3.3.3 改进的K-Means聚类算法
3.4 实验结果分析
3.4.1 实验设计和评价标准
3.4.2 实验结果
3.5 本章小结
第4章 基于语义词典的相似性算法
4.1 问题描述
4.2 基于语义词典的短文本相似性算法
4.2.1 基于知网的词汇相似度计算
4.2.2 微博语义相似度计算
4.3 改进的基于语义词典的微博相似性算法
4.3.1 微博语义相似性算法的优缺点
4.3.2 改进的微博语义相似性算法
4.4 实验结果分析
4.4.1 实验设计和评价标准
4.4.2 实验结果
4.5 本章小结
第5章 系统设计与实现
5.1 微博系统概述
5.1.1 系统架构
5.1.2 基本功能实现
5.2 微博数据的抓取和分析
5.2.1 新浪微博API介绍
5.2.2 微博数据的抓取
5.3 订阅推荐功能实现
5.3.1 功能概述
5.3.2 具体实现
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢