声明
摘要
第一章绪论
1.1课题研究背景和意义
1.1.1课题来源和选题背景
1.1.2理论意义和应用价值
1.2研究现状
1.3本文的主要工作
1.4本文的组织结构
第二章微博检索相关技术基础
2.1向量空间模型和相似度计算公式
2.1.1向量空间模型
2.1.2 TF-IDF原理
2.1.3余弦相似度
2.2主题模型
2.2.1主题模型定义
2.2.2 LDA主题模型
2.2.3 BTM主题模型
2.3图论算法
2.3.1图论算法基础概述
2.3.2 SimRank算法
2.4短文本查询扩展
2.4.1基于全局的查询扩展
2.4.2基于查询的(局部)的分析技术
2.5本章小结
第三章基于BTM和图论的微博检索模型
3.1问题提出
3.2关键技术
3.2.1 BTM主题模型及参数设置
3.2.2改进的SimRank算法
3.3检索模型构建
3.3.1基于话题标签的相似度计算
3.3.2基于BTM主题模型的相似度计算
3.3.3基于图结构的相似度计算
3.4实验与结果分析
3.4.1实验设计
3.4.2实验结果分析
3.5本章小结
第四章改进频繁词集的微博查询扩展
4.1问题提出
4.2频繁词集挖掘
4.3词语相似度矩阵构建
4.3.1词语权重改进
4.3.2词语相似度计算
4.4基于语义的微博查询扩展
4.5实验结果与分析
4.5.1实验设计
4.5.2实验结果分析
4.6本章小结
第五章结论与展望
5.1结论
5.2展望
参考文献
致谢
附录
长沙理工大学;