声明
摘要
第1章 绪论
1.1 研究的背景与意义
1.2 本文的组织结构
第2章 查询推荐国内外研究现状
2.1 引言
2.2 国内外研究现状
2.2.1 基于文档的方法
2.2.2 基于日志的方法
2.3 本文的主要研究工作
2.4 本章小结
第3章 查询日志的分析与预处理
3.1 引言
3.2 搜索引擎原理概述
3.3 搜狗查询日志的分析
3.3.1 日志的数据格式
3.3.2 对查询关键字的分析
3.3.3 对点击URL与点击序号的分析
3.3.4 对查询和点击URL长度的分析
3.4 数据的预处理
3.5 本章小结
第4章 基于二分图的查询推荐算法
4.1 引言
4.2 基于二分图的查询推荐
4.2.1 算法步骤概览
4.2.2 构造Query-URL加权二分图
4.2.3 查询问的相似度计算
4.2.4 构造查询关系网络
4.2.5 查询推荐
4.3 本章小结
第5章 实验与分析
5.1 前言
5.2 实验运行环境
5.3 数据挖掘工具——WEKA
5.4 实验结果与分析
5.4.1 数据稀疏性对推荐效果的影响
5.4.2 阈值对推荐效果的影响
5.4.3 k-means聚类查询
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢