文摘
英文文摘
1 绪论
1.1 研究背景
1.2 研究动机
1.3 研究现状
1.4 论文主要研究内容
1.5 论文的组织结构
2 关键概念技术
2.1 信息检索及Web文本挖掘
2.1.1 信息检索及搜索引擎
2.1.2 文本分类与聚类
2.1.3 Web文本挖掘
2.1.4 检索结果聚类
2.2 查询扩展方法的分类
3 与课题相关的技术及算法
3.1 文本自动处理技术
3.2 文本分类与聚类技术
3.2.1 文本相似度度量
3.2.2 文本分类及聚类算法
3.3 语义关联树
3.4 后缀树相关知识简介
3.4.1 索回树(Trie)
3.4.2 后缀树概念的提出
3.4.3 后缀数组
3.5 向量空间模型
3.5.1 向量空间模型及相关概念
3.5.2 文本特征权重
3.5.3 基于向量空间模型的文本检索
3.5.4 潜在语义标引
3.5.5 奇异值分解
3.6 针对检索结果的聚类算法
3.6.1 搜索结果聚类算法的特点
3.6.2 后缀树聚类(STC)算法
3.6.3 SHOC和Lingo算法
4 基于语义关联树的分类查询扩展算法
4.1 引言
4.2 基于语义关联树的查询扩展
4.2.1 语义关联树元素的提取
4.2.2 语义关联树模型的构造
4.3 语义关联树构造算法及分类查询扩展算法的实现
4.3.1 分类语料库的建立
4.3.2 分类构造算法
4.3.3 查询扩展算法
4.4 实验过程
4.4.1 实验结果及分析
4.4.2 小结
5 CQIG-一种改进的Web检索结果聚类算法研究
5.1 引言
5.2 CQIG算法介绍
5.2.1 算法涉及的主要概念
5.2.2 CQIG算法的主要步骤
5.2.3 CQIG的聚类及聚类标签打分公式改进
5.3 CQIG算法实现及实验结果分析
5.3.1 基于Ambient数据集的聚类质量评测
5.3.2 基于Web搜索结果聚类推荐平台的实验结果对比分析
5.4 本章小结
6 结论与未来研究方向
6.1 结论
6.2 未来研究方向
参考文献
攻读硕士学位期间发表学术论文情况
致谢