文摘
英文文摘
声明
第1章绪论
1.1研究现状
1.1.1搜索引擎的发展
1.1.2查询扩展技术现状
1.1.3形式概念分析
1.2查询扩展技术存在的问题
1.3本文的主要内容与结构
第2章网页的形式化描述
2.1形式概念分析
2.2多值形式背景
2.2.1关键词权重
2.2.2多值形式背景
2.3网页-关键词概念格
2.3.1中文分词
2.3.2 网页-关键词形式背景
2.3.3构建概念格
第3章查询词扩展
3.1关联规则
3.1.1基本概念
3.1.2关联规则挖掘
3.2基于概念格的关联规则挖掘
3.2.1查询词扩展使用的关联规则
3.2.2无冗余关联规则
3.2.3极小生成子项集
3.2.4挖掘查询词与非查询词间的最小无冗余关联规则
3.3使用关联规则扩展查询词
第4章实验及结果分析
4.1数据预处理
4.2构建概念格
4.2.1数据结构
4.2.2获取形式概念
4.2.3获取概念格的边
4.3关联规则挖掘
4.3.1极小生成子项集
4.3.2挖掘关联规则
4.4查询词扩展匹配
4.5实验结果
4.5.1对中文网页集合进行实验
4.5.2与F.A.Grootjen的查询扩展方法对比
4.5.3与Zaki的关联规则挖掘方法进行对比
第5章结论与展望
参考文献
攻读硕士学位期间科研成果
致谢