首页> 中文学位 >基于形式概念分析的用户查询词扩展方法的研究
【6h】

基于形式概念分析的用户查询词扩展方法的研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1研究现状

1.1.1搜索引擎的发展

1.1.2查询扩展技术现状

1.1.3形式概念分析

1.2查询扩展技术存在的问题

1.3本文的主要内容与结构

第2章网页的形式化描述

2.1形式概念分析

2.2多值形式背景

2.2.1关键词权重

2.2.2多值形式背景

2.3网页-关键词概念格

2.3.1中文分词

2.3.2 网页-关键词形式背景

2.3.3构建概念格

第3章查询词扩展

3.1关联规则

3.1.1基本概念

3.1.2关联规则挖掘

3.2基于概念格的关联规则挖掘

3.2.1查询词扩展使用的关联规则

3.2.2无冗余关联规则

3.2.3极小生成子项集

3.2.4挖掘查询词与非查询词间的最小无冗余关联规则

3.3使用关联规则扩展查询词

第4章实验及结果分析

4.1数据预处理

4.2构建概念格

4.2.1数据结构

4.2.2获取形式概念

4.2.3获取概念格的边

4.3关联规则挖掘

4.3.1极小生成子项集

4.3.2挖掘关联规则

4.4查询词扩展匹配

4.5实验结果

4.5.1对中文网页集合进行实验

4.5.2与F.A.Grootjen的查询扩展方法对比

4.5.3与Zaki的关联规则挖掘方法进行对比

第5章结论与展望

参考文献

攻读硕士学位期间科研成果

致谢

展开▼

摘要

本文采用形式概念分析的方法,在概念格上对搜索引擎中的用户查询词扩展问题进行研究,提出了一套基于形式概念分析的用户查询词扩展方法,赋予了搜索引擎更高的“智能”。文章根据形式概念分析的思想,对用户所需网页的下近似集合中网页进行形式化描述,形成网页-关键词形式背景,并在此形式背景的基础上构建概念格作为本文研究的查询扩展方法的基础数据结构。然后在概念格的基础上,探讨了基于极小生成子项集的查询词与非查询词间最小无冗余关联规则的挖掘方法,给出了通过概念格上的形式概念和它们之间的“父-子”关系以及它们的关键词闭集合的极小生成子项集来生成可信度等于100%、小于100%的关联规则的算法。

著录项

  • 作者

    海宇峰;

  • 作者单位

    西华大学;

  • 授予单位 西华大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 杜亚军;
  • 年度 2007
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;TP311.12;
  • 关键词

    网络服务; 信息查询; 查询扩展; 数据结构;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号