首页> 中文学位 >基于WordNet的概念格语义匹配算法及其在搜索引擎上的应用
【6h】

基于WordNet的概念格语义匹配算法及其在搜索引擎上的应用

代理获取

目录

文摘

英文文摘

声明

第1章引言

1.1 信息检索模型及其存在的问题

1.2形式概念分析

1.3 本文的主要研究内容及课题来源

1.4论文结构

第2章用户查询和文档的概念格匹配方法

2.1 概念格在搜索引擎上的应用

2.2 用户查询和文档之间的语义匹配

2.3 总结

第3章基于WordNet的概念格匹配算法

3.1 词语相似度及其计算方法

3.2WordNet与词语相似度

3.3 概念格的语义匹配策略

3.4 本章总结

第4章匹配算法在网络爬虫上的应用

4.1 搜索引擎的工作原理和组成

4.2 网络爬虫的分类

4.3 基于概念格的网络爬虫

4.4 总结

第5章实验

5.1 文档集合的获取

5.2构建形式背景并建立概念格

5.3 实验结果的分析

总结与展望

参考文献

攻读硕士学位期间科研成果

致谢

展开▼

摘要

近年来,随着互联网用户数量的增加,网上信息迅速膨胀,搜索引擎成为了人们获取新知识的重要手段。然而传统的搜索引擎查询系统大多是基于关键字匹配的,所以在进行搜索时会带来一些问题,比如查询返回信息过多或者不容易找到与查询相关的信息等等。智能化是未来搜索引擎应该追求的方向,这主要表现在两个方面:一是对搜索请求的理解,二是对网页内容的分析。基于概念的智能检索才符合信息检索未来的需求。形式概念分析(Formal Concept Analysis,以下简称FCA)的主要内容是研究“概念”和“概念分层”的数学化描述,其主要思想是:从被表示为形式背景(Formal Context)的数据中获取形式概念(Formal Concept)以及形式概念之间的联系,形成一种以形式概念为元素的格结构--概念格(Concept Lattice)。随着概念格应用的不断深入,概念格之间的匹配研究也越来越重要。 本文首先提出了基于概念格的搜索引擎匹配模型,即将自然语言的用户查询与网页文档分别构建概念格,然后进行匹配。在进行概念格匹配时,本文提出了一种基于WordNet的概念格语义匹配算法。目前搜索引擎的智能化表现在对自然语言的语义分析和内容信息的理解,这离不开语义知识库的支持,它是帮助计算机“了解

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号