首页> 中文学位 >基于语义本体的垂直搜索引擎模型研究
【6h】

基于语义本体的垂直搜索引擎模型研究

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 研究背景和研究意义

1.1.1 研究背景

1.1.2 研究意义

1.2 基于本体的垂直搜索引擎研究现状

1.2.1 基于本体的信息抽取

1.2.2 基于本体的信息检索

1.2.3 基于本体的垂直搜索引擎

1.3 研究内容及技术路线

1.3.1 研究内容

1.3.2 技术路线

第2章 垂直搜索引擎及本体相关理论基础

2.1 垂直搜索引擎概述

2.1.1 垂直搜索引擎体系结构

2.1.2 垂直搜索引擎关键技术

2.1.3 垂直搜索引擎面临的问题

2.2 本体知识概述

2.2.1 本体定义

2.2.2 本体在垂直搜索引擎中的作用

2.2.3 本体的建模原语

2.3 本体描述语言

2.3.1 RDF/RDFS

2.3.2 OWL

2.4 本章小结

第3章 领域本体的构建及基于本体的信息抽取研究

3.1 领域本体的构建方法和原则

3.1.1 领域本体的构建方法

3.1.2 领域本体的构建原则

3.1.3 本体构建工具

3.2 基于本体的信息抽取技术

3.2.1 信息抽取技术分类

3.2.2 基于本体的结构化信息抽取

3.3 餐饮领域本体的构建及餐饮实例的自动抽取

3.3.1 餐饮网站分析

3.3.2 餐饮领域本体的构建

3.3.3 餐饮实例的自动抽取

3.4 本体的存储

3.5 本章小结

第4章 基于本体的查询语义扩展模型

4.1 垂直搜索引擎信息检索模型

4.1.1 信息检索流程

4.1.2 信息检索模型分类

4.1.3 排序算法

4.2 基于本体的语义检索模型

4.2.1 基于本体的语义检索模型框架结构

4.2.2 查询预处理

4.2.3 关键词-本体实体匹配

4.2.4 查询语义扩展

4.3 本章小结

第5章 基于本体的餐饮垂直搜索引擎实现

5.1 系统总体框架

5.2 餐饮本体构建的实现

5.3 基于本体的餐饮垂直搜索引擎的实现

5.3.1 信息采集模块

5.3.2 网页结构化信息抽取模块

5.3.3 信息检索模块

5.4 用户界面的设计与实现

5.5 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读学位期间公开发表论文

致谢

展开▼

摘要

随着互联网的普及和Web信息量的增长,越来越多的用户倾向于使用搜索引擎获取各种信息。目前,搜索引擎主要分为两类:通用搜索引擎和垂直搜索引擎。其中,垂直搜索引擎是针对通用搜索引擎信息量大、查询不准确等问题提出来的新型搜索引擎服务模式,是搜索引擎行业细分化的必然趋势。
   但是垂直搜索引擎仍采用基于关键词的检索方式,无法满足用户语义检索的要求。产生这种问题的根本因为是搜索引擎搜集的文档缺乏语义标注信息,导致在信息检索阶段,搜索引擎无法对用户的查询请求进行语义分析,而本体能够完成语义信息的标注,实现语义搜索,将本体技术与搜索引擎结合成为研究语义搜索引擎的重要手段。
   因此,本文主要研究了领域本体的构建方法、基于本体的结构化信息抽取方法和利用领域本体对用户的查询请求进行语义查询扩展等技术,提出了一种基于本体的垂直搜索引擎框架结构,并设计实现了原型系统。本文完成的工作主要有:
   (1)通过对餐饮信息的分析构建了餐饮领域本体EnCatering,包括餐饮店铺类、菜品类、店铺评论类和地址信息类,对各类的属性和类之间的关系进行定义和描述,更好地实现餐饮领域知识的表示和信息组织。
   (2)根据餐饮网站的特点,使用基于规则的信息抽取技术完成餐饮领域本体实例的自动构建,为用户查询请求的语义分析和语义扩展打下基础。
   (3)对本体中的概念、属性、关系和实例建立索引,利用索引完成对用户查询请求的语义分析和扩展,实现语义信息检索,着重探讨了关键词.本体实体匹配的策略和查询语义扩展的流程。
   最后设计实现了基于本体的餐饮垂直搜索引擎Catering Search。实验表明,Catering Search能较好地解决目前基于关键词检索中存在的问题,说明基于本体的垂直搜索具有实际意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号