首页> 中文学位 >XML搜索引擎中索引技术的研究
【6h】

XML搜索引擎中索引技术的研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1研究背景和意义

1.2国内外研究现状

1.3论文的研究难点

1.4论文的组织结构

第2章XML及其相关技术

2.1 XML概述

2.1.1 XML文档的分类

2.1.2 XML文档的解析

2.2文档类型定义的简化

2.3 XML存储技术

2.4 XML查询语言

2.5本章小结

第3章XML搜索引擎模型

3.1传统搜索引擎的不足

3.2 XML搜索引擎的研究

3.2.1 XML对搜索引擎的优化

3.2.2 XML搜索引擎的开发条件

3.2.3 XML搜索引擎的分类

3.2.4 XML搜索引擎与传统搜索研究的比较分析

3.3模型设计思想和模型结构

3.3.1机器人模块

3.3.2转换模块

3.3.3 DTD管理模块

3.3.4解析模块

3.3.5节点编码器

3.3.6索引模块

3.3.7查询模块

3.4基于DTD的用户界面

3.5本章小结

第4章XML索引技术

4.1相关研究

4.2一种新的索引方法

4.2.1 DIXPI的编码方法

4.2.2 DIXPI的索引结构

4.2.3 DIXPI的查询处理

4.2.4结构连接算法

4.2.5 DIXPI的索引优化

4.3本章小结

第5章XML索引原型系统和性能评测

5.1索引原型系统功能设计与技术路线选择

5.2文档和索引数据的存储

5.3性能指标

5.4实验数据以及测试用例

5.5索引的建立

5.6索引的查询响应时间

5.7本章小结

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

作者简介

展开▼

摘要

现有的搜索引擎多数是针对静态HTML(Hyper Text Markup Language)涵设计的,HTML只是一种简单的显示语言,无法对检索信息做精确定位,从而大大限制了搜索引擎的查准率。目前,互联网上大量的信息开始采用XML(eXtensible Markup Iranguage)语言来描述、存储和交换。XML标记描述了内容的含义,搜索引擎可以依靠标记和内容之间的依存关系,准确找到信息,从而大大减小搜索范围,提高检索精度。本文对面向XML的搜索引擎进行了研究。 首先,本文提出了一个XML搜索引擎模型,并介绍了模型的设计思想。该模型由机器人模块、转换模块、解析模块、DTD(Document TypeDefinition)管理模块、索引模块、查询模块等组成。另外,详细描述了各个模块的结构和实现细节。 其次,对XML索引技术进行了研究。本文改进了一种区域编码方法,支持节点编码的更新,为XML索引模型提供了编码维护方案。在此基础上,提出了一种基于DTD的路径索引方法,并将之无缝结合了基于文本的倒排索引,以支持XML文档的内容检索和结构检索。其主要特点是结合了编码方法、倒排索引和路径索引的思想,对XML文档及其遵循的DTD同时建立索引。另外,详细论述了如何设计索引结构并讨论了索引的存储和优化问题。 最后,为了测试论文所提出的索引方法的性能,开发了一个XML索引原型系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号