首页> 中文学位 >XML上的XPath全文查询技术
【6h】

XML上的XPath全文查询技术

代理获取

目录

摘要

第一章绪论

第二章XML上全文查询的相关技术

第三章带有距离(distance)谓词的XPath全文查询处理

第四章系统架构及实验分析

第五章结束语

参考文献

附录

后记

论文独创性声明及论文使用授权声明

展开▼

摘要

随着Intemet和Web应用的迅速发展,越来越多的Web数据都开始使用XML作为数据表示和交换的语言,这使得XML在电子信息发布、数字图书馆、Web信息搜索和集成等领域有着广阔的应用前景。大规模XML文档的出现,如数字图书馆,IEEEINEX数据集,SIGMOD和DBLP数据集等等,使XML数据的管理和查询成为一个研究热点。如何在这些海量的XML数据上进行查询和检索,实现一个高效的XML文档的搜索引擎就显得越来越迫切。支持普通用户仅仅通过输入关键词就可以在XML文档上进行查询,处理XML文档内容和结构联合查询的任务,具有重要的理论和现实意义,也是当前XML研究方面的热点。 本文结合XML数据本身的结构,将XML数据的结构和内容联合,研究了XML文档的标注方法;汲取信息检索的一些技术和已有的一些全文查询方法,研究了XML数据上全文查询的相关技术。然后对于XML文档上的全文距离(distancepredicate)查询方面进行了深入的研究和探讨,提出了有效的解决方案、I关键算法和技术,并通过一系列的实验证明了这些方法的有效性。 本文的贡献和创新之处总结如下: 探讨了W3C制定的XMLFull-Text的语法和语义。 探索了对XML文档的内容和结构联合进行标注的方法,有效的支持了XMLFull-Text全文检索形式的查询。 我们提出了基于窗口的算法实现对全文查询中距离谓词的处理,大大减少了查询处理的时间。该方法对在大量的XML数据集上进行距离查询提供了具有实际意义的有效处理方法。 为了说明我们算法的有效性,我们给出了一系列实验结果来证明基于窗口的算法的有效性和健壮性。

著录项

  • 作者

    陈宏;

  • 作者单位

    复旦大学;

  • 授予单位 复旦大学;
  • 学科 计算机软件和理论
  • 授予学位 硕士
  • 导师姓名 周傲英;
  • 年度 2006
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.135.4;
  • 关键词

    XML文档; 信息索引; XPath全文查询;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号