Web文档查询与信息检索导航技术的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在Internet上充斥着海量的信息，这些信息一方面为人们的生活提供了方便和帮助，另一方面也使得人们淹没在信息的海洋中而无所适从，无法有效地获取有用的信息。为了解决这些问题，数据挖掘和信息检索技术应运而生。尽管以往的研究人员在Web数据挖掘和信息检索领域取得了丰硕的成果，为用户提供了巨大的方便，但现有的技术仍然存在着不足，例如：XML格式文档的查询及Web信息检索导航等方面存在着不能很好满足用户需求的问题。针对这些问题，本文首先介绍了数据挖掘和文本挖掘、Web数据挖掘和信息检索、XML文档及其查询的相关概念和技术，并将研究重点放在XML文档查询和Web文档检索导航上。在XML文档查询方面，针对关键词查询和半结构查询，分别提出了有效的索引结构和查询算法。介绍了LCA(LowestCommonAncestor)的概念并将其扩展到PLCA(LCAofLabelPath)，提出了PLCA规则用于有效地判断XML文档节点间的语义相关性，利用XML文档模式与实体的概念进一步提高查询的准确率；提出了PN倒排索引和PE索引，并基于此设计了XML文档关键词查询算法和半结构查询算法。对于本文提出的各种算法，作了充分全面的实验，用于验证结果和比较其性能。在Web文档检索导航方面，本文提出了在文献中挖掘最大序列频繁词组作为文献的特征，从而为用户提供辅助的Web文档检索结构；根据特征之间的层次关系建立扩展的特征层次树，依据树中特征与文献的关系推导出文献之间的关系，从而使用户在查询时根据上述关系，借助于搜索引擎尽快地获得所需的文献。在系统实现时，我们设计了基于Web文档特征层次结构的三种检索导航方式，并实现了一个原型系统将这三种导航方式有机地结合在一起，以简洁有效的方式为用户的检索过程提供帮助。

著录项

作者
龚剑;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科计算机软件与理论
授予学位硕士
导师姓名王大玲;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类网络资源开发与利用;计算机情报检索系统;
关键词
数据挖掘; 文本挖掘; 信息检索; XML查询; 检索导航; Web; 检索;

相似文献

中文文献
外文文献
专利

1. 信息检索中支持隐式时间查询的文档排名方法 [J] . 王晶晶 ,吴胜利 . 计算机工程与设计 . 2018,第011期
2. 文档-关系数据查询执行技术研究与实现 [J] . 马志程 ,袁海峰 ,谷洋 . 计算机科学与探索 . 2020,第008期
3. 基于PDM的图文档管理系统中查询功能的研究与实现 [J] . 巩佳佳 ,崔洪斌 ,杜立岗 . 河北工业科技 . 2009,第005期
4. 基于Web资源二次查询的信息检索策略研究 [J] . 宋宝贵 ,田宝彩 . 计算机应用与软件 . 2013,第004期
5. 个性化Web信息检索系统的研究与实现 [J] . 刘琦 ,国健男 ,宋省伟 . 电子制作 . 2015,第002期
6. 维吾尔文Web信息检索中基于改进VSM的文档表示及相似度研究 [C] . 吐尔地·托合提 ,维尼拉·木沙江 ,艾斯卡尔·艾木都拉 . 第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 . 2010
7. 信息检索中支持隐式时间查询的文档排名方法 [A] . 王晶晶 . 2017

Web文档查询与信息检索导航技术的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅