首页> 中文学位 >基于半结构化数据信息检索的研究
【6h】

基于半结构化数据信息检索的研究

代理获取

目录

文摘

英文文摘

第一章引言

第二章半结构数据管理的图形方法与结构方法

第三章半结构数据的荐储模型以及查询执行

第四章基于站点的分布式检索结构的研究

第五章文本分类技术研究

第六章结论

致谢

参考文献

展开▼

摘要

由于半结构数据具有结构复杂、不规范和易变等特点,研究人员普遍采用灵活的图或树形结构来设计半结构数据模型。在数据模型的基础上,研究人员又提出了若干半结构数据的查询语言。图形的半结构数据模型具有很强的表达能力,能够灵活的表示网络上各种格式的数据,但是图形模型无法对数据种不同程度的结构进行明确的描述和概括,数据所具有的结构完全隐含在数据表示当中,在描述结构规则性较高的数据时存在大量的模式信息冗余,数据的处理效率比较低。 本文试图利用半结构数据中的规则结构来解决上述问题。从实际的半结构数据出发,本文设计了描述数据结构规则性的方法,并根据半结构数据的数据模式将半结构数据转化为关系数据,提高半结构数据处理的效率。本文提出了关系和图数据相结合的半结构数据存储模型,以及根据数据所具有的结构规则性,重新组织和存储数据的实际方法。其次,本文给出了将半结构查询转化为关系运算表达式的算法,提出了利用关系查询执行技术求解半结构数据查询的思路。 另外,本文结合当前搜索引擎的不足之处,提出了基于站点的分布式检索结构;最后,本文对文本分类的算法进行了研究,在分析、比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种给合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号