首页> 中文学位 >基于语义的生物信息集成中的信息提取与查询技术的研究
【6h】

基于语义的生物信息集成中的信息提取与查询技术的研究

代理获取

目录

声明

摘要

第一章 引言

1.1研究背景

1.2研究现状

1.2.1 Web基因调控数据源

1.2.2 Web信息的查询与检索

1.2.3 Web信息提取

1.2.4 网格和信息集成

1.2.5 基于语义网格的信息集成系统

1.3研究目标与研究内容

1.4论文结构

第二章相关技术

2.1 XML系列标准简介

2.2规则系统

2.3网格服务

2.4本体描述与数据模式建模

第三章 生物信息集成系统框架

3.1 基于语义网格的SEIRGrid信息检索与集成系统

3.2系统框架

3.3数据查询与检索

3.4信息提取与集成

3.5 小结

第四章 数据查询与检索

4.1概述

4.2查询解析与映射

4.2.1概述

4.2.2 用户查询语言及语法解析

4.2.3逻辑检索操作

4.2.4 SQL映射与数据持久化

4.2.5 基于数据库技术的数据筛选与投影

4.2.6 内存对象的筛选与投影

4.2.7 查询解析的其他问题

4.3数据检索

4.3.1 概述

4.3.2 Web访问对象

4.3.3 数据与查询缓存

4.3.4并发与混淆执行

4.3.5 实验结果与分析

4.4 小结

第五章 信息提取与集成

5.1概述

5.2信息提取

5.2.1概述

5.2.2基于XPATH规则的信息提取

5.2.3 基于文本上下文规则的信息提取

5.3信息集成

5.3.1概述

5.3.2 网格服务的实现

5.3.3 数据模式的概念描述和模式本体

5.4实验结果与分析

5.4.1 XPATH规则信息提取

5.4.2 文本上下文规则信息提取

5.4.3 较复杂的文本上下文规则

5.5 小结

第六章 信息提取的一点其他思考

6.1 XPATH规则的归纳学习

6.2文本上下文规则与模式匹配

6.3文本上下文规则与归纳逻辑编程

6.4文本上下文规则与数字实现

第七章 总结与展望

7.1 总结

7.2不足之处和未来工作展望

附录

参考文献

致谢

文章发表情况及参与项目情况

展开▼

摘要

鉴于开放的异构Web生物信息源数据量庞大,Web 访问低效而易出错,检索接口不完善,难于查询和检索,Web页面结构化程度低等问题,本文研究了基于语义网格的生物信息集成技术,从信息的查询、检索、提取和集成(数据源部分)四个方面入手,主要完成了如下一些工作: 1)详细设计了基于语义网格的生物信息集成系统的数据适配层的系统框架。 2)研究并实现了扩展现有Web数据源的检索能力以支持全面的数据查询的技术,主要包括查询解析、数据筛选和投影。虽然Web数据源提供的检索和访问方式各异,但本文提供了统一的访问方法;针对不同数据源良莠不齐的 Web 检索支持,本文提供了用户需要的查询能力。 3)研究了逻辑Web访问、带混淆的线程池和数据库缓存的技术,并实现了统一高效的Web检索和数据获取,提高了Web访问的速度,使得对Web数据源的大数据量查询成为可能。 4)重点研究并实现了利用XPATH规则和文本上下文规则自动地从Web页面中提取信息的技术,包括两种规则的规则执行模块和信息提取模块,以及文本上下文规则的词法和语法解析模块。同时,文本规则提供了一定的跟踪和调试能力帮助用户分析规则的执行过程,从而大大降低了编写和分析文本上下文规则的难度。 5)研究了基于语义网格的信息集成以及网格服务封装技术,实现了基因调控数据源部分,并提供了各数据源的模式本体。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号