首页> 外文学位 >Sequence and structure similarity search in biological and XML databases.
【24h】

Sequence and structure similarity search in biological and XML databases.

机译:生物和XML数据库中的序列和结构相似性搜索。

获取原文
获取原文并翻译 | 示例

摘要

The unprecedented growth of the Internet and biological databases has introduced challenging and complex data formats and hence furnishing unique collaborative venues for scientists of various disciplines. The set of such complex databases includes, (1) XML (eXtended Markup Language) databases, (2) DNA and Protein sequence and structure databases, (3) Microarray gene expressions, (4) Biomedical images, and (5) Sensor data stream and Time series databases. Given a source query pattern and a target database, the similarity search (range query or top-k) seeks to identify those records of the database which match the given query. The problem of similarity search in biological and textual databases has received substantial attention in the past decade. Numerous filtration and indexing techniques have been proposed to address the scalability issues and reduce the curse of dimensionality. However, complex applications demand special customization based on the inherent and underlying dynamics of the data. In this work, we study the integration of various transformation and shape summarization techniques on biological sequence and protein structure data, as well as path encoding in the tree-structured XML data, for more efficient similarity search query processing.
机译:互联网和生物数据库的空前增长引入了具有挑战性的复杂数据格式,因此为各个学科的科学家提供了独特的协作场所。此类复杂数据库的集合包括:(1)XML(扩展标记语言)数据库,(2)DNA和蛋白质序列和结构数据库,(3)微阵列基因表达,(4)生物医学图像和(5)传感器数据流和时间序列数据库。给定一个源查询模式和一个目标数据库,相似性搜索(范围查询或top-k)试图识别与给定查询匹配的数据库记录。在过去的十年中,生物学和文本数据库中的相似性搜索问题受到了广泛关注。已经提出了许多过滤和索引技术来解决可伸缩性问题并减少维数的诅咒。但是,复杂的应用程序需要根据数据的固有和潜在动态进行特殊的自定义。在这项工作中,我们研究了对生物学序列和蛋白质结构数据的各种变换和形状汇总技术的集成,以及在树状XML数据中的路径编码,以便更有效地进行相似性搜索查询处理。

著录项

  • 作者

    Aghili, S. Alireza.;

  • 作者单位

    University of California, Santa Barbara.;

  • 授予单位 University of California, Santa Barbara.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2005
  • 页码 169 p.
  • 总页数 169
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号