An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

Md. Rezaul Karim; Md. Mamunur Rashid; Byeong-Soo Jeong; Ho-Jin Choi

首页> 外文期刊>Genomics & Informatics >An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

【24h】

An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

机译：从大型DNA序列数据库中挖掘最大连续频率模式的有效方法

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Mining interesting patterns from DNA sequences is one of the most challenging tasks in bioinformatics and computational biology. Maximal contiguous frequent patterns are preferable for expressing the function and structure of DNA sequences and hence can capture the common data characteristics among related sequences. Biologists are interested in finding frequent orderly arrangements of motifs that are responsible for similar expression of a group of genes. In order to reduce mining time and complexity, however, most existing sequence mining algorithms either focus on finding short DNA sequences or require explicit specification of sequence lengths in advance. The challenge is to find longer sequences without specifying sequence lengths in advance. In this paper, we propose an efficient approach to mining maximal contiguous frequent patterns from large DNA sequence datasets. The experimental results show that our proposed approach is memory-efficient and mines maximal contiguous frequent patterns within a reasonable time.

机译：从DNA序列中挖掘有趣的模式是生物信息学和计算生物学中最具挑战性的任务之一。为了表达DNA序列的功能和结构，优选最大连续的频繁模式，因此可以捕获相关序列之间的共同数据特征。生物学家有兴趣寻找频繁有序排列的基序，这些基序负责一组基因的相似表达。但是，为了减少挖掘时间和复杂性，大多数现有的序列挖掘算法要么着重于寻找短的DNA序列，要么需要事先明确指定序列长度。挑战是要找到更长的序列而不预先指定序列长度。在本文中，我们提出了一种从大型DNA序列数据集中挖掘最大连续频繁模式的有效方法。实验结果表明，我们提出的方法具有较高的存储效率，并且可以在合理的时间内挖掘出最大的连续频繁模式。

著录项

来源
《Genomics & Informatics》 |2012年第1期|共7页
作者
Md. Rezaul Karim; Md. Mamunur Rashid; Byeong-Soo Jeong; Ho-Jin Choi;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类生物工程学（生物技术）;
关键词

相似文献

外文文献
中文文献
专利

1. A MapReduce Framework for Mining Maximal Contiguous Frequent Patterns in Large DNA Sequence Datasets [J] . Md. Rezaul Karim, Md. Azam Hossain, Md. Mamunur Rashid, IETE Technical Review . 2012,第2期

机译：一个用于在大型DNA序列数据集中挖掘最大连续频率模式的MapReduce框架
2. An efficient mining algorithm for maximal weighted frequent patterns in transactional databases [J] . Unil Yun, Hyeonil Shin, Keun Ho Ryu, Knowledge-Based Systems . 2012,第期

机译：事务数据库中最大加权频繁模式的有效挖掘算法
3. Mining maximal frequent patterns in transactional databases and dynamic data streams: A spark-based approach [J] . Karim Md. Rezaul, Cochez Michael, Beyan Oya Deniz, Information Sciences: An International Journal . 2018,第期

机译：在交易数据库和动态数据流中采集最大频繁模式：基于火花的方法
4. HeurisFCP — A heuristic approach to Identify Frequent Contiguous Patterns (FCP) in Sequence Database [C] . Rajasekaran S., Arockiam L. 2012 International Conference on Radar, Communication and Computing. . 2012

机译：HeurisFCP-识别序列数据库中频繁连续模式（FCP）的启发式方法
5. Efficient frequent pattern mining over probabilistic databases. [D] . Tong, Yongxin. 2013

机译：通过概率数据库进行有效的频繁模式挖掘。
6. An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases [O] . Md. Rezaul Karim, Md. Mamunur Rashid, Byeong-Soo Jeong, 2012

机译：从大型DNA序列数据库中挖掘最大连续频率模式的有效方法
7. An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases [O] . Md. Rezaul Karim, Md. Mamunur Rashid, Byeong-Soo Jeong, 2012

机译：从大型DNa序列数据库中挖掘最大连续频繁模式的有效方法
8. Crime Pattern Analysis: A Spatial Frequent Pattern Mining Approach. [R] . D. Oliver P. Mohan S. Shekhar X. Zhou 2012

机译：犯罪模式分析：一种空间频繁模式挖掘方法。

An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

摘要

著录项

相似文献

相关主题

期刊订阅