首页> 美国卫生研究院文献>Genomics Informatics >An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

【2h】

An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

机译：从大型DNA序列数据库中挖掘最大连续频率模式的有效方法

代理获取

本网站仅为用户提供外文OA文献查询和代理获取服务，本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文，但由于OA文献来源多样且变更频繁，仍可能出现获取不到、文献不完整或与标题不符等情况，如果获取不到我们将提供退款服务。请知悉。

页面导航

摘要
著录项
相似文献
相关主题

摘要

Mining interesting patterns from DNA sequences is one of the most challenging tasks in bioinformatics and computational biology. Maximal contiguous frequent patterns are preferable for expressing the function and structure of DNA sequences and hence can capture the common data characteristics among related sequences. Biologists are interested in finding frequent orderly arrangements of motifs that are responsible for similar expression of a group of genes. In order to reduce mining time and complexity, however, most existing sequence mining algorithms either focus on finding short DNA sequences or require explicit specification of sequence lengths in advance. The challenge is to find longer sequences without specifying sequence lengths in advance. In this paper, we propose an efficient approach to mining maximal contiguous frequent patterns from large DNA sequence datasets. The experimental results show that our proposed approach is memory-efficient and mines maximal contiguous frequent patterns within a reasonable time.

机译：从DNA序列中挖掘有趣的模式是生物信息学和计算生物学中最具挑战性的任务之一。为了表达DNA序列的功能和结构，优选最大连续的频繁模式，因此可以捕获相关序列之间的共同数据特征。生物学家有兴趣寻找导致一组基因相似表达的基序的频繁有序排列。但是，为了减少挖掘时间和复杂性，大多数现有的序列挖掘算法要么着重于寻找短的DNA序列，要么需要事先明确指定序列长度。挑战是要找到更长的序列而不预先指定序列长度。在本文中，我们提出了一种从大型DNA序列数据集中挖掘最大连续频繁模式的有效方法。实验结果表明，我们提出的方法具有较高的存储效率，并且可以在合理的时间内挖掘出最大的连续频繁模式。

著录项

期刊名称 Genomics Informatics
作者
Md. Rezaul Karim; Md. Mamunur Rashid; Byeong-Soo Jeong; Ho-Jin Choi;
展开▼
作者单位

展开▼
年(卷),期 2012(10),1
年度 2012
页码 51–57
总页数 7
原文格式 PDF
正文语种
中图分类生化遗传学;生化药理学;
关键词
DNA sequence maximal contiguous frequent pattern pattern mining suffix tree;

机译：DNA序列;最大连续频繁模式;模式挖掘;后缀树;

相似文献

外文文献
中文文献
专利

1. An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases [J] . Md. Rezaul Karim, Md. Mamunur Rashid, Byeong-Soo Jeong, Genomics & Informatics . 2012,第1期

机译：从大型DNA序列数据库中挖掘最大连续频率模式的有效方法
2. A MapReduce Framework for Mining Maximal Contiguous Frequent Patterns in Large DNA Sequence Datasets [J] . Md. Rezaul Karim, Md. Azam Hossain, Md. Mamunur Rashid, IETE Technical Review . 2012,第2期

机译：一个用于在大型DNA序列数据集中挖掘最大连续频率模式的MapReduce框架
3. An efficient mining algorithm for maximal weighted frequent patterns in transactional databases [J] . Unil Yun, Hyeonil Shin, Keun Ho Ryu, Knowledge-Based Systems . 2012,第期

机译：事务数据库中最大加权频繁模式的有效挖掘算法
4. HeurisFCP — A heuristic approach to Identify Frequent Contiguous Patterns (FCP) in Sequence Database [C] . Rajasekaran S., Arockiam L. 2012 International Conference on Radar, Communication and Computing. . 2012

机译：HeurisFCP-识别序列数据库中频繁连续模式（FCP）的启发式方法
5. Efficient frequent pattern mining over probabilistic databases. [D] . Tong, Yongxin. 2013

机译：通过概率数据库进行有效的频繁模式挖掘。
6. A novel meta-analytic approach: Mining frequent co-activation patterns in neuroimaging databases [O] . Julian Caspers, Karl Zilles, Christoph Beierle, -1

机译：一种新颖的荟萃分析方法：在神经影像数据库中挖掘频繁的共激活模式
7. An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases [O] . Md. Rezaul Karim, Md. Mamunur Rashid, Byeong-Soo Jeong, 2012

机译：从大型DNa序列数据库中挖掘最大连续频繁模式的有效方法
8. Crime Pattern Analysis: A Spatial Frequent Pattern Mining Approach. [R] . D. Oliver P. Mohan S. Shekhar X. Zhou 2012

机译：犯罪模式分析：一种空间频繁模式挖掘方法。

An Efficient Approach to Mining Maximal Contiguous Frequent Patterns from Large DNA Sequence Databases

摘要

著录项

相似文献

相关主题

期刊订阅