【24h】

Indexing Degenerate Strings

机译:索引简并字符串

获取原文
获取原文并翻译 | 示例

摘要

In this paper, we give the first, to our knowledge, structure and corresponding algorithm for indexing of factors of DNA and RNA sequences, where the text is degenerate i.e. contain sets of characters. The presented structure indexes so called k-factors, the factors of the degenerate text whose length does not exceed a given constant k. Our solution is based on the application of finite automata, the index is represented by Truncated Generalized Factor Automaton (TGFA). The size of TGFA is bounded from up by linear function of the length of text and it enables to find list occ(u) of all occurrences of for a given pattern u in degenerate text x in time ∣u∣ + ∣occ(u)∣
机译:在本文中,我们首先介绍了我们的知识,结构和用于索引DNA和RNA序列因素的相应算法,其中文本是简并的,即包含字符集。给出的结构索引了所谓的k因子,即退化文本的长度不超过给定常数k的因子。我们的解决方案基于有限自动机的应用,索引由截断广义因子自动机(TGFA)表示。 TGFA的大小由文本长度的线性函数向上限制,它使得能够在退化的文本x中,在时间∣u∣ + occ(u)中找到给定模式u的所有出现的列表occ(u) ∣

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号