...
首页> 外文期刊>電子情報通信学会技術研究報告. ディペンダブルコンピュ-ティング. Dependable Computing >An Efficient Algorithm for Mining Frequent Unordered Trees from Semi-structured Data
【24h】

An Efficient Algorithm for Mining Frequent Unordered Trees from Semi-structured Data

机译:从半结构化数据频繁挖掘频繁无序树的高效算法

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper, we study a data raining problem of discovering frequent substructures in a large collection of semi-structured data, where both of the patterns and the data are modeled by labeled unordered trees. The keys of the algorithm are efficient enumerating all unordered trees and incrementally computation of the occurrences based on a powerful design technique known as the reverse search. We present an efficient algorithm called UNOT that computes all labeled unordered trees appearing in a collection of data trees with frequency above a user-specified threshold. We prove that the algorithm enumerates each frequent pattern T in O(kb{sup}2m} per pattern, where k is the size of T, 6 is the branching factor of the data tree, and m is the total number of occurrences of T in the data trees.
机译:在本文中,我们研究了在大量半结构数据集中发现频繁子结构的数据下雨问题,其中这两个模式和数据都是由标记的无序树建模的。 算法的键是高效枚举所有无序树,并基于已知为反向搜索的强大设计技术逐渐计算出现。 我们提出了一种称为单通的有效算法,该算法计算出现在数据树集合中的所有标记的无序树,其频率高于用户指定的阈值。 我们证明,该算法每个模式枚举每个频繁模式T(每个图案,其中k是T的大小,6是数据树的分支因子,M是T的总发生数量 在数据树中。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号