...
首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構
【24h】

木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構

机译:基于树结构的并行频繁模式挖掘中的动态负载分配机制

获取原文
获取原文并翻译 | 示例
           

摘要

大規模データベースから頻出パターンを効率的に発掘するのに、データ特性への適応が課題とされてきた.PCクラスタ上にFP-growthを基にした並列マイニングアルゴリズムを開発した.FP-growthが使用するFP-treeというデータ構造は分割が困難とされており、ノード間の処理負荷の偏りが増大する.提案する並列アルゴリズムは新たに導入されるpath depthとよばれるパラメータによって処理負荷を予測する.path depthは頻出パターンになりうるFP-treeの枝の長さから計算できる.しかしpath depthによる負荷分散制御はデータ特性依存パラメータを用いるため、未知のデータに対して、最適な値の決定が困難であった.本発表では、そのパラメータをマイニング実行中に最適化できる手法を提案する.
机译:为了有效地从大型数据库中发现频繁的模式,适应数据特征一直是一个问题。我们已经在PC集群上开发了基于FP-growth的并行挖掘算法。 FP-growth使用的称为FP-tree的数据结构难以划分,并且节点之间的处理负载的偏差增加。提出的并行算法通过新引入的称为路径深度的参数来预测处理负荷。可以从FP-tree分支的长度计算路径深度,该分支可以是常见的模式。但是,由于通过路径深度进行的负荷分配控制使用与数据特性有关的参数,因此难以确定未知数据的最佳值。在本演示中,我们提出了一种可以在挖掘执行过程中优化参数的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号