首页> 中文期刊> 《计算机学报》 >云计算环境下知识约简算法

云计算环境下知识约简算法

         

摘要

知识约简是粗糙集理论的重要研究内容之一.经典的知识约简算法是假设所有数据一次性装入内存中,这显然不适合处理海量数据.为此,从属性(集)的可辨识性和不可辨识性出发,给出了可辨识和不可辨识对象对的概念及其性质,并阐述了它们与差别矩阵的关系.利用MapReduce设计了并行计算等价类的方法,提出了面向大规模数据的数据并行知识约简算法,讨论并实现了3种并行策略.最后,通过实验表明了云计算环境下知识约简算法是有效可行的,具有较好的可扩展性.%Knowledge reduction is one of the important research issues in rough set theory. Classical knowledge reduction algorithms assume all the datasets can be loaded into the main memory, which are infeasible for large-scale datasets. Massive data with high dimensions makes attribute reduction a challenging task. To this end, the concepts and properties of discernibility and indis-cernibility object pairs are given in terms of the discernibility and indiscernibility of the attribute(s). The relationship between discernibility matrix and them is illustrated in detail. Then, an algorithm of computing equivalence classes is designed for large-scale data in data parallel, and the corresponding knowledge reduction algorithms are proposed in cloud computing. Finally, three parallelism strategies are implemented and discussed. The experimental results demonstrate that knowledge reduction algorithms in cloud computing can scale well and efficiently process massive datasets on commodity computers.

著录项

  • 来源
    《计算机学报》 |2011年第12期|2332-2343|共12页
  • 作者

    钱进; 苗夺谦; 张泽华;

  • 作者单位

    同济大学计算机科学与技术系;

    上海;

    201804;

    江苏技术师范学院计算机工程学院;

    江苏常州;

    213001;

    同济大学嵌入式系统与服务计算教育部重点实验室;

    上海201804;

    同济大学计算机科学与技术系;

    上海;

    201804;

    同济大学嵌入式系统与服务计算教育部重点实验室;

    上海201804;

    同济大学计算机科学与技术系;

    上海;

    201804;

    同济大学嵌入式系统与服务计算教育部重点实验室;

    上海201804;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    云计算; 粗糙集; 知识约简; 数据并行; MapReduce;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号