【24h】

CUBE File: A File Structure for Hierarchically Clustered OLAP Cubes

机译:多维数据集文件:用于分层群集的OLAP多维数据集的文件结构

获取原文
获取原文并翻译 | 示例

摘要

Hierarchical clustering has been proved an effective means for physically organizing large fact tables since it reduces significantly the I/O cost during ad hoc OLAP query evaluation. In this paper, we propose a novel multidimensional file structure for organizing the most detailed data of a cube, the CUBE File. The CUBE File achieves hierarchical clustering of the data, enabling fast access via hierarchical restrictions. Moreover, it imposes a low storage cost and adapts perfectly to the extensive sparseness of the data space achieving a high compression rate. Our results show that the CUBE File outperforms the most effective method proposed up to now for hierarchically clustering the cube, resulting in 7-9 times less I/Os on average for all workloads tested. Thus, it achieves a higher degree of hierarchical clustering. Moreover, the CUBE File imposes a 2-3 times lower storage cost.
机译:事实证明,分层聚类是物理组织大型事实表的有效方法,因为它可以显着降低临时OLAP查询评估期间的I / O成本。在本文中,我们提出了一种新颖的多维文件结构,用于组织多维数据集(多维数据集)的最详细数据。多维数据集文件实现了数据的分层聚类,从而可以通过分层限制快速访问。此外,它具有较低的存储成本,并且完全适合于实现高压缩率的数据空间的广泛稀疏性。我们的结果表明,多维数据集文件的性能优于迄今为止提出的用于对多维数据集进行层次化群集的最有效方法,因此,所有测试工作负载的I / O平均减少了7-9倍。因此,它实现了更高程度的层次聚类。而且,CUBE文件的存储成本降低了2-3倍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号