声明
摘要
图的目录
表的目录
1 绪论
1.1 研究背景
1.2 相关工作
1.3 本文主要工作
1.4 本文结构
2 相关技术
2.1 云计算
2.1.1 云计算的概念
2.1.2 云计算的特点
2.1.3 云计算的服务层次
2.2 Hadoop平台
2.2.1 Hadoop
2.2.2 基于Hadoop的项目
2.2.3 HDFS
2.2.4 MapReduce
2.3 基于MapReduce的两表连接
2.3.1 Reduce端连接
2.3.2 Map端连接
2.3.3 基于MapReduce的两表连接优化
2.4 基于MapReduce的多表连接
2.4.1 多表连接分类
2.4.2 基于MapReduce的多表连接
2.4.3 基于MapReduce的多表连接优化
2.5 本章小结
3 MDMJ模型
3.1 基于MDMJ模型的三表链式连接
3.2 基于MDMJ模型的多表连接
3.3 本章小结
4 面向链式连接的TD-HMJ模型
4.1 TD-HMJ模型的处理过程
4.2 TD-HMJ分组策略
4.3 TD-HMJ节点分配策略
4.4 TD-HMJ算法
4.5 TD-HMJ实现
4.6 性能分析
4.6.1 MapReduce过程调用
4.6.2 节点数
4.6.3 数据传输量
4.7 本章小结
5 通用TD-HMJ模型
5.1 TD-HMJ简化模型
5.2 改进的TD-HMJ模型
5.3 TD-HMJ通用模型
5.4 本章小结
6 性能测试
6.1 连接表数
6.2 文件大小
6.3 节点数
6.4 本章小结
7 总结与展望
参考文献
个人简历及在学期间发表的学术论文
致谢