基于分布式缓存加速容器化深度学习的优化方法

张凯; 车漾

首页> 中文期刊> 《大数据》 >基于分布式缓存加速容器化深度学习的优化方法

基于分布式缓存加速容器化深度学习的优化方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

使用GPU运行容器化深度学习模型训练任务,性能往往受限于数据加载和预处理效率。很多GPU计算资源浪费在等待从远程存储服务读取数据的过程中。首先介绍了基于容器和分布式缓存技术加速深度学习训练的方法,以及使用Alluxio和Kubernetes实现的系统架构和初步优化手段;然后阐述了TDCS及其训练任务与缓存数据互感知的协同调度策略;接着在Kubernetes容器集群中实现了TDCS,增强了分布式缓存加速大规模深度学习训练的可扩展性;最后用ResNet50图像分类模型训练任务进行性能验证。实验结果表明,相较于直接从远程存储服务中读取数据,TDCS可对运行在128块NVIDIA V100 GPU设备上的分布式训练任务实现2~3倍加速。

著录项

来源
《大数据》 |2021年第5期|P.150-163|共14页
作者
张凯; 车漾;
展开▼
作者单位

阿里巴巴科技(北京)有限公司北京100102;

阿里巴巴科技(北京)有限公司北京100102;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
深度学习; 分布式缓存; 协同调度; Alluxio; 容器;

相似文献

中文文献
外文文献
专利

1. 基于分布式缓存加速容器化深度学习的优化方法 [J] . 张凯 ,车漾 . 大数据 . 2021,第005期
2. NVIDIA发布AI云容器注册加速深度学习Volta GPU登录Amazon Web服务 [J] . . 智能制造 . 2017,第011期
3. 基于加速退化数据的金属化膜脉冲电容器可靠性分析 [J] . 赵建印 ,孙权 ,周经伦 . 强激光与粒子束 . 2006,第009期
4. 基于改进粒子群算法的深度学习超参数优化方法 [J] . 李玉娟 . 信息通信 . 2020,第001期
5. 基于深度学习的复合材料铺层优化方法 [J] . 白国栋 ,童小燕 ,姚磊江 . 复合材料科学与工程 . 2020,第007期
6. 基于SQP算法的某型航空发动机加速控制优化方法研究 [C] . 赵琳 ,樊丁 . 中国航空学会第十四届发动机自动控制专业学术交流会 . 2008
7. 基于智能算法的压力容器关键部件结构优化方法研究 [A] . 伍能和 . 2019

基于分布式缓存加速容器化深度学习的优化方法

摘要

著录项

相似文献

相关主题

期刊订阅