基于容器云的分布式深度学习实验平台构建 |
| |
引用本文: | 应毅,刘亚军,任凯.基于容器云的分布式深度学习实验平台构建[J].实验技术与管理,2022(3):147-152. |
| |
作者姓名: | 应毅 刘亚军 任凯 |
| |
摘 要: | 该文针对神经网络模型训练过慢、集群部署缺乏弹性问题,采用CPU+GPU混合架构,利用Docker和Kubernetes系统搭建底层容器云基础,以TensorFlow作为上层机器学习框架,构建了分布式深度学习实验平台,并详述了GPU镜像制作、计算节点GPU支持、Kubernetes集群搭建、TensorFlow集群部署等...
|
关 键 词: | 深度学习 分布式训练 TensorFlow Kubernetes Docker GPU计算 |
|
|