网络动态 2024-04-11 08:54:33 0

让构建 AI 应用更快捷!青云QingCloud为企业提供“合身_的托管Kubernetes服务

2012年，人工智能（AI）在全球范围内得到了广泛的应用。经过10年的发展，目前人工智能在各行各业都有大量的应用，如基因测序、路况识别、广告推送、新药开发、工业模拟、医学图像分割等，都需要算法建模来推动所有业务发展。这不可避免地需要深度学习，通常需要大规模计算资源GPU。一开始，GPU的使用和管理方式非常广泛，用户直接在GPU机器上训练算法。随着人工智能模型数量的增加，这种方法带来了巨大的问题。第一个是模型训练效率低下，第二个是GPU资源的利用率。GPU服务器与CPU服务器相比非常昂贵。在降低成本和提高效率的背景下，需要对平台进行统一管理。自2016年以来，Kubernetes社区收到了许多来自不同渠道的请求，希望在Kubernetes集群上运行像TensorFlow这样的机器学习框架。现在，大型企业在构建基于GPU的深度学习训练平台时，都在使用Kubernetes来管理和调度GPU任务。在构建环境中使用GPU非常繁琐，包括构建Kubernetes集群、安装GPU驱动程序、初始化GPU节点以及管理GPU节点到Kubernetes集群等配置工作。选择合适的托管Kubernetes服务，一键创建Kubernetes集群，部署机器学习应用程序，不仅可以提高集群资源的利用率，确保资源的排他性，还可以加快部署，使AI应用程序的构建更加简单快捷。在QingCloud Technology“在云上成长”系列网络研讨会的第二部分，我们邀请QingCloud Technology高级产品经理杨英与QingCloud容器服务QKE进行讨论。他分享了（QingCloud Kubernetes Engine）如何管理和调度GPU资源，高效完成机器学习、深度学习、图像识别等AI计算任务，将企业的大规模并行计算需求推向高性能。Ying Yang是Qinging Technology集装箱服务高级产品经理，负责基于Qinging云平台的集装箱服务产品和与集装箱服务相关的镜像仓库产品。他曾参与过许多云计算平台产品的构建，包括超融合云计算平台、DevOps平台等，具有云原生构建经验。9月27日（星期二）14：00起，青云“成长在云端”系列网络研讨会第二届，有机会扫描海报QR码报名，获取流行技术书籍!

抽奖：1.初学者人工智能入门：博客视角“PyTorch：入门与实践（第2版）”2.后端技术人员和基础平台工程师必读：图灵的“深入分析Kubernetes”

标签： Be ing

相关文章 关键词： Be ing

文章评论

相关文章
关键词： Be ing