在万众期待中,Google 云计算平台日前推出了支持云端 GPU 加速服务的公开测试版,第一款支持的 GPU 型号是 NVIDIA 的 Tesla K80,使 Google 云平台的性能获得了巨大提升。现在,用户可以在谷歌云平台的三个地区玩转基于 NVIDIA GPU 的虚拟机,包括美东 1 区(us-east1),东亚 1 区(asia-east1)和西欧 1 区(europe-west1)。目前只支持使用 gcloud 的命令行工创建虚拟机,但从下周起就可以云终端界面来创建虚拟机啦。
据雷锋网了解,如果用户的深度学习算法需要额外的计算资源,其最多可以在自定义的 Google 云计端虚拟机上连接将 8 个 GPU(4 块 K80 的板子)。 GPU 可以加速多种类型的计算和分析,包括视频和图像转码,地震分析,分子建模,基因组学,计算金融,仿真,高性能数据分析,计算化学,金融,流体动力学和可视化。
图 1 NVIDIA K80 GPU 加速器板
用户只需在云端的虚拟机添加 GPU, 而不必在自己的数据中心构建 GPU 集群。雷锋网(公众号:雷锋网)获悉,Google 云计算平台上的 GPU 是直接连接到虚拟机的,提供 GPU 的裸机性能。每个 NVIDIA K80 GPU 配置了2,496 个流处理器和 12 GB 的 GDDR5 内存。用户可以灵活地选择1,2,4 或 8 个 NVIDIA GPU 来构建服务器形态,让运行在服务器上的虚拟机实例拥有最佳性能。
图 2 Google Cloud 支持多达 8 个 GPU 连接到自定义虚拟机,从而优化应用程序的性能。
这些实例支持流行的机器学习和深度学习框架,如 TensorFlow,Theano,Torch,MXNet 和 Caffe,以及 NVIDIA 流行的 CUDA 软件,CUDA 可用来构建 GPU 加速应用。
价钱
云 GPU 和谷歌其它基础设施一样,价格是一大亮点。价格按分钟计费,最低消费时长是 10 分钟。在美国,连接到虚拟机的每个 K80 GPU 的价格为每小时 0.700 美元,在亚洲和欧洲,每个 GPU 每小时 0.770 美元。和往常一样,用户只需按使用的量支付费用。这样就不需要自己维护一个 GPU 集群,在零资本投资下获得高速的深度学习和机器学习训练。
图 3 GCE 的 GPU 定价
加速的机器学习
Google 云 GPU 集成了 Google 云机器学习(Cloud ML),帮助您节省大规模使用 TensorFlow 框架训练机器学习模型所需的时间。现在,您不需要花费几天时间在单台机器上用大量的图像数据集训练一个图像分类器,您可以在云机器学习中使用多个 GPU 执行分布式训练,大大缩短开发周期并快速迭代模型。
Google 云机器学习是一项托管服务,提供端到端培训和预测工作流,集成了其他云计算工具,如 Google Cloud Dataflow,Google BigQuery,Google Cloud Storage 和 Google Cloud Datalab。
建议从从低量级开始,在小数据集上并训练 TensorFlow 模型,然后启动更大的云机器学习,用整个数据集训练模型,以充分利用 Google 云 GPU 的规模和性能。有关 Cloud ML 的更多信息,请参阅《快速入门指南》并开始使用,查看《Using GPUs for Training Models in the Cloud》这篇档以深入了解 Google 云 GPU。
下一步
请在 Cloud NEXT(谷歌云计算大会, 3 月 8 日至 10 日在旧金山举行)上注册账号,然后注册 CloudML 训练营,并了解如何使用 GPU 增强云计算性能。您可以使用 gcloud 命令行来创建虚拟机,并尝试在该虚拟机上运行 TensorFlow,体验加速的机器学习。
详细文档可在在这个网站上查看 https://cloud.google.com/gpu/。
本文摘自谷歌云平台博客,作者为谷歌产品经理 John Barrus,由雷锋网 AI 科技评论编译,封面图片 via gsmarena
via GPUs are now available for Google Compute Engine and Cloud Machine Learning