IBM 公司本周宣布,自己成功开发出了一种可以大幅缩短处理海量数据,并得出有用结论时间的全新深度学习技术。
简单来说,IBM 使用的“深度学习”技术是人工智能的其中一个分支,该技术使得电脑可以模仿人脑工作原理,并且已经成为了诸如微软、Facebook、亚马逊和谷歌这些科技企业的关注焦点。消息称,IBM 的目标是将深度学习系统分析数据需要的时间从数天缩短到数小时。
“这些改进可以帮助放射学家根据医学图像更快、更准确地找到病变部位。”IBM 研究所研究员、系统加速及记忆模块总监希拉里-亨特(Hillery Hunter)说道。
截至目前,深度学习主要依靠单一服务器运行,因为在不同计算机之间移动大量数据非常复杂。而且,如何处理在不同服务器和处理器之间的数据同步也是一个问题。
当地时间本周二,IBM 宣布已经成功开发出了能够将这些任务分配到 64 台服务器的软件,而这些服务器最高配置有 256 个处理器,可在数据处理速度方面取得巨大进步。而且,只要是使用 IBM Power 系统服务器的客户以及其他参与测试的技术人员,均可获得这一技术的使用权限。
据悉,IBM 使用了 64 个自主开发的 Power 8 服务器,每一个都将通用的英特尔微处理器和英伟达图形处理器连接起来,并使用快速的 NVLink 连接以促进两种芯片之间的数据流传输。
亨特在接受《财富》杂志采访时表示:“我们的想法是改变训练深度学习模式的速度,并真正提高人们的工作效率。”
对此,Pund-IT 公司创始人查尔斯-金(Charles King)也表示,自己对 IBM 的这一项目印象深刻,他相信 IBM 已经找到了一种“等量扩大”深度学习系统的方法,并通过额外增加处理器的方式大幅提高运算性能。
简单来说就是,将设备的处理器扩容 100% 理论上应该可以获得 100% 的等量性能提升。但实际上,由于复杂的流量管理和连接问题,这种等量增长的效益永远不会发生。
不过 IBM 却表示,自己研发的这一软件系统通过由“加州大学伯克利分校”(University of California at Berkeley)创建的“咖啡因深度学习框架”(the Caffe deep learning framework),成功在 256 个处理器之间实现了 95% 的扩展效率。在此之前,这一等量扩容的记录是由 Facebook 人工智能研究公司创造的,其扩展效率达到了 89%。
所谓的“咖啡因深度学习框架”是在 2013 年由加州大学伯克利分校的贾扬清博士在 Github 上发布。发布伊始,这一框架就得到了广泛关注,该框架以“Layer 层”为单位对深度神经网络结构进行了高度抽象,通过一些精巧的设计显著优化了执行效率,并且在保持高效的基础上不失灵活性。
“IBM 最新 95% 的扩展效率实在太优秀了,我简直不敢相信这是真的。”德克萨斯州奥斯丁市 Moor Insights & Strategy 研究公司总裁和创始人帕特里克-莫海德(PatrickMoorhead)惊讶的表示。
具体来说,IBM 的数据显示该软件可以在 7 个小时内识别 750 万张图片,准确率为 33.8%。在此之前,微软保持的最高准确率记录是 29.8%,但用时则达到了 10 天。换句话说就是,IBM 已经开发出了比现有深度学习技术更快、更精确的技术。当然,这一系统也需要同 IBM 的 Power 系统硬件和集群软件配合使用。