智能用于实践" />
美国《福布斯》杂志近日撰文,列举了 Facebook 将人工智能技术应用于实践的 4 种方式。
以下为原文内容:
我之前写过几篇介绍机器学习和深度学习等人工智能基础知识的文章,现在似乎应该通过一些实例来讲解这些技术如何应用于实践。
Facebook 通过了解用户并将其数据打包卖给广告主的方式构建自己的业务,他们随后会利用借此赚取的收入展开再投资,以便为我们提供有用的新功能(目前包括视频和购物)从而加深对我们的了解。
Facebook 为我们提供的沟通和交流方式的确意义重大,也正因如此,它像磁铁一样从我们身上吸收了海量数据——我们是谁?我们把时间花在哪里?我们喜欢什么东西?但 Facebook 科学家的挑战在于,他们希望挖掘的这些庞大数据非常松散,几乎没有结构可言。
每分钟约有 12 亿人向这项服务上传 13.6 万张照片,更新 29.3 万次状态。面对如此庞大的数据,Facebook 直到最近都只能从这些非结构化数据中提取一小部分价值——这些数据难以量化,也很难制作成表格供计算机分析。
深度学习有助于改变这种状况。深度学习技术可以让机器自己学会如何对数据分类。图片分析工具就是其中的简单例子,它可以自学识别猫咪图片,而不必从程序员那里获知猫咪的具体特征。通过分析大量图片,它可以从图片的背景信息中吸收数据——猫咪图片中的其他东西看起来是什么样子?哪些文本或元数据可能表明一张图片包含猫咪?
通过这种方式,便可对非结构化数据进行结构化处理,通过量化方式将其呈现在一个表格中,让分析工具得以从中提取价值。他们试图借此回答一些问题,例如:一家公司的产品出现在猫咪图片中的频率有多高?我们是否应该把广告展示给爱猫人士?
这只是 Facebook 使用深度学习的基本原则,而随着深度学习算法越来越复杂,还可以将这些技术应用到我们分享的更多数据中,包括文本、图片和视频。
下文几个用例可以展示深度学习技术如何为 Facebook 创造价值,并帮助其为用户提供更多便利,使之加深对我们的了解。
1、文本分析
Facebook 上分享的数据仍有很大一部分以文本形式体现。从数据容量上看,视频的数据量或许更大。但从信息量上看,文本仍然可以提供丰富的数据。一张图片或许可以描绘 1000 个单词,但如果你只想回答一个简单的问题,往往并不需要 1000 个单词。如果无助于回答你的问题,那么所有数据都是噪音。更重要的是,这么做反而会浪费存储和分析资源。
Facebook 使用自家开发的 DeepText 工具了解我们发布的文字,展开上下文分析,从而提取其中的含义。神经网络负责分析文字之间的关系,以便根据周围其他的文字了解这些文字的意义发生了怎样的变化。由于这是一个半自动学习过程,算法未必有类似于字典这样的参考数据可用。相反,它需要根据文字的使用方式自主学习这些内容。
这就意味着文字的拼写变化、俚语或个人偏好不会对它产生影响。事实上,Facebook 表示,这项技术不受语言的制约——得益于它给文字分配标签的方式,这项技术可以轻而易举地在不同的人类语言之间切换,并将一种语言中学到的知识应用的另一种语言。
这项工具目前可以分析人们正在进行的对话,引导其查看他们可能购买的产品。该公司还专门制作了一段视频,帮助我们了解 Facebook 如何根据背景信息判断是否应该向用户展示购物链接。
2、面部识别
Facebook 使用名为 DeepFace 的深度学习应用识别图像中的人。该公司称,在判断两张不同图片中的人是否是同一个人时,其最先进的图像识别工具的准确率已经超过人类——DeepFace 成功率为 97%,人类仅为 96%。
公平地讲,这项技术的使用引发了争议。隐私倡议者认为,由于该技术可以使用高清图片识别每个人的身份,导致我们在公共场合匿名活动的自由受到限制。欧盟监管者也认同这一观点,并在 2013 年说服 Facebook 在欧洲停用这项功能。
这家社交媒体巨头当时使用了面部识别工具的早期版本,其中并未融入深度学习技术。自从引发媒体关注以来,该公司似乎对其技术进展保持沉默。他们似乎要等待尚未宣判的隐私官司公布最终结果,才会宣布该技术的推广计划。
3、精准广告
Facebook 借助深度神经网络(这是深度学习的基石)来决定应该将哪些广告展示给哪些用户。这一直以来都是该公司的业务基础,但让机器自行寻找对我们加深了解的方式,并在给我们展示广告时以最深刻的方式将我们分门别类,便可帮助其在与谷歌等高科技公司对抗的过程中保持竞争优势——后者同样希望在这一市场占据主导。
4、设计人工智能应用
Facebook 甚至认为,完全可以让机器决定应该用人工智能和深度学习技术改善哪些流程。一套名为 Flow 的系统已经完成部署,每月可以利用深度学习分析来模拟 30 万个机器学习模型,让工程师测试各种想法,并寻找能够提高效率的机会。
开源
Facebook 一直都很拥护开源技术,该公司的 Facebook 人工智能研究实验室已经开放了多数技术的源代码,方便开发者随意使用和修改。该公司的多数深度学习技术都是基于 Torch 平台开发的,这套环境的重点是深度学习技术和神经网络的开发。
该公司甚至开放了基于 GPU 的人工智能硬件设计方案——这种超级计算机针对深度学习任务进行了优化,而由于需要以极快的速度处理庞大的数据,所以这类任务往往需要强大的处理能力作后盾。
展望未来
深度学习可能在 Facebook 今后的发展中继续扮演关键角色。虽然该公司并未披露新应用的方向,但他们可能自动生成可以描述图片内容的音频,为视力受损的用户提供帮助;还有可能借此预测应该在哪里扩大覆盖范围,以便为世界各地的偏远地区提供上网服务。
该公司的人工智能和深度学习实验室拥有完善的资源,他们的一些长期项目可以为许多组织带来各种利益,既可以通过直接使用他们的服务来实现,也可以借助该公司对开源项目的支持来间接实现。