美国国防部高级研究计划局(DARPA)正在开发能够更好理解人类语言的深度学习技术,可以自动向情报分析人员汇报有用信息。
提到人工智能和自然语言处理,人们会想到谷歌、微软和雅虎等公司,却忽略了另外一条技术鲶鱼——DARPA。后者目前正在开发的一个“文本深度发掘与过滤”项目(DEFT),能够分析人类自身难以胜任的超大规模文本处理工作。
从 DARPA 的官网我们了解到这个项目启动与 2012 年中,至今已经开展了四年半时间,以下是 DARPA 官网对 DEFT 项目的介绍:
自动化的深度自然语言处理(NLP)技术是高效处理文本信息并理解文本之间隐含关联的有效解决途径。DARPA 启动 DEFT 项目的目的是为了驾驭 NLP 的威力。类似 NLP 的复杂人工智能技术,可以大幅提高国防分析师调查和处理文档的效率,从而发现一些隐秘的,可以指导行动的有用信息。
换而言之,DEFT 自然语言深度处理技术可以帮助情报分析师们快速处理大量文本和语音信息,了解“人物、时间、地点、事由”等关键信息,并解读一些模糊的说法或者暗示。
显然,自然语言深度处理技术对于政府互联网监控、执法部门的犯罪预防以及大数据反恐应用来说都具有重要意义。
目前 DARPA 寻求通过其资助的多所大学(包括斯坦福大学、卡内基梅隆大学和哥伦比亚大学)推动 DEFT 项目。
作为奥巴马政府 2012 年启动的 2 亿美元的政府大数据研究计划的一部分,美国国防部同时也宣布在大数据领域每年将投入 2500 万美元,其中 600 万美元用于支持新的研究项目。而 DARPA 当时开展 XDATA 项目,计划在四年内投入 1 亿美元开发能够过滤海量结构化和非结构化数据的计算机软硬件技术。除了 DEFT 项目外,DARPA 还正在积极开展其他机器学习领域的技术研发,例如图谱分析、时间线关联等高级大数据可视化分析项目。