3 组数字告诉你 2016 年是人工智能产业突破性的一年:
1、2016 年百度年度热搜榜第 7 名“人工智能”、十大科技事件第 3 名“AlphaGo 决胜李世石”
2、2016 年 1458 家人工智能创业公司拿到融资,融资规模达到 89 亿美元
3、微软人工智能研究团队由 1000 多名研究人员和 5000 多名工程师组成
有热点、有资本、有技术,这就是 2016 年的人工智能行业动向。
无论是年初的的 Google DeepMind AlphaGo 机器人大战李世石,还是特斯拉无人驾驶造成命案,再到展会上机器人打破玻璃弄伤观众,人工智能已经成为我们日常必谈的话题。
在谈到 AlphaGo 和李世石的对决时,Google 公司的 CEO 皮查伊表示,“这次胜利的意义将为我们开创一个全新的局面,不过人类始终是终极赢家。”他认为,人类将创造出能够在各个行业里帮助我们的人工智能,从生活、工作、学习到旅行,甚至是治疗癌症、预测天气,都会有专门的人工智能。
根据投资研究机构 Ventures Scanner 的跟踪调查数据,截止 2016 年 11 月,一共有 1485 家人工智能创业功能拿到了融资,总融资金额超过 89 亿美元,创下历史之最。在这些拿到投资的企业中,有 44% 的企业为机器学习领域的人工智能。在整个人工智能产业中,有 35% 的企业选择机器学习路线这一行业主导方向。可以看出,投资机构都在押注人工智能产业。
根据《金融时报》的消息,微软 2015 年花在研发上的费用高达 120 亿美元,比 Google 公司还要高出三分之一,是全世界企业之最。微软研究员中有1/3 的人员正在从事人工智能相关项目的研究。去年 10 月微软调任顶级人工智能专家沈向洋负责一只世界最大的人工智能研发团队,这个团队由 1000 多名研究人员和 5000 多名工程师组成。舆论认为,微软此举是希望借人工智能扳回后 PC 时代的被动局面。
正是这么一个让人看起来充满希望的行业,却无处不在地充满着浮躁的气息。微软亚洲研究院副院长芮勇认为,外界没有理性地看待人工智能,甚至因为 AlphaGo 在围棋上的一次胜利过度解读成“人工智能已经战胜人类”。公众缺乏对人工智能的正确理解,并不能很好地理解人工智能究竟是什么,它究竟能在人类社会产生什么样的作用。
这真是一个全民蹭热点的年代
上周日,美国斯坦福大学计算机科学系副教授、人工智能实验室主管李飞飞应邀参加 GIF 17 活动。作为活动的第一个演讲嘉宾,她明显受到了媒体的“优待”。
您如何看待 AlphaGo?
您觉得《西部世界》里的场景需要多久才能成真?
您觉得《最强大脑》这个电视节目怎么样?
您觉得人工智能会毁灭人类吗?
“说实话我对 AlphaGo 并不是特别了解”
“我没有看过《西部世界》”
“我没有看过《最强大脑》”
“我没有读过《失控》那本书”
朋友们,先停一下!你们知道李飞飞是个什么样的人吗就提出这样“弱智”的问题?
李飞飞不是凯文·凯利,她是正儿八经的学术研究人员。当年斯坦福大学的李飞飞和普林斯顿大学的李凯共同研究视觉学习课题,一同缔造了 ImageNet 项目。提到 ImageNet 就要提到 WordNet,这是一个根据单词的语义进行分组整理的词典,它是所有人工智能学者都必须学习和用到的工具。而 ImageNet 可以说是 WordNet 的图注版,它为 WordNet 的 11 万个同义词集合(synset)提供图片注释,每个图片注释下面有平均 1000 张内容相似图片来解释这个同义词集合是什么意思。所有图片的添加都经过人工审核和标注,截至目前一共有 21800 多个同义词集合进行了图片注释,整个 ImageNet 中存在有 1420 万张图片。
人工智能利用这样的数据库和检索数据,可以更高效、准确地对物体进行识别,理解图像含义。这是只有科研人员才有耐心去做的一项工程,但成果确可以惠及后代。1985 年立项的 WordNet 至今仍为科研人员使用,在人工智能领域依旧有一席之地,IBM 的 Watson 机器人也使用这一数据库。可以想象,当 ImageNet 的图片注释完成之后,它将对人工智能图像识别行业产生基础性的突破。
然而,正是这么一个 40 岁的女人,却在活动中被各路媒体提问这种需要媒体评论家来回答的问题,这不是值得她去回答的问题。但李飞飞来 GIF 17 发表演讲对于台下的媒体来讲,可以说是给脸不要脸,或许媒体只是想让自己的文章标题出现“斯坦福教授”“李飞飞”和“AlphaGo”来吸引读者的眼球吧,如果对行业不懂或者只能发表一些浅显的观点,那么就不要占用别人的时间。更有网络直播平台在女主播的访谈中提问人工智能、星座和男朋友的事情。这真是一个全民蹭热点的时代。
在李飞飞看来,虽然北京很冷,但是人工智能确实火了。但她强调,人工智能现在火了,越希望可以有冷静下来做研究的人。同样,面对这样炒起来的火热,芮勇也有相似的看法,他认为距离人工智能技术改变日常生活还需要一段时间,认为实现真正的人工智能大约要 500 年,“你要让我在后面再加个 0 我也不反对。”
你们在媒体上看到的人工智能真的是人工智能的真正走向吗?其实并非如此。让人们对这个行业发展前沿产生误解甚至开始感觉恐慌,这是媒体和学界都有着不可推卸的责任。
从未上过头条的学术峰会
在 GeekPark GIF、TechCrunch Disrupt、CES、WWDC、36Kr Wise 等大型活动上看到诸如李飞飞、芮勇、吴恩达、Ben Goertzel 等人工智能行业大牛的身影,不得不说经过媒体的包装和头条报道,学术牛人在公众眼里成了“红人”,他们的观点代表了行业态度、他们的想法代表着行业方向。
但实际上,真正能够引领行业前沿、决定人工智能发展方向的是诸如 CCAI、AI WORLD、IJCAI、AAAI、IEEE 等学术会议,而在这些会议上,大牛们说的话、今天的讨论可完全不一样。在这里,才是他们真正的观点。
农历春节之后美国旧金山即将举办 AAAI 2017 大会。AAAI 的英文全称是 the Association for the Advance of Artificial Intelligence,即“美国人工智能协会”,它是人工智能领域的主要学术组织之一。AAAI 成立于 1979 年,这一组织旨在促进人工智能的研究工作,以及提倡人工智能的有序使用。此外,这一组织还帮助公众增加对人工智能的了解,提高人工智能从业人员教学水平。
近年最佳论文:
2015《从非负性到一般的算子成本划分》;
2014《纠正因果推断和统计推断里的选择偏差》;
2013《HC-搜索:为结构化推断学习启发式算法和成本函数》《SMILe:打乱的多事例学习》;
2012《通过不定核学习 SVM 分类器》《基于数据重构的文档摘要》。
就是这些你看不懂的内容,在不断地推动着人工智能行业往前迈进。在 GIF 17 上,如果有人能就上面的任一题目深入询问李飞飞,相信她会开心很多。
被迫改期的 AAAI 2017
今年 5 月份,被选为 AAAI 院士南京大学周志华教授在微博上表示,因为 AAAI 2017 大会的原定时间与中国农历春节冲突,经过多位华人学者的努力,AAAI 2017 决定改期到春节结束后再举行。“这是 AAAI 首次考虑中国春节因素,并作出改期改地的重大举措。相信随着华人学者影响力提高,更多顶级会议将有所考虑。”
在 AAAI 的院士、论文名单中,华人、国人的名字越来越多。从 2012 年中国浙大发表的《基于数据重构的文档摘要》被评为当年最佳论文开始,中国人工智能研究人员的名字越来越多的出现在被接受论文名单中,华人人工智能科学家的影响力也与日增加。
AAAI 2017 共收到 2590 篇投稿,录用了 638 篇,录用率为 24.6%,较去年的 2132 篇论文投稿录用 549 篇、录用率 26%,比例上有所下降但论文数量上升。其中华人作者姓名的论文数量越来越多,接近1/3。
就华人作者论文,除了能够看到来自清华、北大、南大、国防科技大学等国内一流研究院所的论文投稿之外,我们今天更应该关注的是企业研究人员的投稿。百度、腾讯、携程、iPIN 等国内人工智能研究团队都在 AAAI 2017 上发表了多篇论文。
百度人工智能团队的“百度人才智库 TIC”利用人工智能对人力资源进行智能化管理。百度这套完整的智能化人才管理系统,算是世界首创。在此之前,Google 和 Facebook 都曾在公司内部进行过小规模的测试,而真正万人公司级实装的只有百度。此外百度副总裁、自动驾驶事业部总经理王劲的团队也有论文入选。
携程科研团队基于自主研发的通用化推荐系统而撰写的论文也被 AAAI 收录,该系统利用深度神经网络的自动编码技术,提高旅游产品的推荐效果,场景转化率提高 13 倍,提高了用户的购买和实际体验。
iPIN 人工智能团队基于 Topic Model,利用深度学习技术在文档语义建模,增加了对句子与句子之间语义相关关系,弥补了 Topic Model 只有词频关系的缺点。他们将这一技术应用在社会经济图谱上,研发出一个类似于 Watson 机器人的系统,可以智能识别用户问题,解答用户提问,帮助用户高效决策。
此外还有 360 人工智能研究院院长颜水成团队、华为诺亚方舟实验室主任李航、腾讯优图实验室总监黄飞跃团队、今日头条实验室总监李磊团队等国内知名人工智能研究团队,他们的论文均被 AAAI 2017 收录。
研究团队助人工智能商业化起步
正如李飞飞在感受到这波人工智能热潮之后说的话,“人工智能现在越火,越希望冷静做研究的人。”细数一下 2016 年国内成功地实现人工智能商业化的团队我们会发现,这些团队中都有学术研究背景,都是人工智能研究行业的佼佼者,他们取得过很高的学术成绩。
利用在实验室里取得的最新技术,应用到公司本来的商业化产品上,使人工智能快速地商业化变现,这或许是人工智能实现商业化最快的路径。至少下面这几家公司已经证明了这条路径的可行性:
今日头条利用人工智能的黑箱算法来为用户提供最优质的内容,让内容创作者可以将优秀的内容传递到最适合的人手中。今日头条还用人工智能来发布“头条寻人”,一年之内帮助寻回数百名走失家人。
360 人工智能研究院已经将人工智能技术应用到智能摄像头和行车记录仪中,前者可以捕捉人脸记录家庭幸福微笑时刻,若有外人则会提醒,后者可以帮助驾驶员进行辅助驾驶,例如检测行车道线,如果发生偏移就会进行语音提醒防止发生意外。
被称为中国版 Watson 的 iPIN 则利用语义分析和认知分析技术成功搭建了一套商业认知分析的底层基础架构平台,目前已开放给教育、招聘、法律、金融等多个领域。其中在升学预测和生涯规划方面表现尤为突出,旗下子产品“完美志愿”在两年内已帮助多达 400 万高中学生实现精准的志愿填报和未来人生的生涯规划。
腾讯优图的人工智能人脸识别技术现已落地公安系统,即便在没有携带有效身份证件的情况下,这一系统也能以 99.65% 准确率对公民身份进行核对。这一技术可用于身份证二次申领、办理出国证件、旅店无证入住等,目前已在苏州公安局上线。
码隆科技的人工智能图像识别技术已经应用到多个领域,比如视觉中国的图片版权维护,即便图片经过修改也可以将其找到,再比如可以提高码头起重机的吊装效率,让起重机的吊钩可以更快地抓住集装箱。
案例不多,但足以说明让人晦涩难懂的学术研究正在通过公司商业化的运作产生价值,人工智能正在服务于更多人。根据美国银行的报告,到 2020 年,人工智能商业市场价值将超过 700 亿美元。虽然大而全的万能人工智能还不太可能在短期内出现,但是在未来几年内人工智能的杀手级应用应该就会到来。在人工智能时代,能够活下去并且走得更远的公司,必然是既懂技术、又懂需求,而且还能将技术商业化的公司。