圣克拉拉会议中心(Santa Clara Convention Center)位于硅谷中心地带,2014 年 11 月 14 日,在一片“硅谷蓝”的映衬下,“The New Billions”——中美创业新贵硅谷峰会暨 2014 创业邦年会在此举办。丰元创投合伙人、前腾讯副总裁、谷歌搜索专家吴军发表演讲,他从技术角度讲解未来发展趋势。在他看来,机器将能解决很多智能问题。未来机器会接管很多原来人做的事情。尤其是对于中产阶级,比如律师、医生这样的行业领域,今后将会成为一个“很悲催”的世界,因为“机器在拿掉他们。”他说,这个领域市场会变成2% 而不是 98% 赚钱。
以下为现场实录:
吴军:刚才赵克仁和熊晓鸽给大家讲了很多关于投资方面和技术趋势的问题,我们今天讲一些具体一点的 Technology Intelligence “机器智能”。我不用人工智能这个词,因为人工智能是一个很窄的词,而且实际上它很多年前已经走到了死胡同。
Machine Intelligence 是一个现在正在发生的、在过去也发生、在将来也会产生非常大的结果的科技趋势或者技术。先看什么是 Machine Intelligence。我们一般理解的机器人,比如电影,亚洲和美国有个差别,美国的机器人都比较有力量,比如钢铁侠、变形金刚;而亚洲的稍微人性化一点,最典型的是阿童木,所以我一说机器人大家可能想到的是这样的形象。不管中国的还是美国,这里有两个实际的机器人,一个小圆盘子,可能很多在美国生活人家庭用过这个 iRobot 公司做的一个能自动扫地的机器人,就是像这个扫起来很轻而易举。另外一个是美国发射到火星上的 Curiosity “好奇者”火星探测器,是一个核动力的装置。但是这个机器人既不是变形金刚、阿童木,也不完全是 iRobot 或者好奇号,因为我们知道人在进化的过程中,最后和我们的近亲大概 100 多种灵长类差别在哪儿?不是我们的手和脚,我们的手和脚不一定比大猩猩或者黑猩猩更发达,而是脑子,所以这机器人最重要的是这个。
那什么叫机器有智能?我们现在要讲这个问题,五十年代的时候,计算机的老祖宗阿兰·图灵给出这么一个定义——这是今天大家被认可的,定义的非常巧妙——他就是说如果我们在这个屏幕后面,这是两个屏幕,一个屏幕后面放一个计算机或者一个机器,另外一个屏幕后面放一个人,然后我问他一个问题,比如说天为什么是蓝色的?然后让他们回答,如果你判断不出来哪一个是机器回答哪一个是人回答的,那么我就说这个机器有智能。这种测试方法应该是公平的,我想大家也会接受。
这是五十年代的事,后来五十年代末大家就开始搞所谓人工智能。这个人工智能呢,过去最早想人是怎么做这个智能的事情?用机器模仿人,基本上是这样一个想法,那么具体的细节就不讲了,我们这如果有很多学计算机的话,会知道这个细节。最后无非学过人工智能化,就是怎么摘个香蕉、计划一下这么一个 Planing。这条今天在各个大学,美国各个大学包括中国大学里头,虽然会教这个课,但是不会教专门研究这个事,因为也拿不着钱,也没有产生什么特别的结果。
到了六十年代末了,其实大家意识到让机器模仿人好多事情是做不到的,那么接下来这时候,最早发现这个问题的是一个非常有名的科学家叫 Wesley,他 68 年的时候得了图灵奖,他 66 年的时候提出一个问题,他就说这么两句话,就是说“The pen was in the box ”和“The box was in the pen”,第一句话好理解,钢笔在盒子里,第二句话怎么理解?为什么说盒子在钢笔里?也就是第二句话不好理解了。在英语里 Pen 实际上还有一个意思,就是小孩玩儿的围栏,那么这就好理解了,就是把盒子放在围栏里头。那从人工智能的角度或者从智能的角度来讲,这个就有问题,这个“pen”,我怎么知道是一个围栏。在任何的上下文中,你讲一篇文章看不到这一点,而且你看不到这个围栏比这个盒子大,这件事不知道,你要知道这件事你需要什么?你需要 World knowledge 对世界的知识,这就是为什么用传统的方式做机器智能做不下去,就是说我们人类能理解这些事,因为我有一个世界知识,这儿有一个叫做台阶,我走下去我不摔跤,但你一个 Robot 这个就走不好,它摔下去就起不来了,就趴在火星上,就起不来了,那么这个很大程度上是世界的知识。
然后七十年代,就是这两个人(ppt)。这是 2000 年的时候,我参加 ICAS 一个会,那个(01:09:46,英)他给的一个 Talk,题目就叫 From Watergate to Whitewater,所以我把这个两个人放在这了,为什么呢?因为在产生 Watergate 水门事件的这一年,尼克松这样很悲催,他们在 IBM 开始了通过数据驱动的方法,或者统计的方法来解决智能问题的最早尝试,就是在语音识别上,这是他们起源于 1972 年。然后到他给 TALK 的时候是 2000 年,再过去了将近三十年,这里头有一个巨大的进步,也就是说这三十年整个人慢慢开始认识到,机器来实现智能不是来模仿人的办法而是要计算,机器实现智能是通过计算来实现。这是第一,第二需要有 data。这是在从尼克松到 Wesley 这 28 年之间,科学家们认识到这一点,很遗憾的是在做机器学习或者计算机领域以外,很多人包括好莱坞他们拍一个电视的时候,讲这个东西的时候,还一直像大家传达一个非常错误的概念,就是一个人工智能的概念。你跟没有这个经验的人谈这个,你发现你是没法谈的,因为他还在想计算机是否像人似的突然它能够有 creative thinking,然后它突然有了意识。计算机实现技术智能就是要靠计算,那么当时最早实现的是两个计算机解决智能问题,一个语音识别,我画的一个语音波形的图一个人说话,还有一个是机器翻译,就是你们今天用谷歌,今天你们用的 Google voice 或者 Google translation,都用的很好。机器翻译我旁边画一块石头这石头叫 rosetta,你们去买机器翻译的软件,大部分好多名字都叫 rosetta,至于为什么叫 rosetta 呢?我可以自己做一个广告,可以去读我的新的书《文明之光》里面会讲为什么是叫做 rosetta。
好了现在这些东西大家都知道,都是用的,就是说机器能够解决很多人智能的问题,那么再难一点的问题,这是一直过去没解决的,就是说你计算机,我们回到阿兰·图灵的这个假设,你到底能不能回答问题,这个在两年前这个事还做不到,到两年前呢,我们开始在 google 里头来做这个事,那时候我离开腾讯,回 google 就来做这件事,我们大概有一个跨国的 team,刚才那个熊总和赵总都讲中国国际化,其实你看 google 做事就知道,中国国际化差的还非常非常远,当时我那个 team 来自于四个地方,除了旧金山以外,有纽约的,以色列和苏黎士的,这些科学家和工程师大家一起来做这个。花了大概两年多时间,到我离开以前,这件事我们做完了。基本上这是机器给的,答案,你现在大概看不出来这是机器回答的问题还是人产生的答案,“为什么天是蓝”它给的一个解释,因为光会散射,然后蓝光和红光的透射率是不一样的,最后红光梢下来了,蓝光留到天上了,大概是这样子,这是这么一个,另外一个类似的问题就是说为什么夏天比冬天冷,这个回答问题是这样,在学术界一般把所有的结论体叫做 WH (word sentence)这个句子,就是说……因为它第一个词都是W或者H,就是 How 和H,怎么怎么做什么事,然后问你什么时间,什么地方,什么人物,WHO、When、Where、Why 和 what 都是W,真正比较难回答的是 WHY 为什么的问题和 How 的答案是怎么做的问题,至于那个一些事实,你查一查写一些模式匹配都能找到,比如说以习近平哪天生的,奥巴马哪天当总统的,这都能找到。所以我们真正专注就是说能否回答这个问题。
这些事做完了,从阿兰·图灵的论点来讲,计算机有智能了,那么再接下来说这个是怎么做的?首先呢要说这跟传统的人工智能没有半毛钱的关系,这个实际上我们得益于两个东西,第一个就是计算机速度的提升,因为靠大量的计算。我给了这么一张图,这是叫摩尔定律,随着时间的推移,横轴是时间,纵轴是半导体芯片里面的 transister 的数量,你可以看到,就是说这个纵轴不是一个线性的,是一个指数的,所以它是一个指数增长,靠的是这个。我们假设说一开始计算机比较笨,但是它能算,如果你有好的数学模型,能够把智能问题变成数学问题,你可以想象人的智能的提高如果比水平的好一点是缓缓的一个往上走的一个很满的趋势,计算机是 explancial 的往上走,那它在某一点一定会交上,然后接下来计算机就会走的比人快的多。从此以后,人就比较悲催了,所以现在基本上到了 turning piont,这是第一个,就是靠着是计算机速度大。第二个是靠数据。为什么能够回答这些问题?因为构成这些问题答案的 pieces 现在在互联网上找的到,如果回到十年前也做不到这么一点,这个计算机并不会推理,但它并不需要推理,它只要会算就行,然后有足够多的数据,所以我现在已经讲了两点了。就是摩尔定律不用说了,就是半导体人干的事,跟大家可能也没什么关系,过去四十年,我们世界的 IT 发展,基本上是被摩尔定律所控制的,你信也好,不信也好,它就是在起作用,你要信了它,你就赶上了四十年代 IT 发展的浪潮,接下来呢,至少二十年往后看,这个世界将是被数据控制的,也是一样,你信它也好,不信它也好,就是这样,你信了它,你就有下一个机会,你不信它,你可能就错过了。
那么再接下来就要讲一个,就是说计算机有了这些数据,你怎么来算好呢?那里头就 google 提出一个深度的学习,说起来很好听叫 Google brain,我本来想画一个脑子的图,后来想会误导大家,我就把它里头真实的图画出来,其实这个是一个人工神经网络,这个人工神经网络和几十年前的没有太大差别,为什么 Google 选了这样一个作为机器学习的工具?因为在过去的几十年里,很多机器学习的算法也好,工具也好,它不断的在改进,比如说你用这个 Basin Network 贝司网络,这些东西他们都不爱看,唯有这个人工神经网络,基本算法不变。不变的好处在于说我搭一个平台,我可以不用天天在里头变那些实线,我可以稳定的运行很多东西,至于这里头的是怎么实现的 Google 这个东西,因为对数学稍微有一点有兴趣的,一个是对大数据有兴趣的,一个对深度学习的,我在新的这本书《数学之伟》第二册里头也讲,专门两章来讲这个。
好了讲完了到底现在比较正确的机器智能的道路是怎么走的,那么我们看看结果。这里头有两个车(ppt),一个是 Ggoogle 自动驾驶汽车,刚才我讲了,当计算机的计算速度和它的 power 到了一定点的时候,它跟人开始要分化,它就要开始比人能干了,所以在大概十几年前,大家已经意识到这点的时候,大家就在想很可能将来有一天,计算机要接管我们本来属于人该干的事,那么这件事都被它 take 走了,我们人还能干哪些事呢,可能会干什么?两个经济学家来讨论这个事,我要没记错是 MIT Sloan 商学院,然后他们想来想去,这是 2004 年的事,说有一件事可能计算机干不了,就是开车,因为为什么呢?两个原因,因为路况太复杂了,这个东西要做同时做出好多判断,这是第一个。第二个就是当时美国的美联政府资助的一些研究项目,然后后来大家把自己研制的自动驾驶汽车拿到没有人的路上跑一跑,实际上类似沙漠这种地方跑一跑,当时 2004 年的时候,跑第一名的我要没记错的话,开到十三迈左右的时候就死掉了,大概是二十公里就死掉了,剩下的车还不如它,当时开的速度是每小时五迈,大概我们人走路是每小时三英里,五英里比我们人走路要快一点,比自行车要慢很多,就是这样,所以 04 年其他车有的撞的不象样了,所以当时大家就想这个可能是机器取代不了人的地方,因为它好像不完全是计算问题。但是呢,实际上这种问题,它最后也变成了一个计算和数据的问题,所以到 2010 年,根据《纽约时报》的报道,纽约时报报导说 Google 的无人驾驶车当时已经跑了十几万英里在美国的高速公路和当地一些地方,没有出过一次事故,十几万英里已经快赶上我们人半辈子的开的车了,在内地和城市。当然也出了一次事故,不是它撞人,是后面的人撞它。所以这个你可以看到,我们以前很多想象不到的事情,你现在机器在帮你接管,第一个 Google 最早的原型是用的 Toyota 的这个车,后来是自己造的车,没有方向了,你如果能够仔细看的话,我不知道这个图片清楚不清楚,里面是没有方向盘,没有油门,没有刹车,只有一个开和关,但是后来根据加装的要求加了一个紧急制动。
好了,那就是说这个无人汽车是一种,你叫机器人也好,叫智能的机器也好,那讲我们自己最近投的两个公司。其实 Google 收购了一个公司 Nest,你可以认为是智能家具的一部分,其实按我标准来衡量,它其实是某一种机器人的一个触手,或者是一个眼睛,真正的现在我们谈的最重要的机器人是在 data center 区域中心背后的这些十万台甚至更多的服务器,以及上面非常聪明的算法,我刚才已经显示了,比如说深度学习这些算法,以及大量的数据。那么让我们投了两个,第一个很小的一个鼓出来一个是一个智能的浇水的一个机器人,就是在你们家可以把你们院子里面浇一点,看看哪儿比较干就多浇点水,那比较湿就少浇一点水,这个是这样一个 joblet,在《时代周刊》上也在里头做了一个介绍,这里头他有时候能省掉家里 99% 的水,因为你大部分的时候很多地方是不需要浇水的。后来它卖出去以后,很多人拿它做了别的事,不完全是浇水,比如说洗窗户和洗车,因为它可以编程它的高度、角度以及走到哪儿的位置等等,有人发现它在干这个。上面一个无人机,现在是一个比较 Hot Talking,这也是我们在z-park 投了两家公司,这个无人机叫 Skytech 现在这个估值已经高的不得了了,大概五亿美元,我们投的时候还很小,APPLE 的这些公司都在用它,它倒不是制造智能机,无人机它是本身一套完整的智能的系统,就是说它的所有的操作全是相当于自动,就是相当于有机器人后面帮他在做,比如说电池没了换电池,然后把存储卡拿下来换存储卡,这些输出给将来的用户,所有这些事全是自动来做,就是每天你只要给它派任务就行了,剩下的事你不用管了,这是一类,就是我们说 Machine Intelligence 更重要的我想讲的,实际上我们将来真正做的比较可怕的是 Intelligence,是在数据中心后的一万台服务器,或者说一百万台服务器。
我刚才讲了,说人比灵长类的动物优势的地方在于脑子,实际上我们把我们现在的想法开拓一点,就是说 ROBOT 机器人这个东西,它不光是一个你看的见、摸得着的这么一个不管是人形的也好,车状的也好,还有盘式的也好,这样的东西,机器人我们说机器智能,它可能是在我们墙背后一大堆的服务器,至于它伸出那些触手是什么样,可能是次要的,这是我将的,未来的趋势会带来我们社会一个什么变化,会改变我们这个社会。
(ppt)这是郭台铭的富士康的工厂,看一看,这是装的苹果的生产线,我看到都觉得很震惊,这个厂房简直大的不得了,左边这个好吧,然后下面是一些很悲催的女工,就是我们叫做卖血汗钱,我跟你讲未来的日子,这些人可能更悲摧,因为你想卖血汗都没有地方去卖血汗了,上面是他们搞的机器人,郭台铭说要 20 万个机器人,那么我就是说你可以看到这个 Machine Intelligence 这对社会的一个冲击,这不是我讲的一个浪潮,也可以说我这个人聪明,我不会去生产线,这跟我没关,我也不卖血汗钱,那好再看一个例子。(ppt)这是美国一个放射科医生,非常阳光的一个女性,是放射科医生。在美国生长的人大概知道,就是说这是一个专科,你拿到这个放射科的工作的话,在此以前你得受些苦,就是说你先要上四年大学,然后你再上四年医学院,中间你没有间断,很有运气,完了以后你做四年的实习医生,然后再去做两年 fellow 专科的实习,这时候你的那些高中同学们早就结婚生子,孩子都老大了,你可能还是单身一个人,等等那些人事业上已经升成了一个经理或者主管了,这时候你去告他我最近刚拿到一个工作的 OFFER,让他给我一份工作,不过年薪是 50 万美元,这就是今天美国放射科医生的生活,那么接下来是什么?
(ppt)这也是一个放射科医生,但它是一个机器人,刚才讲了,机器人不一定要使用手和脚还有轮子,可能是一个数据中心后的一万台服务器,也可能是很智能的机器,他检测癌症这个准确性,比我们看这个片子,比我们放射科医生看的还好,而且我们人看片子的结果准确与否,可能会今天的心情有关系,比如今天早上吃了警察的一个罚单,今天一天可能都不太高兴,机器没有这个问题。所以你可以想,未来是这样一个世界。再讲一个例子,你发现大家在硅谷买房子的人有几类人,就是说比如说办公司发财的,比较早去了 Google、Facebook 的,或者你在某一个公司升迁特别快的基本上就是这几类人,当时 30% 的钱都是来自于中国大陆,还有一类人就是我们说的 professional,比如说医生、律师是很挣钱的。
我这给出几和数字。第一个数字,一百个 million 一个亿。这是媒体上披露出来的 Goole 和 Warlm、Pulm 打官司花掉的律师费。第二个 Number 是什么?第二个是苹果和三星打官司,最后有些官司是调解了停下来了。判完了以后苹果说我太亏了,你三星帮我出一部分律师费,这是它要求三星帮它付的律师费十六个 million,这个官司呢,总的花了钱,被认为是几个亿,多少亿不知道,是X这样的。第三个 Number 就是十万美元,这是他花一万美元买了一个软件,这个软件帮它扫描两百万份各种各样的文件,因为打官司文件很多,然后他十万块钱打完了这个官司,所以你看这个差别,我就接着想说,我们这很多律师你可以收费一小时 1000 美元,这些人可能慢慢他们的工作在丢失。放射科医生还有律师是我们过去收入最好的。这个在丢失,那么今后是一个什么样的世界,你承认也好,不承认也好,你是否相信 republic 或 democracy 都没关系,这是一个事实,这是 Occupy Wall Street (占领华尔街运动)。所以你看这个样子很悲摧的,他们反对,反对什么?反对华尔街,华尔街是谁?没有目的的,为什么?美国的问题不是华尔街的问题,是 manystreet 是(01:31:46) 的问题,这些人在今后他可能变得更悲催,政府可以给他救济,可以给他钱,让他吃的更饱,但他的未来是灰暗的,因为 Machine 在不断的剥夺他们的工作,你承认也好,不承认也好,未来是制造 data center 背后那些 Machine 的那2% 的人,在通过 Machine 在控制我们的世界,你可以不承认这一点,你是一个慈善家,是一个社会学家,你可以不承认这一点,这是科技的一个事实。你可以制定很多政策来保证他们的福利,但是我想讲在座的这些人你们是加入 98% 还是2%,自己想,这是美国的薪水的变化,不是说我们科技发展,我们钱越挣越多,像熊总和赵总讲都发财了,不是这样的。
(ppt)你可以看到美国的薪水是一个往下的趋势,奥巴马的政策使得我们失业率下来了,但是平均工资没有上去,为什么?因为它找回来都是 more income 的工作。而 Machine 接管的是那些我们过去认为白领的需要人类智慧的工作,那么最后一张图绿色的线是硅谷的房价,涨的很快,为什么能长那么快?这是自然增长每年地方长那么快,当然中国来了 30% 的那些钱很重要,那一点,那个底下红色的积累出来,那是在这儿的明星公司,Google、Apple、Facebook 他们累积起来的财富,但他们员工人很少。这个当年 GM 是世界上最大的公司的时候,在六十年代的时候,是雇了几十万上百万的人,是一个世界范围内八十万的员工,今天市值最大的公司 Apple 多少人?八万人,加全球的最多不能超过十万人,估值比它大,也就是总的价值的比它大,也就是说这么多钱不是八十万人分,是十万人在分,所以这就是为什么这有些人能买的起的房子的原因,就是要么 join 这 98%,要么 join 这2%,不管政治家口号是什么样?科技和经济的发展,机器的结果就是这样的。
最后讲我们在 zpark Capital, Machine Intelligence 是我们一个 focus (重点)。是否投资、做 VC 就一定好了?不一定,因为一半的 VC 是赔钱的,我们现在大概做到在估值上回报是两倍多,已经大概超过 80% 的这些 VC 了。那怎么能够成为2% 的人,而不是这 98% 的人,这就是留给大家的问题。