对话Facebook CTO:人工智能对VR发展至关重要

Category: 
对话Facebook CTO:人工智能对VR发展至关重要
2016年11月15

北京时间11月14日消息,现在我们已经可以将神经网络放在掌中使用。上周,Facebook推出一个新工具,叫作“Style Transfer”,它可以实时为手机视频添加视觉效果。处理之后,视频的风格与《辛普森一家》、凡高画作有些类似,新工具正是利用AI(人工智能)技术才能做到这点,一般来说,AI需要大理服务器才能运行。去年,谷歌为“谷歌翻译”程序引进了神经网络技术,现在Facebook已经开发了一个名为“Caffe2Go”的深度学习系统,该系统高度浓缩,可以在iOS、Android移动APP上运行。

 

 

最近,Facebook CTO迈克·斯拉洛普夫(Mike Schroepfer)接受了《新科学人》的采访,他谈到了公司AI技术的发展,AI对沟通的影响,Facebook News Feed(信息流)受到了AI的影响,VR也受到了AI的影响。

 

 

下面是对话全文:

 

 

问:要让神经网络在移动设备上运行,需要足够高的效率,如何才能做到呢?

 

 

答:神经网络是一系列步骤的结果,在每一个步骤都会处理信息,为下一个步骤提供内容,站在算法角度看,我们拥有一个目标:得到同样的结果,但是要将步骤的数量降到最小。开发更小的模型,生成相似的结果,这就是算法所面临的挑战。

 

 

专门针对移动设备优化算法,这是第二部分。即使拥有更小的神经网络模型,如果直接拿过来植入移动手机,效果也不好。我们必须让科学家配对,一些人寻找办法压缩模型,一些人擅长在芯片层面做优化,一些人尝试了许多不同的技术,优化各个部分,让算法在手机上跑得更快,我们要将这些人配对。

 

 

问:修改视频,让它变得更像艺术品,这样做的确有趣,我们还能用AI做其它事情吗?

 

 

答:看起来似乎只是为了好玩,甚至有些愚蠢,实际不是的,我们之所以关注这一点有一个重要的原因:当你开发一些新东西,延迟会将有趣的东西变成难以处理的东西。因为时间延迟的不同,产品要么有趣,要么有创造力,或者干脆无法使用。

 

 

除此之外还有其它一些原因。我们制作了一些演示样本,在样本中,你可以将应用程序与目标侦测结合起来,如果想为视频的前景和背景添加不同的效果,你完全可以做到。

 

 

问:Facebook训练的神经网络还用在什么地方?

 

 

答:用在许多不同的地方。比如用在翻译中,每天用户上传几十亿张图片,我们用神经网络给图片添加题注,如果你的视力有问题,希望图片可以告诉你它是什么,神经网络可以实现。在信息流排序时,我们也用到了神经网络,你看到的故事可能会有成千上万条,但真正阅读的只有10条、20条或者30条,我们要向你展示最好的故事。我们还用神经网络侦测垃圾邮件,如果有人在Facebook分享一个链接,这个链接已经失效,我们可以发现,然后删除它。

 

 

问:你之前曾经表示,VR将会在社交互动中扮演重要角色。Facebook AI能够帮上忙吗?

 

 

答:要让VR实用,AI是一门关键技术。在真实世界中,我们需要搞清头部、手的位置,将它们的位置在VR世界中绘制出来,这就涉及到计算机视觉与VR的问题。如果没有它们,系统无法运行。今天我们已经可以实现,但在10年与20年之前,你很难做到。

 

 

我们不妨思考一个更深入的问题:如何将真实的替身放进VR世界。举个例子,我们与某个人呆在VR世界,他在笑,我必须侦测到他的笑,VR中的替身也应该笑。当某人讲话时,我们应该分析语言表情,让VR替身的嘴看起来跟真的一样,和真人讲话一样,而不是毫无反应,没有动作。如果在整个过程中VR替身很冷漠,我们就会缺少“存在感”。

 

 

从长远来看,未来所有的系统都会建立在智能代理之上,它们就是信息机器人,或者是家中可以交流的东西。将这些功能放在VR环境中再合适不过,因为它们可以为你导航,让你穿过众多的虚拟世界。你可以说:“嗨,带我去火星。”或者说:“带我去看看我的朋友Joe。”虚拟代理听到命令就会带你去,不需要点击菜单,不需要移动按钮。对于虚拟助手来说,VR是一个很适合的存在地,只是要实现有些遥远。

 

 

问:怎样才能实现这一目标?

 

 

答:在AI领域,语音识别的问题已经得到了很好的解决,该技术已经很不错了,但是在AI领域还有一个更大的挑战:提高自然语言理解能力,消除歧义。当我下达命令说:“带我去火星。”到底是什么意思?它是某一款游戏吗?是不是《火星救援》中的拖车?我说的到底是什么意思?对于AI来说这是一个难题。

 

如果系统很实用,知道我想要的到底是什么,那就显得相当强大,像魔法一样。如果给出的答案是错误的,就会让人很沮丧。正因如此,我们要开发一套系统,让它更实用,否则人们就不想要它。对于AI而言,这是一个问题:开发一套系统,让它可以按人类的方式理解语言。

 

 

问:等到某一天如果我们可以将神经网络装进口袋,那时会怎样呢?你能描绘一下吗?

 

 

答:有一种资源很宝贵,一但失去无法再获得,它就是时间。日复一日,年复一年,时间不断流逝,再也无法回来。有了AI,我们可以将时间用在自己更关注的事情上。我可以花时间多学3种语言,从而与家人更好沟通;如果有一套系统,它可以自动翻译,我就没有必要学习,我会有更多的时间与家人相处,我也可以将时间利用起来创作音乐,追求个人爱好,或者工作,做什么事情都行。

 

 

我有一个希望,让人们不再将时间浪费在无关重要的事情上,因为我们拥有一套系统,它可以照看我们,让我们专注于自己最关心的事情。

相关文章

VRrOOm Wechat