揭秘Facebook的AI机器：AI已关乎存亡

发布时间：2017-03-02 12:34:32 所属栏目：外闻来源：网易科技

导读：副标题#e# 网易科技讯 3月 1日消息，除了Facebook人工智能研究部门(FAIR)之外，Facebook还设有一个名为应用机器学习的部门。国外科技网站Backchannel主编史蒂芬·列维(Steven Levy)近日撰文揭秘了该部门的运作，详解人工智能是如何成为该社交网络未来战略不

2007 年，他加入微软研究院位于英格兰剑桥的实验室。他在加盟不久后获知公司要举行比赛：微软准备推出必应，但需要在搜索广告这一重要组成部分上进行改进——准确预测用户会在什么时候点击广告。该公司决定就此举行内部比赛。胜出团队的解决方案将接受测试看看是否值得推出，团队成员也将获得免费到夏威夷旅游的奖励。 19 个团队参与竞争，最后坎德拉的团队并列获得冠军。他获得了免费出游的奖励，但微软却迟迟没有兑现更大的奖品(展开测试来决定他的作品是否可以推出)，这让他感到受骗。

后来发生的事情充分显示了坎德拉的决心。他开启疯狂的穷追不舍模式，以让公司给他一次机会。他进行了超过 50 次的内部讲话，他打造了模拟器来证明其算法的优越性。他也不断游说那位握有决策权的副总裁，不管后者去到哪，包括洗手间，他都伺机接近，不停宣讲自己的系统。

2009 年，坎德拉的算法随必应推出。

2012 年初，坎德拉探访在Facebook供职的一位朋友，在它的门洛帕克园区呆了一个周五。他惊讶地发现，在这家公司，人们并不需要乞求上级批准测试他们的作品。他们直接那么做就行了。在接下来的周一，他去Facebook面试，周末便拿到了要约。

当初的模型并不先进

加入Facebook的广告团队后，坎德拉的任务是领导一个小组展示相关度更高的广告。坎德拉说，虽然当时的系统有使用机器学习技术，“但我们所使用的模型并不是很先进，它们很简单。”

侯赛因·梅汉纳(Hussein Mehanna)是另一位跟坎德拉同时间加盟Facebook的工程师，他同样对该公司的系统在整合AI上缺乏进展感到惊讶。“在我还没有加入Facebook之前，看到该产品的质量，我以为一切都已经成型，但很显然还没有。”梅汉纳说，“在入职几个星期后，我就跟坎德拉说，Facebook真正缺少的是一个合适的世界级机器学习平台。我们有机器，但没有合适的软件来帮助机器尽可能多地从数据学习。”(梅汉纳如今是Facebook核心机器学习主管，也曾在微软供职多年——本文另外几位受访的工程师也是微软出身。巧合?)

对于“机器学习平台”，梅汉纳是说在基于大脑运作方式的模型普及后，那个将AI带出上世纪的寒冬期进入近年的绽放时期的范例的普及。以广告为例，Facebook需要它的系统做某种没有人能够做的事情：即时且准确地预测有多少人会点击给定的广告。于是坎德拉和他的团队着手打造一个基于机器学习程序的新系统。由于该团队想要将该系统打造成平台，让该部门所有的工程师都可以访问，他们采取了一种让建模和训练能够推广和复制的建造方式。

打造机器学习系统的一大重要因素是获得优质数据——越多越好。幸运的是，这是Facebook最大的资产之一：当你有超过 10 亿人每天使用你的产品，你就可以给你的训练集收集大量的数据，一旦开始测试你也可以获得无数用户行为方面的例子。正因为此，广告团队能够加快到每周推出几个模型，而不再是每几周推出一个新模型。由于要将系统做成平台——让公司内部其他的人员也能够用来开发他们自己的产品——坎德拉得联手数个团队来展开工作。这是一个精细的分三步走的过程。“你要先专注于性能，再专注于效用，然后专注于打造社区。”他说道。

坎德拉的广告团队证明了机器学习技术在Facebook的变革性。“我们在预测点击、点赞、转换等方面变得极为成功。”他说。将那种模式扩展到Facebook平台的其它服务也就成了顺理成章的事情。事实上，FAIR领导者乐昆之前就在呼吁设立部门来负责将AI应用到产品当中——准确来说，是在公司内部更大范围地推广机器学习技术。“我的确曾呼吁设立这样的部门，因为你需要这样由优秀工程师人才组成的组织专注于可为很多产品部门使用的基础技术，而不是直接负责产品。”乐昆表示。

2015 年 10 月，坎德拉成为新AML团队的主管(有一段时间，出于谨慎起见，他保留他在广告部门的职位，在两个职位之间穿梭)。他与FAIR保持紧密的联系。FAIR在纽约市、巴黎和门洛帕克均设有办事处，在门洛帕克它的研究人员实际上就在AML工程师的旁边工作。

AML和FAIR之间的协作，从一个给用户分享的照片提供语音描述的研发中的产品可见一斑。在过去的几年里，训练系统识别场景中的物品或者做出一般性的结论，如照片是在室内还是室外拍的，已经成为了标准的AI惯例。但最近，FAIR的科学家找到方法来训练神经网络描述图像中几乎所有的有趣物体，然后根据物体的位置和相对其它物体的位置来判断照片是关于什么的——实际上是通过分析姿势来判断特定照片里人们是在拥抱，还是在骑马。“我们给AML部门展示了这项技术，”乐昆说，“他们想了想，说，‘在这种情境中，那个技术会很有用。’”最终他们做出了一项可造福盲人或者视觉障碍着的功能原型，用户指向图像，就能让他们的手机通过语音给他们描述图像的内容。

“我们一直都在沟通，”坎德拉如是说到他的兄弟团队，“总的来说，要从科学技术发展到实际的项目，你需要粘合剂对吧?我们就是粘合剂。”

AI的四个应用领域

坎德拉将AI的应用分成四个领域：视觉、语言、语音和摄像效果。他表示，所有的这些东西将会带来“内容理解引擎。”通过研究如何理解平台内容的意思，Facebook想要从评论中检测出微妙的意图，从口语中提取出细微的东西，鉴别你在视频中快速出现的朋友的面孔，解读你的表情，然后将它们反映在你在虚拟现实场景中的化身。

“我们在研究AI的普遍化。”坎德拉说，“随着内容的爆炸性增长，我们需要提升理解和分析能力。”解决方案就在于打造普遍化的系统，使得一个项目的成功能够积累起来，让其它研究相关项目的团队能够受益。坎德拉称，“如果我能够打造出可将知识从一项任务转移到另一项的算法，那会很美妙，是吧?”

那种知识转移能够大大加快Facebook推出产品的速度。以Instagram为例。自上线以来，该照片分享服务就以时间倒序的形式来显示用户的照片。但 2016 年年初，它决定使用算法来按照相关性将照片排序。坎德拉指出，好消息是，由于AML已经在像动态消息(News Feed)这样的产品中实施过机器学习技术，“Instagram不必从头开始做。”他还说，“他们让一两个精通机器学习的工程师联系部分其它在运行某种内容排序应用的团队。然后，你可以直接将工作流程复制过来，有什么问题就问对方。”正因为此，Instagram短短几个月就能够实施这一重大变动。

（编辑：南平站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/7

首页

尾页

为推动国际人权事业发	微软人才流失严重高层
芯片制造必备液体进口	高通骁龙改名背后品牌