深度学习对互联网业务有什么帮助?

  现在我们可以看看百度在深度学习方面做了哪些工作。年初,百度建立了深度学习研究院;随后,百度硅谷人工智能实验室成立,这个实验室与Google相距只有六英里,方便一些硅谷的人才直接在本地展开研究;5月,Facebook科学家徐伟宣布加盟百度,他此前负责的项目是“大规模推荐系统”,更往前,他在NEC美国研究院从事神经网络底层的研究。6月,李彦宏群发了他今年第二封新员工介绍邮件:曾任职IBM研究院、雅虎研究院的机器学习专家张潼加入。

  这些是在人才架构上的动作。而在实际成果方面,深度学习的应用已经在2012年出现了。百度多媒体业务负责人余凯用淼叔做实验对象,演示了人脸搜索能力。可能是出于强化戏剧性效果以便于传播的考虑,这个产品叫“明星脸搜索”。实验对象实时拍一张照片,百度可以搜索出这张照片像哪个明星——但令人惊奇的是,在百度作为参考列出的互联网图片搜索照片中,第一张是淼叔10年前拍的一张照片。也是说,在没有任何其他条件限定的前提下,百度根据一个现实场景,找到了一个确定的人。

  由于计算机的高度普及,很多人可能已经固化了“搜索”的印象:面对屏幕上的一个输入框,敲入一串词语,电脑返回一堆链接,用户再逐个点开查看哪个是自己需要的内容。但当我们要教会从没接触过电脑的父母这一搜索过程时,发现它与人类天生的本能并不相同:父母们往往会指着一株不知名的植物,问电脑是否能告诉我们这是什么;他们也并不习惯键入文字内容(甚至还不会输入法),更希望对着电脑说一句“明天什么天气”能得到答案。

  传统的搜索,其交互方式是人工提炼出关键词输入,才返回答案。所以使用搜索引擎其实是一种技术,考验的是人能否准确观察问题、恰当提炼主题词,做到这些才有可能得到自己想要的信息。这与一切搜索引擎“公平地为每个人提供信息”的初衷相悖了。

  而深度学习的技术配合上大数据的储备,语音搜索、图像搜索等新兴技术不再仅仅是技术的噱头,而是将搜索用户从数亿拓展到数十亿的大生意。这也是Google、苹果和百度纷纷在语音搜索上推出新产品的原因。

  百度的移动互联网战略:抄后路

  在PC互联网上,新搜索方式的出现可能仅仅是扩大用户规模。但在移动互联网上,这种变革可能是生死之争。

  手机的小屏幕决定,用户不可能像在PC上一样顺畅高速输入,手机的麦克风和摄像头是比键盘普及得多的输入方式。而对语音搜索和图像搜索快速、高效地给出识别与匹配的结果,这正是深度学习所擅长的领域。所以百度语音助手虽然去年才推出,却在效果与一些专业做这个领域好几年的公司打成平手,语音搜索也一举占据了百度移动搜索10%的流量。在语音识别准确率方面,百度2012年一年的进展超过了过去15年进展的总和。同样,百度图像识别技术应用于全网搜索以后,以图搜图的准确率一下子从20%提升到80%。

  更重要的,除了入口之外,基于深度学习的大数据处理,将覆盖整个移动互联网的“后台”。移动互联网与云计算和大数据其实是一体两面的事务,高度移动化的手机等设备决定了它不会具有很强的运算能力,手机更多地是采集各类数据,将之传送到云计算平台,得到结果后再返回手机,供用户使用。将来的各类可穿戴设备也将是这种模式。

  所以,在腾讯、阿里纷纷基于APP展开研发与收购时,百度在这个领域显得相对沉寂。其实从去年9月百度世界的战略发布上,可以看出李彦宏的算盘:他希望在后台提供整个云计算能力,加上百度这些年积累的为丰富的中文数据与搜索需求,支撑开发者研发、发布各种APP。这样,即使百度没有任何前端的APP产品,也依然掌握了移动互联网的基础设施。

  百度无线事业部总经理岳国锋给我们盘点了百度开放给开发者提供的云开发能力与系统保障服务:云储存PCS、应用引擎BAE、云推送PUSH、位置服务LBS、自测平台MTC、众测平台、移动统计、开放平台提交、移动联运平台、In-App Ads。可以看到,既有开发、储存方面的服务,也有发行、营销能力的支持,还在移动变现方面进行了探索。

  路线选择的不同,使百度与腾讯、阿里的移动互联网战略可比性越来越弱(其中阿里巴巴着眼于提供电商生态平台的建设,与百度的抄后路战略略微相似)。但百度的这个战略也面临挑战,大的不确定性来自于数据的来源:腾讯拥有大量基于用户明确ID的行为数据,阿里巴巴则拥有整个互联网价值高的电商流量数据。在PC互联网上,百度拥有搜索框入口;但在移动互联网上,杀手级APP的匮乏,可能会导致百度在数据采集方面脚步放慢。在移动用户飞速增长的大前提下,如何再造移动入口,通过大数据“深度学习”出移动互联网的未来? 这或许是百度面临的关键挑战。