Facebook 是如何应用大数据的?

  • 谢丽

2015 年 12 月 15 日

话题:Facebook大数据语言 & 开发架构

在 Facebook 上,每天会产生 100 亿条消息、45 亿次“喜欢”按钮点击和 3.5 亿张新图片。对于许多人而言,这些信息没有任何意义,但借助大数据技术,Facebook 可以了解用户的位置、朋友、喜好等信息。近日,Medium 分享了一篇关于 Facebook 如何应用大数据的文章

Facebook 不只是会收集、存储和分析用户数据,他们还会通过下列方式确定或影响用户的行为:

  • 跟踪 Cookies:Facebook 通过使用跟踪 Cookies 来跟踪用户浏览 Web 的行为。如果用户在登录 Facebook 的同时浏览 Web,那么 Facebook 就可以跟踪用户访问的站点。
  • 面部识别:Facebook 可以借助用户分享的图像数据在 Web 和其他 Facebook 用户资料中跟踪用户。
  • 标注建议:借助图像处理和面部识别,Facebook 可以为用户提供照片标注建议。
  • 分析用户喜好:最近的一项研究表明,仅仅通过分析用户在 Facebook 上点击“喜欢”按钮的行为,就可以准确地预测用户的个性与品质这种高度敏感的信息。

不久前,Facebook 还向他的一些合作伙伴推出了“主题数据(Topic Data)”。主题数据可以向市场营销人员展示受众对于品牌、事件、活动和主题的反应。市场营销人员可以据此有选择地调整他们在该平台及其他渠道中的营销方式。此前,这些数据由第三方提供,但由于样本规模太小,那并不怎么有用。

数据是一个巨大的金矿,但对于数据的挖掘利用而言,隐私是一个绕不开的问题。虽然 Facebook 一直宣称,用户信息只有在获得用户许可的情况下才会被分享,而在出售给市场营销人员时会隐去姓名资料,但是问题总会出现。例如,许多用户都抱怨隐私设置过于复杂,很容易在无意间分享一些东西。另外,Facebook 的图搜索为陌生人访问用户的隐私数据提供了更多的机会。

另外,按照 Facebook 首席分析师 Ken Rudin 的说法,依赖大数据的公司会将挫折归因于两个问题:一是过多依赖于某一种技术,如 Hadoop。Facebook 安装了大量的 Hadoop 软件,甚至为此设计了自己特有的硬件。二是公司使用大数据回答无意义的问题。据 Rudin 介绍,在 Facebook,有意义的问题是指其答案可以为改变行为提供依据的问题。


感谢郭蕾对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

Facebook大数据语言 & 开发架构