Pound:BuzzFeed 的网络传播优化与理解流程

阅读数:1311 2015 年 9 月 7 日

话题:语言 & 开发架构

BuzzFeed是由赫芬顿邮报的创始人 Jonah Peretti 于 2006 年创办的新闻聚合网站,总部位于纽约。该网站从数百个新闻来源那里获取订阅源,通过搜索、发送信息链接,让用户可以浏览当天网上最热门的事件,被称为是媒体行业的颠覆者。BuzzFeed 以善于挖掘眼球著称,其中奥秘在于它是一家以数据为驱动的公司,BuzzFeed 拥有强大的数据分析处理能力,从而能够基于数据创作出在社交媒体上令人疯转的内容。目前,BuzzFeed 每个月拥有数千万人分享的内容,以及超过 2 亿的独立访客,视频月浏览量也达到了 15 亿次。而在这所有的背后,起到强大支撑作用的是一项叫 Pound 的技术。

在 BuzzFeed Tech 的博客上,BuzzFeed 的出版商 Dao Nguyen 和数据专家 Kelleher 兄弟向外界对 Pound 技术进行了介绍。Pound 是一种捕捉 BuzzFeed 内容如何在社交网络上传播的新的专利技术,可以分析内容的传播路径和方式,从而帮助网站更好地确定内容投放和传播途径,Pound 是 Process for Optimizing and Understanding Network Diffusion(网络传播优化及理解流程)的缩写。Pound 对内容在不同分享者之间的传播进行跟踪,传播的平台可以是各种社交网络, 如 Facebook 和 Twitter,也可以是点对点的通信平台,如 Gchat 和电子邮件。

在 BuzzFeed 每月 2 亿的独立访客中,有接近四分之三来自社交媒体平台,这就为更好地洞察内容在社交网络中的扩散提供了一个独特的机会。假如,一个用户在 Facebook 分享了一组图片,有 Twitter 用户将其转发到自己的 Twitter 主页,又有 Pinterest 用户将这组图片从 Twitter 转发到 Pinterest。整个过程发生了什么?从这个过程中又能学习到什么?这就是 Pound 所解决的问题。

收集并存储这些网络传播的数据是一个巨大的工程挑战。面对这个问题,Pound 能够每秒处理超过 10,000 个网页请求。导致的结果是,现在一个月存储的 Pound 数据比 BuzzFeed 成立以来为内容优化收集的所有其他数据都要多。

在如此大的数据集中蕴含着丰富的知识,充分地挖掘它们能够帮助更好地理解数据、更好地理解用户,以及更好地理解社交网络。在这基础上,能够吸引更多的用户,并对他们实施更多的影响。从 Pound 数据中能够学习到什么?Buzzfeed 将其总结为三点:

发现的是森林,而不是树木

最初,Buzzfeed 认为数据可以表示为一个单一的树状图。但后来发现,每一条内容都有成百上千的初始分享者,他是他自己这棵树的根节点。每条内容的 Pound 图看起来更像是一片森林,而不是一棵树木。在这片森林中,树木可以看上去完全不同。有些是胖的(有很多下游节点),有些是瘦的;有些是深的(有很多层次),有些是浅的;有些是跨网络传播(不同的平台)的,有些则不是。整个传播的森林结构蕴含着内容传播的细节。

社交网络和商业推广应该由他们的整个下游渠道进行估值

在今年二月份,BuzzFeed 发布了一则“dress”内容。它已经被浏览超过 3800 万次。这个 Pound 数据显示了病毒内容是如何通过各种社交网络、邮件系统、新闻网站和博客上的数千万分享者进行传播的。

上图是 BuzzFeed 在 Facebook 主页上发布这则内容的网络扩散图,图中展示了分享“dress”内容的所有下游浏览者。不同的颜色代表了不同来源的浏览者,深蓝色代表 Facebook,浅蓝色代表 Twitter,白色代表其它网站,如博客或新闻网站。可以看出,大多数的节点是深蓝色的,这意味着他们点击是通过 Facebook,这是可以解释的,因为“初始分配者”是一个 Facebook 账号。

上面的可视化是 BuzzFeed 在 Twitter 主页上发布这则内容的网络扩散图。有些许淡蓝色的是 Twitter 占统治地位的集群,但更多的深蓝色的 Facebook 占统治地位的集群。也有相当大的白色集群,代表了那些通过博客或出版物阅读这则内容的人。这是正常的,因为来自 Twitter 的点击量仅仅占到了从 BuzzFeed 的 Twitter 账号扩散到下游其他网站总浏览量的四分之一。

上面的 GIF 通过缩放可以看到一个主要的 Twitter 集群内部在不同尺度上的网络扩散。

赞助内容会像编辑内容一样被分析、再分享

BuzzFeed 表示他们已经意识到这个现象很长一段时间,恰恰 Pound 数据帮助他们证明了这一点。下面给出一个例子,BuzzFeed 的创意服务团队在愚人节前夕写下一个标语,“I Tried The Fanny Basket And It Saved My Life!”。这则内容非常成功地获得了超过 40 万次的浏览量。下图给出了其 Pound 的可视化。

从图中可以看出社会分享有一个令人印象深刻的深度,从最初的分享开始算起,这则内容有 7 个附加层次的传播,最大可以达到 8 层 (相比之下,Twitter 集群对“Dress”内容的传播深度最大达到 11 层)。

放大这个集群可以捕捉分享了这条内容的网络化群组的层次结构。这就是社会口碑营销。Pound 使得口碑能够被度量,而一旦它可以度量,就可能被优化。

Pound 的下一步

Pound 的下一步应该是怎样的?BuzzFeed 给出了他们的几点想法:

  1. 推送的在线内容除了吸引你,是不是还能够吸引你的朋友和粉丝?
  2. 能否用 Pound 的数据来支持 A/B 测试?我们是否可以借此改进我们的网站和 APP,不单单吸引网站的读者,更能够吸引读者的朋友从而扩大网站的影响力?
  3. 把 BuzzFeed 和所有下游的分享和流量都算上的话,特定推广的效果到底有多强?
  4. 基于在线内容的所有特征,是否可以预测它的传播能有多广?
  5. 是否可以过滤掉主流网站和名人推广的作用,仅仅学习普通用户对在线内容的偏好,从而为每个人提供更多正确的内容?

最后,BuzzFeed 表示,目前正在寻找测试阶段的合作伙伴,思考如何使 Pound 更好地同时服务于广告商和受众,基于这项技术创作更多满足用户个性化需求的数据驱动型内容。

事实上,在这方面 BuzzFeed 已经取得了进展。8 月 27 日,Jonah Peretti宣布BuzzFeed 和全球最大的广告传播集团 WPP 达成了一项协议。前者将在近一年的时间里跟后者旗下的媒介代理公司 GroupM 合作。GroupM 将可以使用 Buzzfeed 的数据,并且获得使用 Pound 的权限,以此更有效率地帮助广告投放,这也将为 GroupM 公司提供更直接的利益。而对于 BuzzFeed 来说,这将帮助其广告卖的更好,营收增加。可以说这是数据内容与品牌平台的一次有力结合。


感谢徐川对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。