腾讯陈磊:大数据是解决开放平台效率的重要手段

阅读数:107 2013 年 5 月 7 日

话题:InfoQQCon云计算大数据腾讯语言 & 开发架构AI

由 InfoQ 主办,2013QCon 全球软件开发大会(北京站)于 4 月 25 日 -27 日在北京国际会议中心召开,作为年度软件研发技术交流盛会,大会云集了来自国内外顶级软件研发大师和各开发领域一线专家,带来了年度技术最强音。

腾讯云总经理、腾讯开放平台副总经理陈磊出席了此次盛会,在开放平台专题中,就腾讯开放平台的技术经验和参会者进行了深入分享与探讨。

开放平台构建生态体系

4 月 27 日,在大会主会场,腾讯云总经理、腾讯开放平台副总经理陈磊带来了主题为《开放平台的大数据挑战》的精彩演讲。

面对越来越多的平台加入开放的行列及产生的丰富数据,陈磊表示,开放平台的核心价值就是分配流量和消费资源给开发商和应用,解决平台效率最大化重要手段就是大数据。

陈磊谈到腾讯开放平台时,指出“它首先是全方位的开放平台,海量用户关系链的开放,同时包括触达海量用户的渠道,开放平台上被用户广泛使用的而且喜闻乐见的功能,比如相册、音乐、视频、微云等等,把这些功能开放出来,让开发商在这些强大的功能之上继续创新。我们最终的目的是形成一个生态环境,让大家在这个生态环境中能够创造价值。”

同时,陈磊提到 “在腾讯开放平台体系中,我们为开发者提供的平台主要有社交渠道、社交广告——广点通,而开发商和平台的利益是一致的,所有平台的大数据必不可少。”

“大数据就是解决开放平台效率的重要手段。”陈磊强调道。

海量、精准、实时挑战大数据

面对在开放下的平台带来的大数据挑战,陈磊表示,海量、精准和实时是处理大数据时的最大挑战,比如腾讯每天有近 3 亿用户使用 30 多万应用,每天新增 100TB 的统计数据,可以用来分析用户使用应用倾向的维度有 100 多万个,通过用户的兴趣与爱好,我们每天做这些分析要跑上万个 Map/Reduce Job,处理上百亿用户行为反馈。

而从大数据的精准角度来看,面临的挑战则更大。陈磊坦言,错误数据、大海捞针、快速迭代都是经常遇到的问题。

“比如一些网络注册用户的年龄、学历、职业等信息,很多时候都是明显虚假,一个玩复杂电子游戏非常厉害的人注册年龄可能只是几岁,但是通过其好友年龄分布、微博上 Follow 的名人、粉丝群年龄分布及不同社交平台的注册年龄校验,发现原来是个 40 岁的大叔。用户的学历、职业都可以通过这种方法进行验证,数据关系链还是非常靠谱的。”陈磊的精彩演讲让现场气氛顿时活跃了起来。

演讲最后,陈磊强调,大数据依然是解决开放平台效率的重要手段。我们希望借由腾讯全方位的开放平台,比如 QQ、微信、腾讯微博、视频、搜索等,通过这些平台既可以实现海量用户关系链的全面开放,还涵盖触达海量用户的渠道。我们希望做到大数据的海量、精准和实时,最终达到大数据的快与稳,细分与泛化的协调之美。