写点什么

如何突破腾讯大数据分析架构瓶颈

  • 2019-09-07
  • 本文字数:711 字

    阅读完需:约 2 分钟

如何突破腾讯大数据分析架构瓶颈

QCon上海2018大会上,彭渊讲师做了《如何突破腾讯大数据分析架构瓶颈》主题演讲,主要内容如下。


演讲简介


对于腾讯庞大的大数据分析业务,几千台的 hadoop 集群近百 P 级的存储总量,每日全网 app 产生千亿的消息数据入库,需要针对几十亿 iemi 手机设备去重,并关联数百亿的历史全表,进行曝光、点击、pv、uv、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都全部依赖离线 m/r 和 hive sql,给集群造成很大压力,系统负载高任务积压重,计算耗时久业务响应慢(t+1),难以及时反馈市场信息的变化,不仅是技术上的巨大挑战,同时业务的迅速增长变化对当前技术团队的工作模式和流程也造成很大挑战。如何突破现有大数据分析架构瓶颈?本分享内容将带来腾讯大数据技术的新发展和架构实践,介绍基于自研 bitmap 技术的大数据系统“锋刃”,以及 olap 全新驱动模式的架构战略,真正做到秒级实时查看每分钟指标、全维度的用户 olap 自助分析、闭环的动态运营体系。

听众受益

  • 流处理 bitmap 的大数据实时分析架构和落地实践

  • 自研 bitmap 引擎和 RoaringBitmap 的对比优势

  • 腾讯灯塔业务场景实施

  • 腾讯天玑业务场景实施

  • 腾讯浏览器 ABtest 业务场景实施

  • 海量大数据的 rolap 和 molap 架构实践


讲师介绍


彭渊


腾讯 T4 专家 资深架构师


彭渊,现任腾讯 T4 专家,历任阿里资深专家,华为中间件首席架构师,淘宝高级专家等。在中国 IT 互联网技术领域从业多年,曾撰写多款开源软件,代表作有 Fourinone(四不像)分布式核心技术框架、CoolHash 并行数据库引擎等,曾出版书籍《大规模分布式系统架构与设计实战》,拥有多项软件著作权和专利。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-07 07:443526

评论

发布
暂无评论
发现更多内容

唯品会商品详情API接口的深度探索与应用实例

代码忍者

API 接口 pinduoduo API

二十载岁月如磐,一位高校女教师的技术坚守之路

华为云开发者联盟

鸿蒙 云主机 昇腾 AI 大底座

逻辑数据编织平台现代企业数据管理和分析的理想选择

Aloudata

数据仓库 数据分析 数据虚拟化 Data Fabric 数据编织

小红书笔记详情探索、用户分析及API接口技术交流

代码忍者

API 接口 pinduoduo API

上了ERP,还要上MES?这其中有什么门道?

积木链小链

ERP mes

腾讯健康:我们有 40% 的代码是 AI 写的

CodeBuddy

家居艺术新篇章:东芝艺术电视LA,定义生活美学新高度

极客天地

人到一定年纪,要学会远离多巴胺

禅道项目管理

项目管理 多巴胺 中年人 上瘾模型 延迟满足

js 数字计算的精度问题

不在线第一只蜗牛

JavaScript 前端

用户指南 | 如何使用 Flow 功能实现持续聚合,赋能实时计算和查询

Greptime 格睿科技

数据分析 时序数据库 持续聚合

1000%增长!我仅用一个小时搞定!AI智能体+AI小程序=MVP王炸组合!

陈宇明

KubeEdge 1.19.0版本发布!更完备的节点设备能力,全新的Dashboard体验

华为云原生团队

云计算 容器 云原生

超越用户手册: 零文档策略

俞凡

架构 最佳实践

《人工智能网络安全现状(2024)》深度解读:机遇、挑战与应对策略

云起无垠

一文介绍MySQL架构

伤感汤姆布利柏

非凸科技支持第49届ICPC亚洲区域赛南京站成功举行

非凸科技

#编程 ICPC

HTTP和HTTPS的区别

秃头小帅oi

做ppt去哪找模板?这5个模板网站值得推荐!

职场工具箱

效率工具 职场 PPT模板 办公软件 AI生成PPT

如何突破腾讯大数据分析架构瓶颈_QCon_彭渊_InfoQ精选文章