2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

如何突破腾讯大数据分析架构瓶颈

  • 2019-09-07
  • 本文字数:711 字

    阅读完需:约 2 分钟

如何突破腾讯大数据分析架构瓶颈

QCon上海2018大会上,彭渊讲师做了《如何突破腾讯大数据分析架构瓶颈》主题演讲,主要内容如下。


演讲简介


对于腾讯庞大的大数据分析业务,几千台的 hadoop 集群近百 P 级的存储总量,每日全网 app 产生千亿的消息数据入库,需要针对几十亿 iemi 手机设备去重,并关联数百亿的历史全表,进行曝光、点击、pv、uv、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都全部依赖离线 m/r 和 hive sql,给集群造成很大压力,系统负载高任务积压重,计算耗时久业务响应慢(t+1),难以及时反馈市场信息的变化,不仅是技术上的巨大挑战,同时业务的迅速增长变化对当前技术团队的工作模式和流程也造成很大挑战。如何突破现有大数据分析架构瓶颈?本分享内容将带来腾讯大数据技术的新发展和架构实践,介绍基于自研 bitmap 技术的大数据系统“锋刃”,以及 olap 全新驱动模式的架构战略,真正做到秒级实时查看每分钟指标、全维度的用户 olap 自助分析、闭环的动态运营体系。

听众受益

  • 流处理 bitmap 的大数据实时分析架构和落地实践

  • 自研 bitmap 引擎和 RoaringBitmap 的对比优势

  • 腾讯灯塔业务场景实施

  • 腾讯天玑业务场景实施

  • 腾讯浏览器 ABtest 业务场景实施

  • 海量大数据的 rolap 和 molap 架构实践


讲师介绍


彭渊


腾讯 T4 专家 资深架构师


彭渊,现任腾讯 T4 专家,历任阿里资深专家,华为中间件首席架构师,淘宝高级专家等。在中国 IT 互联网技术领域从业多年,曾撰写多款开源软件,代表作有 Fourinone(四不像)分布式核心技术框架、CoolHash 并行数据库引擎等,曾出版书籍《大规模分布式系统架构与设计实战》,拥有多项软件著作权和专利。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-07 07:443490

评论

发布
暂无评论
发现更多内容

一文搞懂 Redis高性能之IO多路复用

架构精进之路

redis io 多路复用 高性能

架构师训练营 - 第四周 - 学习总结

stardust20

ARTS打卡 第5周

引花眠

ARTS 打卡计划

互联网架构学习总结

qihuajun

消息队列(一)为什么要使用消息队列?

奈何花开

Java MQ 消息队列

分布式系统设计 - 第四周作业

孙志平

架构师训练营 - 第四课作业 -20200701- 架构演化

👑👑merlan

极客大学架构师训练营

使用数据卷管理数据 | Docker 系列

AlwaysBeta

Docker 容器 数据

SQL运行内幕:从执行原理看调优的本质

帅旋

MySQL 数据库

互联网架构作业

qihuajun

每周学习总结 - 架构师培训 4 期

Damon

大型互联网公司技术方案与手段浅析

俊俊哥

分布式 高可用 大型软件 高并发 解决方案

【源码系列】Spring Cloud Eureka

Alex🐒

源码 Spring Cloud Eureka

第4周总结

andy

阿里巴巴的发展史(组织变革+技术变革)

王锟

阿里巴巴

架构师训练营 - 第 4 课总结 -20200627- 互联网架构设计

👑👑merlan

架构设计 互联网架构

极客时间 - 架构师培训 - 4 期作业

Damon

LeetCode | 6. Valid Parentheses 有效的括号

Puran

算法 LeetCode

架构师训练营 -- 第四周作业

stardust20

消息队列(二)如何保证消息队列的高可用?

奈何花开

Java MQ 消息队列

架构师面试题(3)

满山李子

Go:gsignal,信号大师

陈思敏捷

signal gsignal os.Signal Go 语言

Week4 学习总结

wyzwlj

极客大学架构师训练营

信息的表示与存储-浮点数的运算

引花眠

计算机基础

架构师训练营 -week4 命题作业

J.Smile

极客大学架构师训练营

架构师培训营第四周总结

王锟

ARTS|Week 5 有效的括号、API和地图

Puran

LeetCode ARTS 打卡计划

第四周作业

andy

架构师课程第四周 作业

杉松壁

通过Python来获取北京市乡镇、街道行政区划数据

Puran

Python GIS geopandas QGIS 天地图

架构第四周 - 学习总结

J.Smile

极客大学架构师训练营

如何突破腾讯大数据分析架构瓶颈_QCon_彭渊_InfoQ精选文章