写点什么

如何突破腾讯大数据分析架构瓶颈

  • 2019-09-07
  • 本文字数:711 字

    阅读完需:约 2 分钟

如何突破腾讯大数据分析架构瓶颈

QCon上海2018大会上,彭渊讲师做了《如何突破腾讯大数据分析架构瓶颈》主题演讲,主要内容如下。


演讲简介


对于腾讯庞大的大数据分析业务,几千台的 hadoop 集群近百 P 级的存储总量,每日全网 app 产生千亿的消息数据入库,需要针对几十亿 iemi 手机设备去重,并关联数百亿的历史全表,进行曝光、点击、pv、uv、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都全部依赖离线 m/r 和 hive sql,给集群造成很大压力,系统负载高任务积压重,计算耗时久业务响应慢(t+1),难以及时反馈市场信息的变化,不仅是技术上的巨大挑战,同时业务的迅速增长变化对当前技术团队的工作模式和流程也造成很大挑战。如何突破现有大数据分析架构瓶颈?本分享内容将带来腾讯大数据技术的新发展和架构实践,介绍基于自研 bitmap 技术的大数据系统“锋刃”,以及 olap 全新驱动模式的架构战略,真正做到秒级实时查看每分钟指标、全维度的用户 olap 自助分析、闭环的动态运营体系。

听众受益

  • 流处理 bitmap 的大数据实时分析架构和落地实践

  • 自研 bitmap 引擎和 RoaringBitmap 的对比优势

  • 腾讯灯塔业务场景实施

  • 腾讯天玑业务场景实施

  • 腾讯浏览器 ABtest 业务场景实施

  • 海量大数据的 rolap 和 molap 架构实践


讲师介绍


彭渊


腾讯 T4 专家 资深架构师


彭渊,现任腾讯 T4 专家,历任阿里资深专家,华为中间件首席架构师,淘宝高级专家等。在中国 IT 互联网技术领域从业多年,曾撰写多款开源软件,代表作有 Fourinone(四不像)分布式核心技术框架、CoolHash 并行数据库引擎等,曾出版书籍《大规模分布式系统架构与设计实战》,拥有多项软件著作权和专利。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-07 07:443338

评论

发布
暂无评论
发现更多内容

我和极客时间的故事

法医

我和极客时间的故事

2023 Visual Studio Code 插件推荐:18 个提高开发效率的常用插件

小万哥

程序员 前端 vscode 后端 编辑器

华为云应用中间件DCS系列—Redis实现(视频直播)消息弹幕

华为云PaaS服务小智

云计算 软件开发 华为云

虚拟机是什么

芯动大师

PCE模型,FomoCat为何发起反Web3空气资产的社区试验

股市老人

Python - 字典4

小万哥

Python 程序员 软件 后端 开发

WorkPlus企业内部聊天软件,如何保障企业数据和信息的安全性?

BeeWorks

TuGraph Analytics图计算快速上手之弱联通分量算法

TuGraphAnalytics

图计算 WCC 连通分量

Python - 字典3

小万哥

Python 程序员 软件 后端 开发

低代码技术这么香,怎么把它的开发特点发挥到极致?

陈橘又青

低代码 无代码开发 无代码 低代码平台 无代码平台

以数智化指标管理,驱动光伏能源行业的市场推进

Kyligence

绿色能源 数据管理

私有化部署AI智能客服,解放企业成本,提升服务效率

BeeWorks

Bitquiz重塑Learn to Earn热潮,用户零投入让学习创造价值

股市老人

产品经理必备的14款需求管理工具推荐!

彭宏豪95

效率 软件 产品经理 需求管理 软件需求管理

构建高性能物联网数据平台:EMQX和CnosDB的完整教程

CnosDB

开源 时序数据库 emqx CnosDB

ES6新特性(一)

阡陌r

JavaScript ES6 模板字符串 解构赋值

出海 SaaS 企业增长修炼手册:聊聊 PLG 的关键指标、技术栈和挑战

Kyligence

数据分析 指标管理

探索低代码技术

树上有只程序猿

软件开发 低代码 JNPF

WorkPlus即时通讯办公软件,助力企业实现移动化办公

BeeWorks

声音传送门|TinyEngine 低代码引擎使用建议收集

OpenTiny社区

开源 前端 低代码

如何突破腾讯大数据分析架构瓶颈_QCon_彭渊_InfoQ精选文章