2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

如何突破腾讯大数据分析架构瓶颈

  • 2019-09-07
  • 本文字数:711 字

    阅读完需:约 2 分钟

如何突破腾讯大数据分析架构瓶颈

QCon上海2018大会上,彭渊讲师做了《如何突破腾讯大数据分析架构瓶颈》主题演讲,主要内容如下。


演讲简介


对于腾讯庞大的大数据分析业务,几千台的 hadoop 集群近百 P 级的存储总量,每日全网 app 产生千亿的消息数据入库,需要针对几十亿 iemi 手机设备去重,并关联数百亿的历史全表,进行曝光、点击、pv、uv、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都全部依赖离线 m/r 和 hive sql,给集群造成很大压力,系统负载高任务积压重,计算耗时久业务响应慢(t+1),难以及时反馈市场信息的变化,不仅是技术上的巨大挑战,同时业务的迅速增长变化对当前技术团队的工作模式和流程也造成很大挑战。如何突破现有大数据分析架构瓶颈?本分享内容将带来腾讯大数据技术的新发展和架构实践,介绍基于自研 bitmap 技术的大数据系统“锋刃”,以及 olap 全新驱动模式的架构战略,真正做到秒级实时查看每分钟指标、全维度的用户 olap 自助分析、闭环的动态运营体系。

听众受益

  • 流处理 bitmap 的大数据实时分析架构和落地实践

  • 自研 bitmap 引擎和 RoaringBitmap 的对比优势

  • 腾讯灯塔业务场景实施

  • 腾讯天玑业务场景实施

  • 腾讯浏览器 ABtest 业务场景实施

  • 海量大数据的 rolap 和 molap 架构实践


讲师介绍


彭渊


腾讯 T4 专家 资深架构师


彭渊,现任腾讯 T4 专家,历任阿里资深专家,华为中间件首席架构师,淘宝高级专家等。在中国 IT 互联网技术领域从业多年,曾撰写多款开源软件,代表作有 Fourinone(四不像)分布式核心技术框架、CoolHash 并行数据库引擎等,曾出版书籍《大规模分布式系统架构与设计实战》,拥有多项软件著作权和专利。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-07 07:443484

评论

发布
暂无评论
发现更多内容

Redis 搭建主从复用-读写分离和主备切换,及重要的关键词解释 部分3

刘大猫

人工智能 云计算 算法 物联网 大模型

AppCleaner & Uninstaller Pro 应用清理卸载工具

做梦万元户

解析 CodexField 五大核心模块:构建下一代链上内容资产基础设施

加密眼界

从“救火队长”到“AI指挥官”:传统运维的智能化跃迁之路

雅菲奥朗

人工智能 运维 AIOPS

深度解析 CodexField 五大核心模块:搭建下一代链上内容资产基础设施

股市老人

解析 CodexField 五大核心模块:构建下一代链上内容资产基础设施

石头财经

CSRF令牌保护的绕过技术详解

qife122

漏洞挖掘 CSRF攻击

2025年第39周数字取证与事件响应技术动态汇总

qife122

网络安全 数字取证

工业管理 项目管理经验总结(28)

万里无云万里天

项目管理 工业 工厂运维

Fork for Mac Git客户端管理工具

做梦万元户

基础模型升级,是跨越实用门槛的关键?

脑极体

AI

震惊!68%做AI的Java开发者选择了这个大模型框架!

六边形架构

langchain LLM应用开发 Java大模型开发 langchain4j

如何有效衡量开发者生产力:超越代码行数的思考

qife122

开发者生产力 绩效衡量

CodeBuddy IDE 携手 Lighthouse 实现从设计、代码到部署全流程

六月的雨在InfoQ

CodeBuddy CodeBuddyIDE 无界生成力 CodeBuddyCode

AI 生成代码,从 Copilot 到 Claude Code 的全景测评

掘金安东尼

过程控制 软件维护经验总结(9)

万里无云万里天

工业 工厂运维 过程控制

浏览器Blockstack.org全名字段输入限制缺失漏洞分析

qife122

网络安全 输入验证

Spring AI,一个让Spring应用轻松拥抱AI的统一框架

六边形架构

Java Spring AI LLM应用开发 Java大模型开发 Java接入大模型

真正“懂你”的输入法长什么样?讯飞用AI键作答

脑极体

AI

Aspire开启云原生开发新纪元:微软推出多语言应用开发平台

qife122

云原生 Aspire

2025年最佳AI摘要追踪工具全解析

qife122

AI搜索 搜索引擎优化

用 Claude Claude + Kimi新模型跑通了 Obsidian 工作流,效率起飞!(附教程)

苍何

深度解析 CodexField 五大核心模块:搭建下一代链上内容资产基础设施

BlockChain先知

进入职场第二课—融入

老李说技术

职场 职场新人 职场发展

PCalc for Mac 万能计算器

做梦万元户

大数据-147 Java 访问 Apache Kudu:从建表到 CRUD(含 KuduSession 刷新模式与多 Master 配置)

武子康

Java 大数据 spark 分布式 Apache Kudu

详解 CodexField 五大核心模块:筑牢下一代链上内容资产基础设施

西柚子

资本、开发者入局指南:鸿蒙生态的“高潜力赛道”找到了!

最新动态

进入新岗位的第一课——潜龙勿用

老李说技术

职场新人 职场发展 职场妙招

PyPI发布GitHub Action存在可注入表达式扩展漏洞

qife122

Github Actions 命令注入

GitHub 快速入门指南,新手必备的高效使用手册!

追逐时光者

GitHub

如何突破腾讯大数据分析架构瓶颈_QCon_彭渊_InfoQ精选文章