【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

如何突破腾讯大数据分析架构瓶颈

  • 2019-09-07
  • 本文字数:711 字

    阅读完需:约 2 分钟

如何突破腾讯大数据分析架构瓶颈

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

QCon上海2018大会上,彭渊讲师做了《如何突破腾讯大数据分析架构瓶颈》主题演讲,主要内容如下。


演讲简介


对于腾讯庞大的大数据分析业务,几千台的 hadoop 集群近百 P 级的存储总量,每日全网 app 产生千亿的消息数据入库,需要针对几十亿 iemi 手机设备去重,并关联数百亿的历史全表,进行曝光、点击、pv、uv、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都全部依赖离线 m/r 和 hive sql,给集群造成很大压力,系统负载高任务积压重,计算耗时久业务响应慢(t+1),难以及时反馈市场信息的变化,不仅是技术上的巨大挑战,同时业务的迅速增长变化对当前技术团队的工作模式和流程也造成很大挑战。如何突破现有大数据分析架构瓶颈?本分享内容将带来腾讯大数据技术的新发展和架构实践,介绍基于自研 bitmap 技术的大数据系统“锋刃”,以及 olap 全新驱动模式的架构战略,真正做到秒级实时查看每分钟指标、全维度的用户 olap 自助分析、闭环的动态运营体系。

听众受益

  • 流处理 bitmap 的大数据实时分析架构和落地实践

  • 自研 bitmap 引擎和 RoaringBitmap 的对比优势

  • 腾讯灯塔业务场景实施

  • 腾讯天玑业务场景实施

  • 腾讯浏览器 ABtest 业务场景实施

  • 海量大数据的 rolap 和 molap 架构实践


讲师介绍


彭渊


腾讯 T4 专家 资深架构师


彭渊,现任腾讯 T4 专家,历任阿里资深专家,华为中间件首席架构师,淘宝高级专家等。在中国 IT 互联网技术领域从业多年,曾撰写多款开源软件,代表作有 Fourinone(四不像)分布式核心技术框架、CoolHash 并行数据库引擎等,曾出版书籍《大规模分布式系统架构与设计实战》,拥有多项软件著作权和专利。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-07 07:443151

评论

发布
暂无评论
发现更多内容

深度解读昇腾CANN模型下沉技术,提升模型调度性能

华为云开发者联盟

人工智能 华为云 大模型 华为云开发者联盟 企业号2024年7月PK榜

企业跨省组网:SD-WAN解决方案

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

《好战略,坏战略2》摘录

充实的orzi

企业管理 战略

Redis Desktop Manager for Mac(Redis可视化工具)v2020中文激活版

Mac相关知识分享

可视化工具 数据库设计软件

MomoAl (MetaOasis)是什么?,以bitget 钱包为例

加密眼界

Microsoft Remote Desktop for Mac(远程桌面连接工具) 10.9.5正式版

Mac相关知识分享

Mac远程控制软件

CAD绘图软件Autodesk AutoCAD 2021 for Mac v2021.1.2中文激活版

Mac相关知识分享

MoneyPrinterPlus全面支持本地Ollama大模型

程序那些事

工具 程序那些事 AIGC

PDF专业制作与编辑软件Acrobat Pro DC 2021 for Mac v21.中文激活版

Mac相关知识分享

PDF 办公

SecureCRT Mac版:强大的SSH与远程连接工具

Mac相关知识分享

软件测试学习笔记丨接口请求头

测试人

软件测试 接口测试 测试开发

WAIC 2024,好city啊!

天翼云开发者社区

人工智能 世界人工智能大会 WAIC

数据库管理软件Navicat Premium 15 for Mac

Mac相关知识分享

Web3 游戏周报(7.07-7-13)

Footprint Analytics

链游

预告 | 博睿数据将亮相第四届中国新能源汽车产业数智峰会

博睿数据

安全可信| 通过双项测试!TeleDB实力亮剑!

天翼云开发者社区

数据库 云计算 天翼云

Go语言设计模式:使用Option模式简化类的初始化

伤感汤姆布利柏

如何保护你的网络安全?

网络安全服务

TCP 服务器 DDoS waf DDoS 攻击

企业如何利用小程序生态实现差异化?

Geek_2305a8

精准搜索:本地文件检索工具的高效策略

京东科技开发者

什么是MOW,以bitget钱包为例

长安区块链

博睿数据受邀出席深圳地区数智金融交流会 分享《云原生时代的高级可观测性》

博睿数据

Parallels Desktop 19一键激活版:强大的Mac虚拟机解决方案

Mac相关知识分享

【JavaScript】聊一聊js中的浅拷贝与深拷贝与手写实现

快乐非自愿限量之名

JavaScript 拷贝

RaftKeeper v2.1.0版本发布,性能大幅提升!

京东科技开发者

今天我们来聊Java IO模型,BIO、NIO、AIO三种常见IO模型

EquatorCoco

Java IO模型

WAIC 2024盛大召开,天翼云以全栈智算能力赋能AI时代!

天翼云开发者社区

人工智能大会 人工智能生态论坛

“文心•跨模态大模型”又有新动态,支持内容分析时输出自定义标签库

爱AI的猫猫头

音视频 低代码 大模型

int(1) 和 int(10) 有什么区别?

源字节1号

小程序 开源 `后端 前端‘’

上榜!天翼分布式云操作系统入选“科创中国”先导技术榜单!

天翼云开发者社区

云计算 分布式 云服务

分页查询及其拓展应用案例

快乐非自愿限量之名

分页查询

如何突破腾讯大数据分析架构瓶颈_QCon_彭渊_InfoQ精选文章