写点什么

从引进到自研,腾讯大数据平台每日数据计算量超 30 万亿

  • 2019-11-11
  • 本文字数:2049 字

    阅读完需:约 7 分钟

从引进到自研,腾讯大数据平台每日数据计算量超30万亿

在 11 月 6 日召开的 Techo 开发者大会上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士正式对外披露腾讯大数据平台 10 年技术演进历程。经过 10 年的积累,腾讯大数据平台的算力资源池目前已有超过 20 万台的规模,每天实时数据计算量超过 30 万亿条,腾讯已经成为中国实时数据计算量最大的公司。并且,随着资源管理平台核心 TKE 和分布式数据库 TBase 正式对外开源,腾讯正在成为大数据领域开源最全面的公司。



腾讯云副总裁、腾讯数据平台部总经理蒋杰


作为全球最大的互联网公司之一,腾讯的数据量在短短 5、6 年时间增长了几千倍,目前每天产生的数据量超过几十万亿条数据在产生。为了应对这种爆炸式增长,腾讯走出了一条技术引进+改造+自研的道路。经过长达十年的不断升级和完善,腾讯大数据平台已经经历了四代演进。针对最新的大数据和人工智能技术发展趋势,腾讯正在下一代计算平台中,探索批流融合、ABC 融合以及数据湖和联邦学习等前沿技术。

十年四次升级 建立“大数据+AI”双引擎技术架构

腾讯内部目前有超过 100 万台服务器,腾讯云联合所有业务部门,利用业务空闲资源打造一套算力共享平台,该算力弹性资源池有 20 万的规模,大数据平台每天有 1500 万的分析任务、30 万亿次的实时计算量,并且每天数据接入条数达 35 万亿条数据。此外,腾讯云的分布式机器学习平台,能支撑 1 万亿维度的数据训练。


能支撑如此大规模数据的接入和运算,是腾讯在大数据技术领域超过 10 年的积累,其核心的大数据平台已经完成了三次迭代。从以 Hadoop 为核心的离线计算时代到以 Spark、Storm、Flink 为核心的实时计算时代,再到如今的机器学习和深度学习时代,腾讯从无到有研发了分布式的机器学习引擎 Angel,以及一站式 AI 开发平台智能钛 TI,用来解决数据训练和算法的问题。目前,腾讯正在研究以批流融合、ABC 融合、以及数据湖和联邦学习为方向的下一代大数据平台的研究,该平台将具备混合部署、跨域数据共享和边缘计算等能力。


据了解,为支撑海量业务发展,腾讯已经建立了“大数据+AI”的双引擎技术架构,其中,最底层为分布式存储层,存储结构化及非结构化数据,第二层是资源调度层,做 CPU、GPU 和 FPGA 的管理,第三层是计算层、分析层、数据采集层,而顶层则是业务应用层。通过四层完整的技术架构,自下而上为腾讯的整个应用生态保驾护航,保障亿万用户能安全顺畅地享受到腾讯的优质服务。

从局部优化到自主研发 在实践中不断创新

从开始的技术引进、局部优化到如今的自主创新,腾讯的大数据技术在实践中不断完善、不断创新。十年前,腾讯管理几百个节点都很困难,调度性能差,规模上不去。为了有效解决计算能力和大规模集群问题,腾讯自研调度器,相对原生调度器性能提升 150 倍,大大提升了集群可扩展性。2016 年,腾讯打破 Sort Benchmark 四项世界纪录,标志着算力已经达到世界领先水平。


由于腾讯 20 万台弹性资源池的机器分布在多个数据中心,不同地区甚至是不同国家,为了降低数据使用壁垒,去年自研了漂移计算引擎 SuperSQL,作为统一的数据分析入口,通过智能 CBO 优化器,将计算下推到分布在各地的异构数据源,数据分析性能提高很多倍,并且数据量越大优势越明显。


数据应用越来越深入,腾讯对数据挖掘的需求也越来越多。随着模型的增大,最初用来做数据训练的 MR、Spark 已经不能满足上亿的模型维度的需求。2015 年初,腾讯开始自研高性能的分布式机器学习平台 Angel,采用 PS 架构,能支持 10 亿维度。目前 Angel 发展到 3.0 版本,能支持万亿维度,也可以兼容 Spark、PyTorch、TensorFlow 等生态,进一步降低了使用门槛。此外,Angel 今年还新增了对深度学习、图计算等的支持。

腾讯正成为大数据领域开源最全面厂商

技术迭代不断加速,企业建设大数据平台和机器学习平台,不仅成本高昂,而且缺乏相应的专业人才,面临种种问题。


云时代,这些问题得到有效解决。目前,腾讯已经把网络、存储、数据库等 IaaS 能力,大数据、机器学习等 PaaS 的能力,以及上层的图像、语音、NLP、BI 等 SaaS 能力,通过腾讯云对外开放。在大数据和 AI 两个领域,腾讯推出了以 TBDS 和智能钛 TI 为首的双引擎。让每个企业,不需要专业的大数据和 AI 团队,也能便捷用上领先的大数据和 AI 的能力。


另外,腾讯也通过开源和广大开发者共享技术成果。从 2014 开始,将第一代平台的核心,腾讯版的 Hive 进行了开源,2017 年,更是把第三代平台的核心 Angel 开源。今年,腾讯加快了开源的脚步,在内部推开源协同的战略推动下,腾讯所有的技术栈,后续会越来越开放。


2 个月前,腾讯在 ApacheCon 2019 上,面向全球开发者正式宣布开源自身核心平台——实时数据采集平台 TubeMQ,并捐献给 Apache 社区。此次在 Techo 大会现场,再次重磅宣布正式开源资源管理平台核心 TKE 和分布式数据库 TBase,随着在大数据开源领域的开源逐步加速,腾讯正在成为中国大数据领域开源最全面的厂商。


“目前,已经有数百万的开发者在腾讯云上构建应用,相信后面会有越来越多开发者加入,我们将和所有开发者一起,共建云上的应用生态”,蒋杰表示。


2019-11-11 14:552812

评论

发布
暂无评论
发现更多内容

阿里内部一份手打524页《Java中高级核心知识》令人犹如醍醐灌顶

程序知音

Java java面试 java架构 后端技术 Java面试八股文

【AIGC未来的发展方向】面向人工智能的第一步,一文告诉你人工智能是什么以及未来的方向分析

码界西柚

人工智能 4月日更 AIGC ChatGPT

千亿流量并发治理!Alibaba实战Sentinel笔记,为微服务保驾护航

Java 微服务 sentinel 高并发 流量治理

5分钟搞懂NESAS

俞凡

安全 网络 通信

在Vue中,为什么从 props 中解构变量之后再watch它,无法检测到它的变化?

Lee Chen

JavaScript Vue3

网络IO模型BIO->Select->Epoll多路复用的进化史

从阿里出发看微服务发展!P8架构师手打800页微服务深度解析笔记

Java 架构 微服务

Java岗程序员必备学习方向,全会拿45Koffer没问题!

Java你猿哥

Java 面试 面经 Java工程师 春招

系统清理工具:Cocktail 16.3.3注册激活版

真大的脸盆

Mac Mac 软件 清理工具 清理优化 清理优化软件

十年程序老狗手写分布式服务架构:原理、设计与实战

小小怪下士

Java 程序员 分布式 后端

intellijidea卸载重装无法打开怎么办?IntelliJ IDEA彻底卸载教程

Rose

IntelliJ IDEA 2023下载 IntelliJ IDEA 2023破解 IntelliJ IDEA 2023最新 IntelliJ IDEA卸载

Mac 无线网络扫描工具:WiFi Explorer 3.4.2 (57)激活汉化版

真大的脸盆

无线管理 wifi工具

D-ONE计划解读|得帆云DeCode持续引领低代码产品演进!

得帆信息

新产品 低代码平台 aPaaS

了解5G安全标准,看这一篇就够了

俞凡

安全 网络 通信

前端面试实录HTTP篇

Immerse

https HTTP 前端面试 前端已死

Spring Boot自动配置原理详解和自定义封装实现starter

Java Spring Boot 自动配置

ChatGPT - SpringBoot Prompting Chain

马说IT

软件开发 ChatGPT

开源7天Github斩获4.5万Stars!阿里2023版高并发设计实录鲨疯了

程序员小毕

数据库 程序员 面试 高并发 架构师

Vue3常用代码块

青柚1943

LED显示屏近年来在中国的发展趋势

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家

QEMU事件循环机制

Linux内核拾遗

Linux Kenel 虚拟化 事件和事件循环 qemu kvm

DDD洋葱架构才是 yyds!阿里大牛手记(DDD)领域驱动设计应对之道

Java 领域驱动设计 DDD 架构师

TCP协议中的粘包和半包问题

TCP TCP协议 粘包 半包

好家伙!GitHub公选“头牌”阿里大牛开源1300页炫彩性能调优手记

Java 性能优化 性能调优

肝完阿里最新Java并发编程全优笔记,我成功晋升公司架构组

Java你猿哥

Java 架构师 并发 面经 Java工程师

从引进到自研,腾讯大数据平台每日数据计算量超30万亿_服务革新_云加社区_InfoQ精选文章