【AICon】AI 大模型超全落地场景&最佳实践 了解详情
写点什么

聚焦技术发展及开源生态 腾讯全面揭秘大数据平台演进之路

  • 2019-11-12
  • 本文字数:2143 字

    阅读完需:约 7 分钟

聚焦技术发展及开源生态 腾讯全面揭秘大数据平台演进之路

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

11 月 7 日,腾讯 Techo 开发者大会的“腾讯大数据”分论坛上,围绕大数据的新技术进展及开源生态,腾讯大数据团队进行了详细解读,包括由集群规模化与异构化挑战所引发的漂移计算等新技术创新,越来越普遍的实时计算需求以及新架构的实践,能够无限弹性扩展的、面向未来的数据湖体系结构,大数据技术发展的新趋势与新挑战等。


腾讯也通过开源和广大开发者共享技术成果,并希望推动业界共同加入构建开源正生态。在前一天的大会主论坛上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士宣布资源管理平台核心 TKE 和分布式数据库 TBase 正式对外开源,腾讯正在走向大数据领域全面开源之路。


十年技术演进 从引进到自研

蒋杰指出,自 2009 年起,腾讯大数据平台已完成三次迭代,从以 Hadoop 为核心的离线计算时代到以 Storm、Spark、Flink 为核心的实时计算时代,再到如今的机器学习和深度学习时代。经过 10 年的积累,腾讯大数据平台的算力资源池目前已有超过 20 万台的规模,每天实时数据计算量超过 30 万亿条,腾讯已经成为中国实时数据计算量最大的公司。


从开始的技术引进、局部优化到如今的自主创新,腾讯的大数据技术在实践中不断优化、不断完善。随着系统演进和数据增长,异构集群、异构数据源问题凸显,为了降低数据使用壁垒,漂移计算平台研发负责人张韶全博士表示:“腾讯大数据去年自研了漂移计算引擎 SuperSQL,满足跨地区、跨集群、跨数据源的联邦数据需求,通过解决数据孤岛、优化资源使用,能够极大地降低数据联合分析的使用门槛,提升数据使用效率,最大化数据使用的价值。”



(腾讯漂移计算平台研发负责人张韶全博士)


2015 年起,腾讯就开始对大数据进行实时化的改造,到现在腾讯内部所有产品都已经广泛开始使用实时计算的模式。据实时计算平台研发负责人施晓罡博士介绍,Oceanus 是腾讯基于 Flink 打造的集开发、测试、部署和运维于一体的一站式可视化实时计算平台。目前 Oceanus 在内部支持了包括微信、QQ、腾讯游戏、腾讯视频、微信支付、财付通和 CDN 在内的多个重要产品,并在腾讯云上为公有云和私有云用户提供可靠的实时计算服务。围绕着内部海量业务,oceanus 团队同时将现网面临的各类问题以及解决手段反馈给社区,目前已经贡献了超过 300 多个的 patch,为 flink 稳定性、扩展性、易用性以及高性能做出重要贡献。



(腾讯实时计算平台研发负责人施晓罡博士)


而随着数据应用越来越深入,腾讯对数据挖掘的需求也越来越多。2015年初,腾讯开始自研高性能的分布式机器学习平台Angel,采用PS架构,能支持10亿维度,目前Angel发展到3.0版本,能支持万亿维度,也可以兼容Spark、PyTorch、TensorFlow等生态。从1.0到3.0,Angel从一个单一的模型训练平台发展到涵盖机器学习各个流程的全栈机器学习平台,并且已应用于微信支付、QQ、腾讯视频、腾讯社交广告及用户画像挖掘等业务。


目前,腾讯正在探索以批流融合、ABC 融合、以及数据湖和联邦学习为方向的下一代大数据平台的研究,该平台将具备混合部署、跨域数据共享和边缘计算等能力。

大数据平台全面开源 助力构建开源生态

今年,在内部开源协同的战略推动下,腾讯在大数据开源领域的开源逐步加速。此次在 Techo 大会现场,腾讯重磅宣布正式开源资源管理平台核心 TKE 和分布式数据库 TBase,至此完成了腾讯大数据核心能力全开源,并期望推动业界一起构建繁荣的开源生态。


其中,TKE 是基于 Kubernetes 的开源容器平台,在大数据,深度学习,通用服务等现网业务的实践和打磨下,可以同时服务公有云和私有云,并且在易用性,可靠性,安全性,通用性等方面领先业界。目前 TKE 已应用于腾讯内外部游戏、银行、汽车等多项业务。


TBase 则是在开源的 PostgreSQL 基础上自主研发的企业级分布式 HTAP 数据库管理系统,具备高扩展性、SQL 高兼容度、提供分布式全局事务一致性功能支持、多级容灾能力以及多维度资源隔离能力的高安全性等特征,同时支持关系模型下的在线交易+分析型业务。自 2015 年上线以来,TBase 已在腾讯内外部包括政务、银行、保险、证券、微信支付等多个行业提供底层数据库支撑。


在大数据领域,从 2014 开始,腾讯将第一代大数据平台的核心,腾讯版的 Hive 进行了开源,2017 年,更是把第三代平台的核心 Angel 开源并捐献给 Linux 基金会。2 个月前,在 ApacheCon 2019 上,腾讯面向全球开发者正式宣布开源实时数据采集平台 TubeMQ,并捐献给 Apache 社区。


在蒋杰看来,构建开源生态,一方面可以吸引更多的优秀开发者加入腾讯,一起推动技术研发更加进步;另一方面,整个开源生态的繁荣,能够让开源软件的功能更加完善,也能够更好的支撑腾讯的业务发展。如腾讯不断在云端演进和丰富大数据产品矩阵,目前已有数百万活跃开发者在云端学习、讨论、建设,其联合行业合作伙伴共同打造了覆盖 19 个行业的 100 多个行业解决方案,共同服务的客户数达到了 20 多万家,个人客户 60 多万家。


“开源是希望更好的回馈社区,希望开源生态能有更大的繁荣,腾讯的大数据将全面开源。”蒋杰表示。


2019-11-12 17:571158

评论

发布
暂无评论
发现更多内容

低代码开发在医疗健康领域中的应用研究

EquatorCoco

低代码 医疗健康

伙伴活动|W3C 标准带头人开讲 WebGPU 前沿趋势

声网

低代码平台对企业数字化建设的启示与应用

快乐非自愿限量之名

低代码 企业转型

如何提高python程序代码的健壮性

我再BUG界嘎嘎乱杀

Python 编程 后端 软件开发

互联网行业,什么人看起来“必成大器”?

秃头小帅oi

坚定投入核心软件!腾讯云数据库TDSQL荣获深圳市科技进步奖一等奖

Geek_2d6073

企业需要SD-WAN的十大理由

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

关于接口协议,你必须要知道这些!

霍格沃兹测试开发学社

AWS Elastic Beanstalk 监控可观测最佳实践

观测云

APM AWS

DashVector + ModelScope 玩转多模态检索

DashVector

数据库 AI 向量检索 大模型

半年涨粉1000万!揭秘快意大模型在短视频互动场景中的大规模应用实践!

快手技术

短视频 机器人 #大模型

PHP反射API与接口的动态分析

技术冰糖葫芦

API boy API 文档 API 性能测试

DashVector x 通义千问大模型:打造基于专属知识的问答服务

DashVector

数据库 后端 向量检索 大模型

零成本开发!试试这6个免费的API接口平台

幂简集成

API 免费API接口 免费API 免费API接口平台

一文看懂分布式链路追踪

乘云数字DataBuff

应用性能监控 分布式链路追踪

视频标注已上线,支持视频分类、多目标检测|ModelWhale 版本更新

ModelWhale

计算机视觉

快手闪耀VALSE2024:揭秘视频生成技术,展示文生图大模型

快手技术

学术会议 学术论文

第52期|GPTSecurity周报

云起无垠

AIGC LLMs

3CX的介绍

ctsxiyou

通信 通讯 云通讯 通信通讯

基于向量检索服务与TextEmbedding实现语义搜索

DashVector

AI 向量检索 大模型 语义搜索

提升医疗服务质量的基石:全面解析医疗数据治理

郑州埃文科技

数据治理

学Python的别告诉我你还不造celery是干嘛的

我再BUG界嘎嘎乱杀

Python 编程 后端 软件开发 celery

OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!

快乐非自愿限量之名

openai GPT

为什么要迈进NGAIOps(下一代AIOps)

乘云数字DataBuff

AIOPS NGAIOps

AAAI 2024 | 基于由粗到细的视觉表征实现的高效匹配且兼顾性能的跨模态检索

快手技术

如何提升金融业务效率的同时保障身份认证安全和用户体验(一)

芯盾时代

金融 手机银行 iam 统一身份认证 银行业

构建稳健、高效与安全的企业级API网关

RestCloud

API API网关 ipaas

Dubbo 全链路监控技术实践

乘云数字DataBuff

dubbo 全链路监控

用数据,简单点!奇点云2024 StartDT Day数智科技大会,直播见

奇点云

发布会 奇点云 数据云 分析云

鸿蒙4.2小版本大亮点,鸿蒙5.0也不远了

FinFish

鸿蒙应用开发 小程序容器技术 鸿蒙Next 鸿蒙5.0 鸿蒙SDK

GitHub天花板!清华大佬纯手码的《python背记手册》火了!

我再BUG界嘎嘎乱杀

Python 后端 软件开发 入门 零基础

聚焦技术发展及开源生态 腾讯全面揭秘大数据平台演进之路_服务革新_云加社区_InfoQ精选文章