写点什么

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用

  • 2023-09-07
    北京
  • 本文字数:1166 字

    阅读完需:约 4 分钟

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用

 9 月 7 日,2023 腾讯全球数字生态大会上,腾讯发布了自己的通用大模型混元大模型,腾讯集团副总裁、云与智慧产业事业群 COO、腾讯云总裁邱跃鹏介绍了腾讯云在训练大模型过程中做的措施支持和优化。

 

据介绍,目前腾讯云已经建立起围绕大模型的全套能力,包括高性能算力集群、云原生数据湖仓和向量数据库等数据处理引擎、以及模型安全、支持模型训练和精调的工具链等,企业、开发者可以根据各自需求,灵活选择产品,降低大模型的训练成本。

 

训练大模型对算力的要求非常高,GPU 这样的高密算力在训练过程中本身稳定性也要比原来通用计算差一些。每次发生 GPU 卡故障,对整个训练中断的影响、回滚的要求和工程化的要求都非常高。

 

训练混元大模型期间,腾讯云对自身的云基础设施,从存储、网络到计算进行了全面升级。基于星海服务器,腾讯云把 GPU 的服务器故障率降低超 50%;基于星脉网络,腾讯云可以支持超过 10 万张卡并行计算的大规模训练集群。

 

在训练过程中,如果发生卡方面的故障,整个训练要被中断、做回滚,这对 checkpoint 写的速度要求非常高,传统的存储服务或者一些商业产品很难满足 checkpoint 写的要求。通过做存储升级,腾讯云可以在 60s 内完成超过 3TB 的数据写入,提高了整体的训练效率。通过存储、计算、网络整体的升级,腾讯云一轮万亿参数的训练可以在 4 天之内完成。

 

有了足够的算力做模型训练后,下一步就是做原数据的清洗。混元大模型每次更新数据都要做数据清洗。随着数据越来越多,数据清洗过程也会成为制约整个模型迭代升级的重要因素。通过腾讯云的原生数据湖仓和向量数据库,腾讯云可以每秒写入百万级数据,对于海量数据的清洗也达到了 Tbps 级吞吐能力。原数据的清洗性能提升超过了 40%,数据处理的整体运营成本也降低了 50%。据悉,MiniMax、百川等创业公司也在使用腾讯云的解决方案。

 

在完成了使用算力、清洗和处理数据之后,企业怎样能够更快、更高效地构建行业模型?为此,腾讯云打造了企业模型精调过程中的全栈式研发工具,每个企业可以基于 TI 平台,使用腾讯云的加速框架、基础算力和开源工具等。另外,腾讯的玄武实验室打造了隐私安全解决方案,让模型交互变得更加安全。

 

邱跃鹏表示,大模型进一步提升了云产品的效能。比如,腾讯云风控大模型、腾讯云 AI 代码助手、腾讯会议 AI 小助手等产品,都因为大模型能力的加持,实现了显著的效率提升和体验优化。目前,腾讯会议 AI 小助手已经正式开放试用申请,同时新推出了国内首个裸眼 3D 视频会议功能。

 

“云是大模型的最佳载体,大模型将开创下一代云服务的全新形态。”邱跃鹏说道。一方面,高性能的云上算力,成了大模型的最佳助推器;搭载大模型能力的应用,也通过云服务的方式落地。无论是训练大模型、还是使用大模型,都离不开云。另一方面,大模型将重新定义云上工具,效能显著提升,企业可以通过云,使用智能化水平更高、更便捷易用的云产品。

 

2023-09-07 16:105235

评论

发布
暂无评论
发现更多内容

云服务应用就在828,精准优化企业管理,华为云Flexus X实例有你好看!

YG科技

Java Agent 开发初探

FunTester

智源研究院举办第一期数据与行业应用Workshop

智源研究院

浅谈swap去中心化交易所系统开发搭建技术方案

V\TG【ch3nguang】

去中心化交易所

关于聚合卡牌盲盒模式系统开发逻辑方案设计程序(成熟代码)

V\TG【ch3nguang】

检索增强生成 (RAG),AI届的新星“厨师”

澳鹏Appen

rag 检索增强生成

百度冯景辉:从数据清洗到安全围栏,深度解析大模型原生安全构建

百度安全

云计算优化震撼828,华为云Flexus X实例邀请您分享数字化转型红利

YG科技

1688商品详情API返回值中的供应商信息

技术冰糖葫芦

API Explorer API 接口 API 测试 API】

现货量化合约跟单丨量化合约现货跟单系统开发策略详细/源码案例

V\TG【ch3nguang】

量化合约现货跟单

企业跨国组网如何搭建?试试SD-WAN!

Ogcloud

SD-WAN 企业组网 SD-WAN组网 跨国组网

【AI 生图赢奖】用函数计算绘出「少年江湖」,与热播网剧梦幻联动

阿里巴巴云原生

阿里云 云原生 通义灵码

大数据时代来袭,那么工程领域的数据科学如何成为行业的新超级英雄呢

Altair RapidMiner

人工智能 设计 仿真 altair

水底下的云

脑极体

云计算

精选:适合小团队的8款协作工具推荐

爱吃小舅的鱼

团队协作 团队协作工具

如何将文本转换为向量?(方法三)

DashVector

数据库 向量检索 大模型

2024巴黎奥运会:中国战绩报告分析

搞大屏的小北

数据分析 巴黎奥运会 中国队 金牌 奖牌

程序员喜欢的7个免费公共API

幂简集成

API 免费API

人工智能 | 打造领域专属的大语言模型

测吧(北京)科技有限公司

测试

数据工程(四)数据架构设计:连接数据与战略,驱动业务增长

数造万象

数据架构 数字化 数据工程

数据资产入表:解锁企业价值新蓝海

郑州埃文科技

数据治理 数据要素 数据资产入表

五大联赛在即,能否用贝叶斯来预测足球比赛

Geek_a17c4b

AI 数据集 足球 贝叶斯算法

静态IP和动态IP哪个好?怎么选择?

Ogcloud

IP 静态IP 动态IP 海外原生IP 海外IP

蜗牛游戏宣布2024年第二季度财报业绩

财见

斥巨资给自己买了个礼物,程序员专用显示器真香

王中阳Go

显示器 #程序员

如何将文本转换为向量?(方法二)

DashVector

人工智能 数据库 大模型 向量检索服务

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用_腾讯_褚杏娟_InfoQ精选文章