写点什么

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用

  • 2023-09-07
    北京
  • 本文字数:1166 字

    阅读完需:约 4 分钟

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用

 9 月 7 日,2023 腾讯全球数字生态大会上,腾讯发布了自己的通用大模型混元大模型,腾讯集团副总裁、云与智慧产业事业群 COO、腾讯云总裁邱跃鹏介绍了腾讯云在训练大模型过程中做的措施支持和优化。

 

据介绍,目前腾讯云已经建立起围绕大模型的全套能力,包括高性能算力集群、云原生数据湖仓和向量数据库等数据处理引擎、以及模型安全、支持模型训练和精调的工具链等,企业、开发者可以根据各自需求,灵活选择产品,降低大模型的训练成本。

 

训练大模型对算力的要求非常高,GPU 这样的高密算力在训练过程中本身稳定性也要比原来通用计算差一些。每次发生 GPU 卡故障,对整个训练中断的影响、回滚的要求和工程化的要求都非常高。

 

训练混元大模型期间,腾讯云对自身的云基础设施,从存储、网络到计算进行了全面升级。基于星海服务器,腾讯云把 GPU 的服务器故障率降低超 50%;基于星脉网络,腾讯云可以支持超过 10 万张卡并行计算的大规模训练集群。

 

在训练过程中,如果发生卡方面的故障,整个训练要被中断、做回滚,这对 checkpoint 写的速度要求非常高,传统的存储服务或者一些商业产品很难满足 checkpoint 写的要求。通过做存储升级,腾讯云可以在 60s 内完成超过 3TB 的数据写入,提高了整体的训练效率。通过存储、计算、网络整体的升级,腾讯云一轮万亿参数的训练可以在 4 天之内完成。

 

有了足够的算力做模型训练后,下一步就是做原数据的清洗。混元大模型每次更新数据都要做数据清洗。随着数据越来越多,数据清洗过程也会成为制约整个模型迭代升级的重要因素。通过腾讯云的原生数据湖仓和向量数据库,腾讯云可以每秒写入百万级数据,对于海量数据的清洗也达到了 Tbps 级吞吐能力。原数据的清洗性能提升超过了 40%,数据处理的整体运营成本也降低了 50%。据悉,MiniMax、百川等创业公司也在使用腾讯云的解决方案。

 

在完成了使用算力、清洗和处理数据之后,企业怎样能够更快、更高效地构建行业模型?为此,腾讯云打造了企业模型精调过程中的全栈式研发工具,每个企业可以基于 TI 平台,使用腾讯云的加速框架、基础算力和开源工具等。另外,腾讯的玄武实验室打造了隐私安全解决方案,让模型交互变得更加安全。

 

邱跃鹏表示,大模型进一步提升了云产品的效能。比如,腾讯云风控大模型、腾讯云 AI 代码助手、腾讯会议 AI 小助手等产品,都因为大模型能力的加持,实现了显著的效率提升和体验优化。目前,腾讯会议 AI 小助手已经正式开放试用申请,同时新推出了国内首个裸眼 3D 视频会议功能。

 

“云是大模型的最佳载体,大模型将开创下一代云服务的全新形态。”邱跃鹏说道。一方面,高性能的云上算力,成了大模型的最佳助推器;搭载大模型能力的应用,也通过云服务的方式落地。无论是训练大模型、还是使用大模型,都离不开云。另一方面,大模型将重新定义云上工具,效能显著提升,企业可以通过云,使用智能化水平更高、更便捷易用的云产品。

 

2023-09-07 16:105924

评论

发布
暂无评论
发现更多内容

软件测试 | 关系型与非关系型数据库的区别

测吧(北京)科技有限公司

测试

软件测试学习笔记丨Spring Boot 统一返回结果模版

测试人

软件测试

CDN——提升您网站的性能

极客天地

软件测试 | Pytest 测试用例调度与运行

测吧(北京)科技有限公司

测试

Linux上执行内存中的脚本和程序

不在线第一只蜗牛

Linux 运维 服务器

用 Python 实现猜拳游戏:结合分支语句、运算符和列表

测吧(北京)科技有限公司

测试

Python实现词频统计:利用列表、字符串操作和字典

测吧(北京)科技有限公司

测试

字节跳动大模型家族全员亮相,火山引擎全栈AI服务助力企业智能化转型

ToB行业头条

火山引擎 #大模型

数据驱动制造:EMQX ECP 指标监测功能增强生产透明度

EMQ映云科技

mqtt emqx EMQX ECP

GPT-4o 引领人机交互新风向,向量数据库赛道沸腾了

Zilliz

Zilliz GPT 向量数据库 GPT-4 gpt4o

软件测试 | Pytest 参数化与基本装饰器用法

测吧(北京)科技有限公司

测试

交互式数字展厅能否成为智慧城市规划的下一个风口?

点量实时云渲染

智慧城市 数字孪生 实时云渲染 3D实时云渲染 线上展厅

软件质量的守门人——接口测试

霍格沃兹测试开发学社

BOE(京东方)携全场景AI智慧显示等前沿技术亮相2024国际显示周 “科技+绿色”引领行业发展风向标

爱极客侠

深挖中建信息2023年年报,用数智化“创造价值”

脑极体

数智化

Python实现水仙花数的查找与验证

测吧(北京)科技有限公司

测试

精通Python推导式:元组、列表、字典、集合

测吧(北京)科技有限公司

测试

Python类的构造方法与字符串表示

测吧(北京)科技有限公司

测试

软件测试 | Redis:性能最快的内存数据库及其基础使用

测吧(北京)科技有限公司

测试

什么是大模型微调 (Fine-tuning)?

澳鹏Appen

人工智能 大模型 大模型微调 模型微调 大模型微调实践

数据库客户端工具的使用

测吧(北京)科技有限公司

测试

程序中的循环

测吧(北京)科技有限公司

测试

【内容推荐】一课毕业,IoTDB 从入门到精通!

Apache IoTDB

Python中的封装与访问控制权限

测吧(北京)科技有限公司

测试

软件测试 | 多表查询:外连接查询详解

测吧(北京)科技有限公司

测试

MySQL的安装与配置:从零开始搭建数据库环境

测吧(北京)科技有限公司

测试

Galxe已投资Pencils Protocol,投资者阵营正不断扩大

BlockChain先知

BOE(京东方)董事长陈炎顺获2024年“David Sarnoff产业成就奖” “屏之物联”引领产业高质发展新变革

爱极客侠

腾讯云总裁邱跃鹏:大模型将重新定义云上工具和应用_腾讯_褚杏娟_InfoQ精选文章