写点什么

腾讯汤道生:行业大模型已经过了“尝鲜期”

  • 2023-09-10
    北京
  • 本文字数:1576 字

    阅读完需:约 5 分钟

腾讯汤道生:行业大模型已经过了“尝鲜期”

9 月 7 日,在 2023 腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生发表主题演讲,重点分享了 AI 大模型等技术产品对于产业发展的深远影响,以及腾讯云行业大模型的最新思考。

 

“大语言模型的发展第一次让我们看到了 AI 在产业中大规模落地的可能。六个月前,很多企业惊叹于通用大模型的生成能力,迫不及待地尝试与业务结合。但很快发现,通用大模型在实际应用中,面临专业度、准确度、数据安全、成本等很多挑战。”汤道生说

 

汤道生提到,行业大模型已经过了“尝鲜期”,目前正深入各类业务场景,推动企业全链条智能化。“六个月前,客户来谈大模型,能想到的应用场景基本只是文字客服。但今天,应用场景已经快速扩展到各个领域,比如在金融行业,大模型已经应用在开户、业务处理、风控等多个场景。”为此,腾讯尝试用大模型打造全栈产品能力,用于业务不同环节,助力企业全链条提质增效。

 

与此同时,汤道生提到表示,在大模型产业化的落地过程中,客户关注的不仅是模型的大小、功能,而是更为关注如何选用并定制适合自身业务发展的模型产品。基于这些实际需求,腾讯云不断升级大模型精选商店,包括自研的通用大模型“混元”、20 多种主流开源模型和更多行业大模型。企业可以根据自身需求选择合适的模型产品,并进行训练和精调,以满足个性化需求。

 

企业专属模型的生成,涉及到数字资产资源管理、数据标注、训练、评估、测试和部署等很多环节。同时,根据业务发展,企业模型需要不断地调优、迭代,数据处理的整个过程,也要不断地重复。汤道生认为,模型的热潮导致各项成本攀升,拥抱大模型不能只是一时冲动,还要理性考虑落地成本,训练、推理的效率。

 

针对此,腾讯云也提供了从数据处理、多机多卡训练到硬件优化的一站式解决方案,以帮助企业高效、低成本地创建和使用大模型。同时,腾讯云 TI 平台还进行了全新升级,有效提升了大模型的训练速度和推理效率。

 

“AI 大模型等产品的发展及落地将对千行百业产生‘质’的影响,我们也将持续开放产品能力、不断探索技术应用,助力产业实现更高质量的发展。”汤道生表示。

 

据悉,为解决企业 AI 能力应用难题,腾讯云推出了 AIGC 全栈解决方案,依托于腾讯云在大模型、机器学习等方面的 AI 能力,通过升级一站式 MaaS 服务,打造 AIGC 全链路内容安全解决方案,提供从标注、训练/微调、评估、测试到部署的全流程开发业务,确保 AIGC 服务更“可信、可靠、可用”。

 

在算力方面,腾讯云的新一代高性能计算集群 HCC,从“计算、存储、网络”三大技术层面出发,为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。通过搭载最新代次计算卡,利用星海自研服务器的 6U 超高密度设计和并行计算理念,确保高性能计算;依托高性能存储 CFS Turbo 和对象存储 COS,实现高吞吐存储;通过自研 3.2T RDMA 星脉网络,保障高性能无损网络;并构建了集群可观测体系,实现对 GPU 和网络进行实时监控和故障自动恢复,保证高稳定性。

 

此外,腾讯云还通过 GPU & CPU 混布、GPU 离在线混布、本地盘与分布式缓存混布的混合部署方式,系统性地提升了资源利用率。腾讯云新一代高性能计算集群 HCC,打造了 AIGC 落地各行各业的算力基础,让 AIGC 服务更可靠。

 

在合规性方面,腾讯云能够对数据集进行预处理,为企业提供自动化审核服务、定制识别服务等审核解决方案,再通过 AIGC 大模型进行训练和微调,构建起完善的内容审核平台,实现智能化拦截敏感内容,保障了端到端的合规,有效解决了 AIGC 落地的内容合规层面问题,让 AIGC 服务更可信。

 

在训练与推理效率方面,腾讯云通过数据集下载加速、训练及模型数据读取加速、Checkpoint 写加速、分布式训练加速、推理加速的全链路加速能力,系统性地解决了训练与推理效率问题,以效率提升带动成本下降,例如数据集下载层面,腾讯云的半托管 MSP 工具和对象存储 COS 提供了跨地域复制能力,能够轻松实现低成本将海外数据集传输至国内。

 

2023-09-10 10:583481

评论

发布
暂无评论
发现更多内容

深入理解Metrics(四):Meters

冰心的小屋

Java metrics meters

用户+案例+认证+框架一键搞定,不愧是阿里最新Spring Security全栈笔记!

Java永远的神

Java 程序员 springsecurity java面试 安全框架

华为首发微存储新品,破解互联网海量数据高效存储难题

科技热闻

BI智慧工程行业应用方案丨文末获取三重资源包

葡萄城技术团队

生于云,长于云,华为云推动开发者数字化创新

科技热闻

【C语言】double 关键字

謓泽

11月月更

【LeetCode】最长同值路径Java题解

Albert

算法 LeetCode 11月月更

Linux—watch命令详解– 周期性执行命令

A-刘晨阳

Linux 运维 11月月更 周期性监控

【解决方案】国产逆袭?基于国产 MCU 的网红筋膜枪方案分析

元器件秋姐

国产芯片 BLDC方案 BLDC应用 电机控制 元器件电商

Linux—nmap、nc命令 –网络探测工具和安全和端口扫描器

A-刘晨阳

Linux 运维 网络 11月月更

Nacos 多语言体系再添新员:首个 Rust 语言版本正式发布!

阿里巴巴云原生

阿里云 云原生 nacos

断连?消息丟失?不用愁!教你快速在物联网平台上排查问题——设备管理运维类

阿里云AIoT

阿里云 物联网平台 设备上云

一个 fault injection 测试的三次演化

QE_LAB

硬件 测试环境

啃透这份“高并发编程核心笔记”,跳槽阿里直接涨10K

小小怪下士

Java 编程 程序员 高并发 阿里

相约2023,高通公司宣布参加第六届进博会

科技热闻

前端leetcde算法面试套路之二叉树

js2030code

JavaScript LeetCode

Wallys//Qualcomm ipq4018/IPQ4028 Access Point /high power/Wireless Dual band 11AC Wave2 /Indoor industrial wifi5 router

wallysmeng

IPQ4018 IPQ4028

14位资深大咖,11 场技术演讲!龙蜥云原生专场精彩回顾来了

OpenAnolis小助手

开源 技术分享 龙蜥社区 2022云栖大会 云原生专场

深入理解Metrics(三):Histograms

冰心的小屋

Java metrics Histograms

前端leetcde算法面试套路之堆

js2030code

JavaScript LeetCode

英特尔CEO出席2022世界互联网大会:五大超级技术力量释放数字时代全新可能

科技之家

中软国际发力智联网自主创新 数智赋能千行百业

中软国际AIoT开发者社区

华为开发者大会2022 智联网

浅谈Kotlin编程01.初识Kotlin和入门示例

南巷羽

android kotin 11月月更

如何开发一个标准的云原生应用?

阿里巴巴云原生

阿里云 微服务 云原生

网站收录量与索引量有什么区别?

源字节1号

软件开发 小程序开发

直播预告|AutoML Meetup V1 第四范式 & 百度 & AWS ,共探自动机器学习最佳实践

星策开源社区

人工智能 机器学习 百度 AWS 自动机器学习

Linux下安装Python3.6.8(超级详细)

A-刘晨阳

Linux 运维 Python3 11月月更 pip3

完美避开,99%的PCB工程师都踩过的坑!

华秋PCB

工具 PCB PCB设计

slurm集群调度策略详解(1)-主调度

慕冰

Slurm 调度系统 主调度

一站式工业边缘数据采集处理与设备反控实践

EMQ映云科技

物联网 IoT neuron 11月月更 eKuiper

python的基本操作

乔乔

11月月更

腾讯汤道生:行业大模型已经过了“尝鲜期”_AI&大模型_褚杏娟_InfoQ精选文章