写点什么

华为盘古大模型 3.0 发布:不开源,现阶段谈投入和收益为时尚早

  • 2023-07-10
    北京
  • 本文字数:1278 字

    阅读完需:约 4 分钟

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早

2023 年 7 日-9 日,华为开发者大会2023(Cloud)期间,华为发布盘古大模型 3.0。华为盘古大模型最早在2021年发布,发展到今天,盘古大模型已经在金融、制造、医药研发、煤矿、铁路等诸多行业发挥作用。


华为云 CTO 张宇昕在接受 InfoQ 采访时表示,华为盘古大模型全栈技术均由华为自主创新,从算力到基础的算子、基础的框架到盘古的开发平台以及模型均没有采用任何开源技术。另外,由于华为云盘古大模型的定位是“AI  for  Industries”,这些行业大模型里沉淀了客户的知识经验,所以华为不会、也不可能把客户的资产开放出来,也就是说盘古大模型不会开源,而是走商业闭源的道路。


据华为常务董事、华为云 CEO 张平安介绍,盘古大模型 3.0 是面向行业的大模型系列,包括“5+N+X”三层架构:L0 层是 5 个基础大模型,包括自然语言、视觉、多模态、预测、科学计算,提供满足行业场景中的多种技能需求。


盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。


L1 层是 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。


L2 层是为客户提供 X 个细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。


盘古大模型采用完全的分层解耦设计,一方面是为了快速适配、快速满足行业的多变需求,背后更是华为希望借此构筑出良好的商业模式的考虑。


在解耦的三层设计之上,客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,可以单独升级能力集。在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。


张平安强调,盘古大模型的路标图价值将更注重于行业应用的深化和扩展。团队已经在铁路、煤矿、金融和政府等行业开展了大模型的应用,并且还有许多行业需要大模型的支持。未来,团队将加快行业大模型的开发速度,并且在行业垂直领域深化应用。


算力是训练大模型的基础。本次大会上,张平安还宣布单集群 2000P Flops 算力的昇腾AI云服务在华为云的乌兰察布和贵安 AI 算力中心同时上线。昇腾 AI 云服务除了支持华为全场景 AI 框架昇思 MindSpore 外,还支持 Pytorch、Tensorflow 等主流 AI 框架。


毫无疑问,大模型的投入是巨大的。不过张平安亦坦言,现阶段讨论盘古大模型的成本与收益还为时尚早,华为在贵阳和乌兰察布投入了大量昇腾 AI 算力,并相信把昇腾 AI 算力做好之后,中国的许多行业以及重塑将会采用盘古大模型。

2023-07-10 07:008096
用户头像
罗燕珊 AI practitioner | Tech media

发布了 543 篇内容, 共 412.2 次阅读, 收获喜欢 853 次。

关注

评论

发布
暂无评论
发现更多内容

如果单表数据量大,只能考虑分库分表吗?

伤感汤姆布利柏

Apache DolphinScheduler社区答疑Star第一期评选结果公示

白鲸开源

开源 Apache DolphinScheduler

“新E代弯道王”MAZDA EZ-6鹭羽白内饰焕新

科技热闻

MySQL 的四种社交障碍等级

秃头小帅oi

C语言 AI 通义灵码 VSCode插件安装与功能详解

阿里云云效

C语言

添加DNS解析记录时,提示A和CNAME记录冲突是怎么回事?

国科云

卤制品加工MES及生产管理智能化解决方案

万界星空科技

mes 食品MES 食品行业 卤制品行业 食品加工行业

中烟创新入选2025全国企业“人工智能+”行动创新案例TOP100

中烟创新

BeeWorks:高效协作的局域网聊天工具

BeeWorks

即时通讯 IM 私有化部署 企业级应用

如何使用AI辅助开发R语言

阿里云云效

IDM 下载器使用教程,idm破解版永久激活码,idm中文汉化补丁工具

阿拉灯神丁

网络加速 下载器 IDM idm下载

数造科技连续入选中国信通院「铸基计划」,领航产业数字化新标杆!

数造万象

AI 数据分析 数据治理 Data 大模型

多家企业领先实践证明:成功的软件国产替代不是个例!

用友BIP

AI 智能体 用友BIP 软件国产替代

如何使用AI辅助开发R语言

阿里巴巴云原生

R语言

C# 使用通义灵码 - AI 助力 Visual Studio 开发

阿里巴巴云原生

C#

如何使用通义灵码完成PHP单元测试 - AI辅助开发教程

阿里云云效

php

C语言 AI 通义灵码 VSCode插件安装与功能详解

阿里巴巴云原生

C语言

从 DB-Engines 排名攀升看 TiDB 全球突破之路

PingCAP

人工智能 数据库 TiDB

供应链复杂、工厂分散,半导体行业如何安全访问总部ERP系统?

贝锐

内网穿透 ERP

深入研究:京东商品列表API详解

tbapi

京东API接口 京东商品数据采集 京东商品列表API接口

一键解锁智能体50+场景,HR SaaS就选用友BIP企业AI全栈云

用友BIP

智能体 HR SaaS 用友BIP 企业AI 全栈云

AI之下的KA经营协同:智能抓单 智能处理 高效协同 智能分析

用友BIP

AI 智能体 用友BIP KA经营协同

从测试到芯片全链条覆盖,慕尼黑上海电子展解码储能技术盛宴

极客天地

如何使用通义灵码完成PHP单元测试 - AI辅助开发教程

阿里巴巴云原生

php

中昊芯英亮相第十三届中国电子信息博览会,斩获创新金奖第二名

科技热闻

微服务拆分的原则、时机、方法以及常见问题

秃头小帅oi

C# 使用通义灵码 - AI 助力 Visual Studio 开发

阿里云云效

高清视频会议系统BeeWorks Meet,支持私有化部署

BeeWorks

即时通讯 IM 私有化部署 局域网视频软件

MySQL备份文件导入GreatSQL MGR环境为什么出现大量报错?

GreatSQL

相约2025慕尼黑上海电子展,展望可穿戴设备未来发展!

极客天地

C# LINQ 快速入门实战指南,建议收藏学习!

电子尖叫食人鱼

C#

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早_华为_罗燕珊_InfoQ精选文章