NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

华为盘古大模型 3.0 发布:不开源,现阶段谈投入和收益为时尚早

  • 2023-07-10
    北京
  • 本文字数:1278 字

    阅读完需:约 4 分钟

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早

2023 年 7 日-9 日,华为开发者大会2023(Cloud)期间,华为发布盘古大模型 3.0。华为盘古大模型最早在2021年发布,发展到今天,盘古大模型已经在金融、制造、医药研发、煤矿、铁路等诸多行业发挥作用。


华为云 CTO 张宇昕在接受 InfoQ 采访时表示,华为盘古大模型全栈技术均由华为自主创新,从算力到基础的算子、基础的框架到盘古的开发平台以及模型均没有采用任何开源技术。另外,由于华为云盘古大模型的定位是“AI  for  Industries”,这些行业大模型里沉淀了客户的知识经验,所以华为不会、也不可能把客户的资产开放出来,也就是说盘古大模型不会开源,而是走商业闭源的道路。


据华为常务董事、华为云 CEO 张平安介绍,盘古大模型 3.0 是面向行业的大模型系列,包括“5+N+X”三层架构:L0 层是 5 个基础大模型,包括自然语言、视觉、多模态、预测、科学计算,提供满足行业场景中的多种技能需求。


盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。


L1 层是 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。


L2 层是为客户提供 X 个细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。


盘古大模型采用完全的分层解耦设计,一方面是为了快速适配、快速满足行业的多变需求,背后更是华为希望借此构筑出良好的商业模式的考虑。


在解耦的三层设计之上,客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,可以单独升级能力集。在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。


张平安强调,盘古大模型的路标图价值将更注重于行业应用的深化和扩展。团队已经在铁路、煤矿、金融和政府等行业开展了大模型的应用,并且还有许多行业需要大模型的支持。未来,团队将加快行业大模型的开发速度,并且在行业垂直领域深化应用。


算力是训练大模型的基础。本次大会上,张平安还宣布单集群 2000P Flops 算力的昇腾AI云服务在华为云的乌兰察布和贵安 AI 算力中心同时上线。昇腾 AI 云服务除了支持华为全场景 AI 框架昇思 MindSpore 外,还支持 Pytorch、Tensorflow 等主流 AI 框架。


毫无疑问,大模型的投入是巨大的。不过张平安亦坦言,现阶段讨论盘古大模型的成本与收益还为时尚早,华为在贵阳和乌兰察布投入了大量昇腾 AI 算力,并相信把昇腾 AI 算力做好之后,中国的许多行业以及重塑将会采用盘古大模型。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-07-10 07:006226
用户头像
罗燕珊 InfoQ中文站编辑

发布了 424 篇内容, 共 246.9 次阅读, 收获喜欢 759 次。

关注

评论

发布
暂无评论
发现更多内容

云原生最佳实践系列 7:基于 OSS Object FC 实现非结构化文件实时处理

阿里巴巴云原生

阿里云 云原生

如何在Java中读取超过内存大小的文件

快乐非自愿限量之名

Java

Baseswap交易所的得力助手:Base链市值机器人

开发丨飞机丨 @aivenli

大型省级运营商:业务运营中,如何响应速度并有效提高准确性?

嘉为蓝鲸

ITSM 运营商 IT 运维

【香山源码阅读】香山BPU代码阅读

源芯

开源 芯片 risc-v 高性能处理器香山

AIGC重塑金融:AI大模型驱动的金融变革与实践

EquatorCoco

人工智能 金融 AIGC

Flutter iOS上架指南

雪奈椰子

探索DeFi元宇宙:NFT、Web3和DAPP的数藏Swap合约应用开发

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链钱包开发

三思多功能智慧综合杆助推上海杨浦区数智化升级

电子信息发烧客

小redbook.item_get_video API是小红书平台提供的一种数据接口服务,其主要功能是为电商企业提供商品数据,以便进行商品分析、个性化推荐等。通过该API可以带来哪些价值

技术冰糖葫芦

API 接口

Swap交易所系统开发流程与区块链交易所系统规划方案

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

走向国际:区块链行业项目海外市场宣传与运营攻略

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

DR9274-6GK|4T4RQCN6224 QCN9274 QCN6274 WiFi7 Lower Power Consumption Network Card

wallyslilly

QCN6224

JMeter前置处理器-Beanshell前置处理器详解

霍格沃兹测试开发学社

引入了 Shiro 的项目请求路径中带有中文报错400 的问题

emanjusaka

Java shiro Error 400

新一代营销费用管理:覆盖线上线下营销渠道各链路多场景费用

赛博威科技

探索DAPP生态:代币预售、系统开发、NFT质押分红和代币质押技术

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

高防服务器干什么的?用途及其重要性解析

一只扑棱蛾子

高防服务器

春天集结!Milvus 老友汇 · 线下 Meetup 来啦!

Zilliz

开源社区 Meetup Milvus Zilliz

如何搭建自动化测试平台

RestCloud

自动化测试平台 ipaas

网络钓鱼升级 Darcula如何窃取用户信息

郑州埃文科技

网络安全

嘉为蓝鲸WeOpsV4.10上线,聚焦监控管理模块优化

嘉为蓝鲸

监控 日志管理 IT 运维 IT资产管理

Python 代码混淆工具概述

京东一面挂在了CAS算法的三大问题上,痛定思痛不做同一个知识点的小丑

不在线第一只蜗牛

Java 算法 JVM CAS

分享 5 个提高技术领导力的技巧

高端章鱼哥

云原生最佳实践系列 6:MSE 云原生网关使用 JWT 进行认证鉴权

阿里巴巴云原生

阿里云 微服务 云原生 网关

享道出行:容器弹性技术驱动下的智慧出行稳定性实践

阿里巴巴云原生

阿里云 云原生 容器弹性

Android Studio安装超详细步骤

霍格沃兹测试开发学社

掌握ADB:详解操作命令及完整用法指南(二)

霍格沃兹测试开发学社

Git常用命令大全:让你轻松驾驭版本控制

霍格沃兹测试开发学社

表单与二维码:如何使用表单中的填表人组件?

草料二维码

二维码 草料二维码

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早_华为_罗燕珊_InfoQ精选文章