阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

  • 2023-07-03
    北京
  • 本文字数:1830 字

    阅读完需:约 6 分钟

“火山方舟”MaaS平台亮相:集成七款大模型,抖音等业务团队已试用

6 月 28 日,火山引擎发布了大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即 Model-as-a-Service)。据悉,目前“火山方舟”集成了百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI(以拼音首字母排序)等多家 AI 科技公司及科研院所的大模型,并已启动邀测。



对于中国的大模型发展,火山引擎有下面几个关键判断:

 

第一,未来的大模型市场将是一个百花齐放的多模型生态。由于安全信任、行业壁垒和成本等因素,这个生态将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型。同时,开放的市场竞争和模型多样性又会进一步促进整个技术发展。

 

第二,企业,尤其是行业头部企业,自身对于大模型的应用,将是“1 + N”的应用模式,即:企业通过自研或者与三方模型服务商的深度合作,形成企业自身的一个主力模型;在这个主力模型之外的不同场景中,企业还会同时应用 N 个外部模型。

 

基于以上判断,火山引擎定位于为模型生产端和模型应用端提供底层能力和产品方案,解决计算、安全、成本等通用问题。据悉,火山方舟由以下几个核心部分构成:

 

第一个是模型广场,许多模型提供商会提供不同版本/不同尺寸的模型。企业可以直接与这些模型交互。在火山引擎上可以直接调用推理 API,接入生产环境。适合进行快速分析和 AB 实验。

 

第二个是模型评估。企业要把大模型用好,首先得想好自己的业务需求,并为之设计一套可量化的评估指标,并在不断对比/评估/试验的过程中,积累评估数据、快速迭代。要给多样化的业务场景和业务入口,挑选不同的、最合适的模型。

 

第三个是模型精调。对于要求较高的垂直场景,用户可能需要利用自有数据和领域非公开数据,进行持续训练,并且建设和积累自己的精调数据集。 对精调的良好运用也有益于对更小尺寸模型的利用, 在特定工作上达到逼近通用大模型的水平,由此降低推理成本。火山方舟可以对一个模型或多个基座模型同时发起训练任务,同时实时跟踪模型精调的效果指标和运行情况。

 

第四个是安全和信任机制。据悉,火山大模型服务平台提供了基于安全沙箱、硬件加密和联邦学习的多套大模型安全与信任解决方案。吴迪表示,“火山方舟”还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案。

 

随着平台不断迭代, 企业对大模型的资源供应将更为弹性/动态和廉价。火山引擎通过流量错峰、训推一体等手段,将进一步降低推理的单位成本。吴迪表示,这也是在大模型时代,上云所带来的重要优势。除此之外, 火山引擎将和大模型提供商联合进行深度的性能优化,包括火山引擎知名的 veLego 优化框架,还包括火山引擎将不断和大模型提供商分享/共创的诸多量化/batching/调度等优化技术。

 

火山引擎总裁谭待认为,除了算法、数据和算力外,企业做大模型还需要考虑以下问题:

 

  • 安全与信任。这里的安全和信任是一种双向信任。大模型服务商除了考虑模型方案和代码不被泄露,也需要考虑到各个应用企业的安全问题,保障企业在调用大模型时自己的 prompt 或精调数据不会被泄露。

  • 性价比。之前大家处于模型研发的早期,更多考虑的是模型预训练阶段的成本问题,但后期模型的推理计算才是成本更高的环节。只有推理成本做到足够低,才能让大模型真正被广泛使用。

  • 生态系统。生成式模型并不知道自己擅长什么、不擅长什么,需要我们告诉他们自己的优劣势,并且在他们不擅长的地方为其提供下游的模型、API 和插件,帮助他们更好地解决问题,帮助大模型“长出手和脚”。

 

火山引擎智能算法负责人吴迪表示,与其他很多云厂商单纯提供算力、基础底座不同,火山方舟平台一方面会在资源和优化方面跟模型提供商进行非常深度的合作,长期致力于降低推理成本,另一方面,火山算法团队会和客户做重点的应用共建和应用落地,催化整个大模型、大算力在千行百业的落地速度。

 

据悉,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索,利用大模型能力促进降本增效。这些内部实践也在快速打磨“火山方舟”,推动平台能力的进一步完善。“火山方舟”的首批邀测企业还包括金融、汽车、消费等众多行业的客户。

 

谭待坦言,“火山方舟”还在起步阶段,工具链和下游应用插件需要持续完善,平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-07-03 16:182737

评论

发布
暂无评论
发现更多内容

我服了!SpringBoot升级后这服务我一个星期都没跑起来!(上)

艾小仙

Java spring 程序员 springboot spring-boot

易仓科技×OceanBase:打造跨境行业全生态链的新零售SaaS

OceanBase 数据库

Linux su命令 – 切换用户、用户提权

A-刘晨阳

Linux 运维 sudo 11月月更 用户提权

客如云×OceanBase:分布式云升级助力客如云降本增效

OceanBase 数据库

随想 小城市的程序员该如何生存

百里丶落云

生活状态 生活杂谈 11月月更

Flowable 设置流程变量的四种方式

江南一点雨

springboot flowable

C 语言字符串常用库函数

Maybe_fl

【愚公系列】2022年11月 微信小程序-app.json配置属性之pages

愚公搬代码

11月月更

OceanBase 社区版4.0发版:一个全新的里程碑

OceanBase 数据库

低代码选型应该注重哪些方面的能力?

优秀

低代码

开发问题记录

青柚1943

Linux中的日志管理

A-刘晨阳

Linux 运维 日志 log 11月月更

【C语言】default 关键字

謓泽

11月月更

深入理解Metrics(二):Counters

冰心的小屋

Java metrics Counters

筑牢数字基础设施:华为笔下的中国诗意

脑极体

人工智能「

GPU 和显卡是什么关系?

Finovy Cloud

人工智能 gpu 云渲染 GPU渲染

Vue基础学习(二)

Studying_swz

Vue 11月月更

Flowable 已经执行完毕的流程去哪找?

江南一点雨

spring springboot workflow flowable

web服务器

初学者

网络 web服务器 11月月更

Vue基础学习(一)

Studying_swz

Vue 11月月更

JavaScript学习(二)

Studying_swz

JavaScript 11月月更

峰会实录 | StarRocks存储引擎近期进展与实时分析实践

StarRocks

数据库·

对话ACE第六期:数据库上云的趋势和挑战

OceanBase 数据库

【LeetCode】第 k 个数 Java 题解

Albert

算法 LeetCode 11月月更

Linux文件系统ln-软连接、硬链接

A-刘晨阳

Linux 运维 11月月更 软硬连接

抓包分析 TCP 握手和挥手

C++后台开发

网络协议 TCP/IP 后端开发 C++开发 抓包分析

python中私有成员和公有成员

乔乔

11月月更

新能源物流车行业如何服务升级 地上铁联合火山引擎VeDI“破题”

字节跳动数据平台

大数据 数据应用

CSS学习笔记(二)

lxmoe

CSS 前端 学习笔记 11月月更

安全!稳定!可信!选OceanBase就对了

OceanBase 数据库

OceanBase CTO杨传辉:单机分布式一体化助力企业降本增效

OceanBase 数据库

“火山方舟”MaaS平台亮相:集成七款大模型,抖音等业务团队已试用_生成式 AI_褚杏娟_InfoQ精选文章