【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

  • 2023-07-03
    北京
  • 本文字数:1830 字

    阅读完需:约 6 分钟

“火山方舟”MaaS平台亮相:集成七款大模型,抖音等业务团队已试用

6 月 28 日,火山引擎发布了大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即 Model-as-a-Service)。据悉,目前“火山方舟”集成了百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI(以拼音首字母排序)等多家 AI 科技公司及科研院所的大模型,并已启动邀测。



对于中国的大模型发展,火山引擎有下面几个关键判断:

 

第一,未来的大模型市场将是一个百花齐放的多模型生态。由于安全信任、行业壁垒和成本等因素,这个生态将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型。同时,开放的市场竞争和模型多样性又会进一步促进整个技术发展。

 

第二,企业,尤其是行业头部企业,自身对于大模型的应用,将是“1 + N”的应用模式,即:企业通过自研或者与三方模型服务商的深度合作,形成企业自身的一个主力模型;在这个主力模型之外的不同场景中,企业还会同时应用 N 个外部模型。

 

基于以上判断,火山引擎定位于为模型生产端和模型应用端提供底层能力和产品方案,解决计算、安全、成本等通用问题。据悉,火山方舟由以下几个核心部分构成:

 

第一个是模型广场,许多模型提供商会提供不同版本/不同尺寸的模型。企业可以直接与这些模型交互。在火山引擎上可以直接调用推理 API,接入生产环境。适合进行快速分析和 AB 实验。

 

第二个是模型评估。企业要把大模型用好,首先得想好自己的业务需求,并为之设计一套可量化的评估指标,并在不断对比/评估/试验的过程中,积累评估数据、快速迭代。要给多样化的业务场景和业务入口,挑选不同的、最合适的模型。

 

第三个是模型精调。对于要求较高的垂直场景,用户可能需要利用自有数据和领域非公开数据,进行持续训练,并且建设和积累自己的精调数据集。 对精调的良好运用也有益于对更小尺寸模型的利用, 在特定工作上达到逼近通用大模型的水平,由此降低推理成本。火山方舟可以对一个模型或多个基座模型同时发起训练任务,同时实时跟踪模型精调的效果指标和运行情况。

 

第四个是安全和信任机制。据悉,火山大模型服务平台提供了基于安全沙箱、硬件加密和联邦学习的多套大模型安全与信任解决方案。吴迪表示,“火山方舟”还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案。

 

随着平台不断迭代, 企业对大模型的资源供应将更为弹性/动态和廉价。火山引擎通过流量错峰、训推一体等手段,将进一步降低推理的单位成本。吴迪表示,这也是在大模型时代,上云所带来的重要优势。除此之外, 火山引擎将和大模型提供商联合进行深度的性能优化,包括火山引擎知名的 veLego 优化框架,还包括火山引擎将不断和大模型提供商分享/共创的诸多量化/batching/调度等优化技术。

 

火山引擎总裁谭待认为,除了算法、数据和算力外,企业做大模型还需要考虑以下问题:

 

  • 安全与信任。这里的安全和信任是一种双向信任。大模型服务商除了考虑模型方案和代码不被泄露,也需要考虑到各个应用企业的安全问题,保障企业在调用大模型时自己的 prompt 或精调数据不会被泄露。

  • 性价比。之前大家处于模型研发的早期,更多考虑的是模型预训练阶段的成本问题,但后期模型的推理计算才是成本更高的环节。只有推理成本做到足够低,才能让大模型真正被广泛使用。

  • 生态系统。生成式模型并不知道自己擅长什么、不擅长什么,需要我们告诉他们自己的优劣势,并且在他们不擅长的地方为其提供下游的模型、API 和插件,帮助他们更好地解决问题,帮助大模型“长出手和脚”。

 

火山引擎智能算法负责人吴迪表示,与其他很多云厂商单纯提供算力、基础底座不同,火山方舟平台一方面会在资源和优化方面跟模型提供商进行非常深度的合作,长期致力于降低推理成本,另一方面,火山算法团队会和客户做重点的应用共建和应用落地,催化整个大模型、大算力在千行百业的落地速度。

 

据悉,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索,利用大模型能力促进降本增效。这些内部实践也在快速打磨“火山方舟”,推动平台能力的进一步完善。“火山方舟”的首批邀测企业还包括金融、汽车、消费等众多行业的客户。

 

谭待坦言,“火山方舟”还在起步阶段,工具链和下游应用插件需要持续完善,平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-07-03 16:182841

评论

发布
暂无评论
发现更多内容

免备案高防服务器租用优势全解析:高效、便捷、安全

一只扑棱蛾子

高防服务器

探索比特币符文热:市场趋势与持续性分析

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

数新大数据平台迁移解决方案

数新网络官方账号

大数据 数据迁移

Docker从入门到精通:Docker容器相关命令学习

霍格沃兹测试开发学社

Apache IoTDB v1.3.1 发布|增加多种脚本工具、内置函数等功能

Apache IoTDB

Docker从入门到精通:Docker pull命令学习

霍格沃兹测试开发学社

Docker从入门到精通:Docker run 命令学习

霍格沃兹测试开发学社

高频智能AI量化:现货交易软件的革新之路

西安链酷科技

量化交易软件

阿里巴巴1688.item_get API接口助力精准获取商品ID

技术冰糖葫芦

api 货币化 API 接口 API 文档 pinduoduo API

企业海外网络解决方案分析与比较

Ogcloud

SD-WAN 组网 企业组网 SD-WAN组网 SD-WAN服务商

公链系统开发全指南: 从规划到实施

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

比特币之路:技术突破、创新思维与领军人物

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

开曼群岛:Web3企业的乐园

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 公链开发

国内做TikTok直播,海外直播专线搭建是关键

Ogcloud

海外直播 tiktok直播 tiktok直播专线 海外直播网络 tiktok直播网络

Vision pro、人形机器人、Hala Point

声网

Web3 游戏周报(4.14-4.20)

Footprint Analytics

gamefi

全量与增量的配置模式

RestCloud

数据同步 ETL 全量 增量

地方发

群星

测试 单元测试

芯盾时代IDaaS:IAM能上云,身份安全更简单

芯盾时代

网络安全 身份安全 云服务 iam 统一身份认证

当AI文曲星,照耀学海

脑极体

AI

第48期|GPTSecurity周报

云起无垠

Docker从入门到精通:Docker exec 命令学习

霍格沃兹测试开发学社

谷歌SEO算法更新发展史:谷歌SEO优化排名背后的密码

九凌网络

EPAI大模型开发平台,百模万企走出 “应用迷宫”

脑极体

AI

碳课堂|什么是碳市场?如何进行碳交易?

AMT企源

碳交易 碳管理 碳市场

聚道云软件连接器助力医疗器械有限公司打通金蝶云星辰与飞书

聚道云软件连接器

案例分享

BRC铭文NFT铸造质押挖矿系统开发运营

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

利用观测云打造企业级的统一日志中心

观测云

日志分析

从 Apache Doris 到 SelectDB Cloud:云原生架构下的弹性能力揭秘

SelectDB

数据库 云计算 数据分析 云原生 弹性计算

搭建开发体育赛事直播平台:吸引用户并保持其粘性核心功能介绍

软件开发-梦幻运营部

Docker从入门到精通:Docker log 命令学习

霍格沃兹测试开发学社

“火山方舟”MaaS平台亮相:集成七款大模型,抖音等业务团队已试用_生成式 AI_褚杏娟_InfoQ精选文章