【ArchSummit 】国内外100+顶尖专家齐聚 ,AI、云原生、数智化全面囊括! 了解详情
写点什么

老便宜了!字节跳动豆包大模型开始营业,一元钱能买 125 万 Tokens,月活用户量达 2600 万

  • 2024-05-15
    北京
  • 本文字数:2425 字

    阅读完需:约 8 分钟

大小:1.21M时长:07:02
老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万

6 月 14 - 15 日 ArchSummit 全球架构师峰会·深圳,深度探索大模型时代软件架构最佳设计。

作者 | 华卫


5 月 15 日,火山引擎发布了字节跳动研发的豆包大模型家族,今天起正式开启对外服务。而豆包的定价,让大模型从以分计价进入到了以厘计价的时代。


“不仅效果好,人人用得起的才是好模型。”火山引擎总裁谭待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。


据披露,豆包主力模型 pro-32k 版的模型推理输入价格仅为 0.0008 元 / 千 Tokens,相当于一元钱就能买到 125 万 Tokens,比行业价格低 99.3%;在处理 128K 长文本时,豆包通用模型 pro 的推理输出价格为 0.005 元/ 千 Tokens。


谭待认为,大模型要做好有三个关键挑战:模型效果、推理成本、落地难度,用的人越多,调用量越大,才能让模型越来越好。在 2024 火山引擎春季 Force 原动力大会上,火山引擎推出的一站式大模型服务平台火山方舟、扣子应用也带来了最新的技术升级动态升级。



豆包模型官网:https://www.volcengine.com/product/doubao


豆包模型家族亮相

日均处理 1200 亿 Tokens


豆包系列模型由字节跳动研发,包括从语义、声音到图像的多模态内容家族,还可以创建个性化定制的智能体,能够通过便捷的自然语言或语音交互,高效完成互动对话、信息获取、协助创作等任务。

其中,豆包通用模型 pro 是字节跳动自研 LLM 模型专业版,具有理解、生成、逻辑和记忆等综合能力,窗口尺寸最大支持 128K 长文本,并可精调,适配场景更加通用。豆包通用模型 lite 是性价比更高的轻量版,对比 pro 版本千 Tokens 成本下降 84%、延迟降低 50%,为企业提供灵活经济的模型选择。



在声音方面,豆包有具备语音合成、声音复刻和语音识别方面的三个模型,不仅善于表达多种情绪,而且 5 秒即可实现声音一比一克隆,对音色相似度和声音自然度进行高度还原,还支持复刻声音的跨语种迁移。语音识别效果尤其在科技,教育,医疗等垂直领域表现突出,并善于处理口音、噪音等复杂场景的语音识别。

而豆包·文生图模型擅长对中国特色文化的理解和输出,豆包·Function Call 模型是当前支持扣子的主力模型,可根据不同的输入指令和情景,选择不同的函数和算法来执行相关任务。

豆包·角色扮演模型则可以根据人物设定进行演绎,具备个性化的角色创作能力、上下文感知能力强和剧情推动能力,可以满足用户更加个性化的角色扮演需求。据字节跳动产品和战略副总裁朱骏透露,豆包上已有超过 800 万个智能体被创建。


此外,朱骏还谈到很多豆包在产品设计上的思考。“用户的核心需求没有变化,包括高效获取信息、工作提效、自我表达、社交娱乐等,在快速演化的是技术。对于大模型的应用,其定义了三个设计原则:拟人化、离用户近、个性化。


豆包名字的由来正是,希望产品的名字和大模型一样是拟人化的,像身边亲密的朋友或家人在日常生活当中愿意用的昵称一样,能够成为用户随身携带的“语音百事通”、桌面端文案创作小助手、嵌入到用户现有使用环境的代码生成和注释助手。


“经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。”谭待表示。


现场,谭待还首次披露了豆包大模型的月度活跃用户情况,双端月活用户量达到 2600 万。目前,豆包模型已用于豆包 App、扣子、河马爱学、飞书智能伙伴、抖音电商、剪映、番茄小说等字节跳动旗下产品及业务,并通过火山方舟向智能终端、汽车、金融、消费等行业的众多客户提供服务。


火山方舟升级 2.0 版来了


此次火山方舟平台进行了全新的升级,推出方舟 2.0 平台,新平台发布了三个重要的大模型插件。火山方舟是火山引擎发布的大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。


火山方舟 2.0 升级的主要亮点如下:

  • 联网插件:提供抖音头条同款搜索能力,能够实时连接海量优质互联网数据和抖音的独有数据,并且可以通过业内领先的意图识别能力,提供给用户更准确和更全面的回答。

  • 内容插件:独家上架了抖音内容插件,可以独家的提供抖音丰富的视频和图文内容,并且作为相关重要信息去丰富大模型和用户的交互过程。

  • RAG 知识库插件:内置了字节跳动多年实践沉淀的大规模高性能向量检索能力,百亿级别数据可以实现毫秒级检索,支持秒级索引流式更新,可以实现新增数据能够实时被检索到,知识库插件也内置了豆包向量化模型,中文场景效果领先, 可以给用户提供更好的搜索相关性。同时,文档解析环节集成了飞书优秀的文档解析能力,支持 pdf、doc、ppt、excel、txt、markdown 等多种复杂类型文档解析能力。


除了核心插件外,方舟 2.0 也对系统的承载能力、安全保护能力和算法服务能力进行全面提升。首先是系统承载能力,火山方舟提供了超过万卡公有云 GPU 资源池来支持大模型的推理服务,并能够提供 5 秒接入新建精调模型的弹性调度,仅需 3 分钟就能完成千卡扩容,来支撑企业在应用大模型过程中可能出现的突发流量和业务高峰。


在安全可信上,方舟 2.0 通过传输加密、数据加密和独有的大模型安全沙箱功能,能够在模型精调、部署和应用的过程中实现安全增强,不仅可以防止恶意攻击模型的污染,而且可以有效保护企业内部数据不会发生泄露。


算法服务方面,火山方舟平台配备了专属的大模型的算法团队。


“人人都是 AI 应用开发者”

扣子专业版发布


“AI 在通常的理解中是一个难且贵的概念,难在于大模型本身的技术复杂性,而贵在于它的训练和推理成本。目前其主要的时间场景仍局限在搜索引擎和修图工具,但大语言模型真正的潜力远不止于此。”扣子产品经理潘宇扬表示,扣子产品能够连接大模型和用户场景。


据介绍,作为新一代 AI 应用开发平台,无论是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 bot,并将其发布到各种社交平台、通讯软件或部署到网站等其他渠道。


目前,扣子专业版已集成在火山引擎的大模型服务平台“火山方舟”上,提供企业级 SLA 和高级特性。招商银行、海底捞火锅、超级猩猩、猎聘等企业,已在扣子上搭建了智能体。复旦大学、浙江大学等名校也为课程和实验搭建 AI“助教”。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-05-15 16:157406

评论 2 条评论

发布
用户头像
淘金的矿都还没有找到,想卖铁锹给他们的已经卷得不可开交了。
2024-05-20 11:34 · 湖南
回复
用户头像
发发发
2024-05-16 11:17 · 北京
回复
没有更多了

中南财经政法大学教授施先旺:事项法会计促进业财合一和会计变革

用友BIP

技术大会 业财合一 业财融合 事项会计

在高并发场景下保证数据一致性:sync.Map的并发安全性实践

Jack

公厕一体化智慧管理解决方案@光明源智能科技

光明源智慧厕所

智慧城市

MobPush创建推送

MobTech袤博科技

图文介绍 Windows 系统下打包上传 IOS APP 流程

ios 开发

Zksync部署合约和开发代币的具体教程来了,撸空投必备方法

加密先生

京东技术专家首推:微服务架构深度解析,GitHub星标120K

程序知音

Java 微服务 springboot java架构 Java进阶

理一理事务实现

Zhang

MySQL 事务 数据库·

捷行十周年庆,惊喜活动

ShineScrum捷行

大普微DapuStor完成阿里云PolarDB数据库产品生态集成认证

阿里云数据库开源

国产数据库 polarDB PolarDB-X PolarDB-PG 大普微

实力担当!焱融文件存储再次中标中国移动项目

焱融科技

#高性能 #分布式文件存储 #文件存储 #中国移动

降本增效不是“盲目减脂”,利用亚马逊云科技达成云成本正循环

Lily

得物 API一站式协作平台的一些思考

得物技术

API Gateway

打卡智能中国(四):向着沙漠,向着沙漠

脑极体

AI 遥感

小红书自研小程序:电商体验与效果优化的运行时体系设计

小红书技术REDtech

架构 前端

软件测试/测试开发丨UI自动化测试,PageObject设计模式

测试人

软件测试 自动化测试 测试开发 UI自动化 pageobject

T 级数据量迁移!知名云巨头如何从 Jira 切换至 ONES?

万事ONES

重新理解RocketMQ Commit Log存储协议

Apache RocketMQ

RocketMQ 消息队列

天天预约|如何使用「代预约」功能?全在这篇文章里!

天天预约

线上预约 预约工具 预约 预约小程序

码头风云——5G降临

脑极体

5G

例行汇报,看看 FinClip 3月都干了啥

FinClip

一站式指标平台 Kyligence Zen 登陆亚马逊云科技 Marketplace

Kyligence

数据分析 指标中台

什么是文件传输协议,文件传输协议又是怎么工作的

镭速

软件测试/测试开发丨电商业务的性能测试必备基础知识

测试人

软件测试 Jmeter 性能测试 测试开发

上干货!小红书“薯条”业务竞价策略及最优公式详解

小红书技术REDtech

广告 机制策略

数据产品经理的三大底层思维

Taylor

数据产品经理 产品思维 数据产品 数据思维 #商业思维

FLINK 在蚂蚁大规模金融场景的平台建设

Apache Flink

大数据 flink 实时计算

AIGC爆火的背后需要掌握的基础原理

飞桨PaddlePaddle

人工智能 AI 百度飞桨 AIGC

想让 ChatGPT 帮忙进行数据分析?你还需要做......

Kyligence

数据分析 指标平台

从一场文学奖评选,看金山文档To B 转型怎么走

B Impact

尚硅谷CDH 6.3.2视频教程发布

小谷哥

老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万_生成式 AI_华卫_InfoQ精选文章