【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

老便宜了!字节跳动豆包大模型开始营业,一元钱能买 125 万 Tokens,月活用户量达 2600 万

  • 2024-05-15
    北京
  • 本文字数:2425 字

    阅读完需:约 8 分钟

大小:1.21M时长:07:02
老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

作者 | 华卫


5 月 15 日,火山引擎发布了字节跳动研发的豆包大模型家族,今天起正式开启对外服务。而豆包的定价,让大模型从以分计价进入到了以厘计价的时代。


“不仅效果好,人人用得起的才是好模型。”火山引擎总裁谭待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。


据披露,豆包主力模型 pro-32k 版的模型推理输入价格仅为 0.0008 元 / 千 Tokens,相当于一元钱就能买到 125 万 Tokens,比行业价格低 99.3%;在处理 128K 长文本时,豆包通用模型 pro 的推理输出价格为 0.005 元/ 千 Tokens。


谭待认为,大模型要做好有三个关键挑战:模型效果、推理成本、落地难度,用的人越多,调用量越大,才能让模型越来越好。在 2024 火山引擎春季 Force 原动力大会上,火山引擎推出的一站式大模型服务平台火山方舟、扣子应用也带来了最新的技术升级动态升级。



豆包模型官网:https://www.volcengine.com/product/doubao


豆包模型家族亮相

日均处理 1200 亿 Tokens


豆包系列模型由字节跳动研发,包括从语义、声音到图像的多模态内容家族,还可以创建个性化定制的智能体,能够通过便捷的自然语言或语音交互,高效完成互动对话、信息获取、协助创作等任务。

其中,豆包通用模型 pro 是字节跳动自研 LLM 模型专业版,具有理解、生成、逻辑和记忆等综合能力,窗口尺寸最大支持 128K 长文本,并可精调,适配场景更加通用。豆包通用模型 lite 是性价比更高的轻量版,对比 pro 版本千 Tokens 成本下降 84%、延迟降低 50%,为企业提供灵活经济的模型选择。



在声音方面,豆包有具备语音合成、声音复刻和语音识别方面的三个模型,不仅善于表达多种情绪,而且 5 秒即可实现声音一比一克隆,对音色相似度和声音自然度进行高度还原,还支持复刻声音的跨语种迁移。语音识别效果尤其在科技,教育,医疗等垂直领域表现突出,并善于处理口音、噪音等复杂场景的语音识别。

而豆包·文生图模型擅长对中国特色文化的理解和输出,豆包·Function Call 模型是当前支持扣子的主力模型,可根据不同的输入指令和情景,选择不同的函数和算法来执行相关任务。

豆包·角色扮演模型则可以根据人物设定进行演绎,具备个性化的角色创作能力、上下文感知能力强和剧情推动能力,可以满足用户更加个性化的角色扮演需求。据字节跳动产品和战略副总裁朱骏透露,豆包上已有超过 800 万个智能体被创建。


此外,朱骏还谈到很多豆包在产品设计上的思考。“用户的核心需求没有变化,包括高效获取信息、工作提效、自我表达、社交娱乐等,在快速演化的是技术。对于大模型的应用,其定义了三个设计原则:拟人化、离用户近、个性化。


豆包名字的由来正是,希望产品的名字和大模型一样是拟人化的,像身边亲密的朋友或家人在日常生活当中愿意用的昵称一样,能够成为用户随身携带的“语音百事通”、桌面端文案创作小助手、嵌入到用户现有使用环境的代码生成和注释助手。


“经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。”谭待表示。


现场,谭待还首次披露了豆包大模型的月度活跃用户情况,双端月活用户量达到 2600 万。目前,豆包模型已用于豆包 App、扣子、河马爱学、飞书智能伙伴、抖音电商、剪映、番茄小说等字节跳动旗下产品及业务,并通过火山方舟向智能终端、汽车、金融、消费等行业的众多客户提供服务。


火山方舟升级 2.0 版来了


此次火山方舟平台进行了全新的升级,推出方舟 2.0 平台,新平台发布了三个重要的大模型插件。火山方舟是火山引擎发布的大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。


火山方舟 2.0 升级的主要亮点如下:

  • 联网插件:提供抖音头条同款搜索能力,能够实时连接海量优质互联网数据和抖音的独有数据,并且可以通过业内领先的意图识别能力,提供给用户更准确和更全面的回答。

  • 内容插件:独家上架了抖音内容插件,可以独家的提供抖音丰富的视频和图文内容,并且作为相关重要信息去丰富大模型和用户的交互过程。

  • RAG 知识库插件:内置了字节跳动多年实践沉淀的大规模高性能向量检索能力,百亿级别数据可以实现毫秒级检索,支持秒级索引流式更新,可以实现新增数据能够实时被检索到,知识库插件也内置了豆包向量化模型,中文场景效果领先, 可以给用户提供更好的搜索相关性。同时,文档解析环节集成了飞书优秀的文档解析能力,支持 pdf、doc、ppt、excel、txt、markdown 等多种复杂类型文档解析能力。


除了核心插件外,方舟 2.0 也对系统的承载能力、安全保护能力和算法服务能力进行全面提升。首先是系统承载能力,火山方舟提供了超过万卡公有云 GPU 资源池来支持大模型的推理服务,并能够提供 5 秒接入新建精调模型的弹性调度,仅需 3 分钟就能完成千卡扩容,来支撑企业在应用大模型过程中可能出现的突发流量和业务高峰。


在安全可信上,方舟 2.0 通过传输加密、数据加密和独有的大模型安全沙箱功能,能够在模型精调、部署和应用的过程中实现安全增强,不仅可以防止恶意攻击模型的污染,而且可以有效保护企业内部数据不会发生泄露。


算法服务方面,火山方舟平台配备了专属的大模型的算法团队。


“人人都是 AI 应用开发者”

扣子专业版发布


“AI 在通常的理解中是一个难且贵的概念,难在于大模型本身的技术复杂性,而贵在于它的训练和推理成本。目前其主要的时间场景仍局限在搜索引擎和修图工具,但大语言模型真正的潜力远不止于此。”扣子产品经理潘宇扬表示,扣子产品能够连接大模型和用户场景。


据介绍,作为新一代 AI 应用开发平台,无论是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 bot,并将其发布到各种社交平台、通讯软件或部署到网站等其他渠道。


目前,扣子专业版已集成在火山引擎的大模型服务平台“火山方舟”上,提供企业级 SLA 和高级特性。招商银行、海底捞火锅、超级猩猩、猎聘等企业,已在扣子上搭建了智能体。复旦大学、浙江大学等名校也为课程和实验搭建 AI“助教”。

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2024-05-15 16:157976

评论 2 条评论

发布
用户头像
淘金的矿都还没有找到,想卖铁锹给他们的已经卷得不可开交了。
2024-05-20 11:34 · 湖南
回复
用户头像
发发发
2024-05-16 11:17 · 北京
回复
没有更多了

3D设计必备!5个免高质量的 HDRI 环境贴图网站

Finovy Cloud

blender

理解JVM工作机制(五)垃圾回收算法

ue4

Java jdk JVM

基于 Amazon API Gatewy 的跨账号跨网络的私有 API 集成

亚马逊云科技 (Amazon Web Services)

Amazon

ConcurrentHashMap是如何实现的?

javacn.site

AIGC背后的技术分析 | 图像风格迁移

TiAmo

AIGC 图像风格迁移

恭喜又一名小伙伴上岸大厂

冰河

程序员 互联网 架构师 大厂Offer 上岸大厂

理解 JVM 工作机制(十一) 类加载器

ue4

Java jdk JVM

Solaris Exchange:一个安全可靠的合成资产交易平台

股市老人

中国互联网广告市场年度分析2023

易观分析

互联网 广告

易观千帆 | 2023年4月证券APP月活跃用户规模盘点

易观分析

证券

Nautilus Chain开启全球行,普及Layer3概念加速其采用

西柚子

2D CAD设计软件CADintosh X 激活版

真大的脸盆

Mac Mac 软件 CAD绘图 CAD设计 cad

优质高效!阿里甩出SpringBoot巅峰之作,进阶不二之选

做梦都在改BUG

Java Spring Boot 框架

理解 JVM 工作机制(四) 回收策略

ue4

Java jdk JVM

2023-05-24:为什么要使用Redis做缓存?

福大大架构师每日一题

redis 福大大

ps神经滤镜是干什么的,神经滤镜的功能和作用

Rose

Photoshop 2023下载 ps神经滤镜 Neural Filters滤镜

C语言编程—循环语句

芯动大师

MacOS高效iOS代码编写工具|AppCode 2023 激活版v2023.2 兼容M1/M2/intel

Rose

AppCode中文 AppCode 2023破解 AppCode密钥 iOS/macOS开发

理解 JVM 工作机制(九) 类文件结构

ue4

Java jdk JVM

Nautilus Chain开启全球行,普及Layer3概念加速其采用

股市老人

如何使用golang实现桥接模式

Jack

从传统 IT 容灾转向“全栈云容灾”|什么是更适合政企的云

云布道师

阿里云

理解 JVM 工作机制(六) 垃圾收集器

ue4

Java jdk JVM

理解 JVM 工作机制(七) 内存分配和回收策略

ue4

Java jdk JVM

理解 JVM 工作机制(八) JVM 性能调优

ue4

Java jdk JVM

理解 JVM 工作机制(十) 类加载机制和加载的过程

ue4

Java jdk JVM

c#中用System.Diagnostics.Process.Start(Path.GetFullPath(“vlc.exe.lnk“), url);用vlc的快捷方式打开http的url不起作用?

福大大架构师每日一题

C# 福大大 vlc

CMake入门教程:从零开始构建C/C++项目

小万哥

程序员 后端 开发 C/C++ cmake

Nautilus Chain开启全球行,普及Layer3概念加速其采用

BlockChain先知

OpenHarmony创新赛 | 赛事宣讲会日期重磅官宣!为你带来超详尽的赛事攻略

OpenHarmony开发者

OpenHarmony

老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万_生成式 AI_华卫_InfoQ精选文章