2025云栖大会,开启通往AGI的未来之旅 了解详情
写点什么

豆包 1.5 · 深度思考模型上线边缘大模型网关,百万 Tokens 免费领

  • 2025-04-21
    北京
  • 本文字数:1611 字

    阅读完需:约 5 分钟

大小:721.77K时长:04:06
豆包 1.5 · 深度思考模型上线边缘大模型网关,百万 Tokens 免费领

4 月 17 日,火山引擎发布豆包 1.5・深度思考模型,引发业内关注与讨论。全新发布的豆包 1.5・深度思考模型,在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平;在创意写作等非推理任务中,模型也展示出优秀的泛化能力,能够胜任更广泛和复杂的使用场景。


豆包 1.5・深度思考模型包含两个版本,第一个主线版本是大语言模型 Doubao-1.5-thinking-pro,第二个是多模态版。前者推理能力更强,后者支持视觉推理。


目前,火山引擎边缘大模型网关已全面支持豆包 1.5・深度思考模型!即日起,用户可以在边缘大模型网关使用豆包全系列模型,并享受 200 万 tokens 免费额度,只要在网关访问密钥使用了本次新增的豆包大模型,还可以申请将免费额度提升至 500 万 tokens !



边缘大模型网关,助力豆包大模型调用


火山引擎边缘大模型网关支持通过一个 API 接口访问多家大模型提供商的模型与智能体,在端侧基于遍布全球的边缘计算节点就近调用。利用边缘云基础架构优势,提高模型访问速度,为终端用户提供更快速、可靠的 AI 服务体验。



在边缘大模型网关,用户可通过两种方式调用豆包 1.5・深度思考模型:

  • 一是通过平台预置模型,边缘大模型网关预置模型中,新增由火山方舟提供的豆包 1.5・深度思考模型,您可直接使用并对其创建网关访问密钥;

  • 二是通过自有三方模型,您可以将您在第三方模型平台的密钥纳管至边缘大模型网关,通过边缘大模型网关签发的网关访问密钥,进行对应模型的访问与调用。




据了解,豆包 1.5・深度思考模型采用 MoE 架构,总参数为 200B ,激活参数仅 20B ,具备显著的训练和推理成本优势。基于高效算法,豆包 1.5・深度思考模型在提供行业极高并发承载能力的同时,实现 20 毫秒极低延迟。除此之外,「深度思考」和「视觉理解」复合能力的加持,让豆包 1.5・深度思考模型就像是一个长有「聪明大脑」和「眼睛」的超级 AI,解决问题的能力大大提升。


通过边缘大模型网关调用豆包 1.5 · 深度思考模型,还具备以下优势:

  • 加速调用:基于端侧请求发起位置,边缘大模型网关将请求就近路由到网络延时最低的节点,加速豆包 1.5 · 深度思考模型的响应速度,提升服务质量。

  • 控制成本:边缘大模型网关利用边缘缓存机制对请求就近存储,并在相同请求发出时就近调用,减少豆包 1.5 · 深度思考模型调用请求的回源次数,降低模型调用成本,实现成本管控。

  • 自动重试:当请求调用超时或失败时,配置请求重试次数,即可通过边缘大模型网关实现模型调用自动重试,降低手动运维成本。

  • 故障转移:当单个模型故障时,通过边缘大模型网关的一个 API 配置多个模型,就可以自动切换同类型下的备用模型,确保服务的连续性和可靠性。



豆包大模型特惠,扩容免费提升至 500 万 tokens


当前,火山引擎边缘大模型网关已适配 100+ 种主流大模型及智能体,首次创建每个网关访问密钥可用额度为 200 万 tokens !


针对豆包 1.5・深度思考模型,边缘大模型网关推出特惠活动,只要在边缘大模型网关创建网关访问密钥,并关联本次最新的豆包大模型,即可提交扩容申请,免费额度提升至 500 万 tokens !


  • 免费额度获取方式:

    登录边缘大模型网关控制台(https://console.volcengine.com/vei/aigateway/overview),创建网关访问密钥即可获得 200 万免费 tokens 额度

    在已经完成创建的网关访问密钥中,关联带有 NEW 标识的最新豆包模型,即可申请获取更多额度,最高可达 500 万免费 tokens!


  • 扩容申请指导:

    登录火山配额中心:

    https://console.volcengine.com/quota/productList/ParameterList?ProviderCode=vei_api

    选择“ai-gateway-token-limit”提交申请:申请中需要说明需要配置免费额度的网关访问密钥 ID,额度可以选择至 500 万,选择更高额度,以 500 万进行生效

    详细指导说明请见:

    https://www.volcengine.com/docs/6893/1456325


点击链接:https://console.volcengine.com/auth/login?redirectURI=%2Fvei%2Faigateway%2Foverview即可登录边缘大模型网关控制台,赶紧使用起来~

2025-04-21 15:057457

评论

发布
暂无评论
发现更多内容

Prometheus实战-从0构建高可用监控平台(五)

小毛驴的烂笔头

Linux Prometheus

如何有效的向 AI 提问 ?

繁依Fanyi

人工智能

锐捷网络,无边光景一时新

脑极体

网络

全新 – Amazon EC2 R6a 实例由第三代 AMD EPYC 处理器提供支持,适用于内存密集型工作负载

亚马逊云科技 (Amazon Web Services)

Amazon EC2

对比编程语言的四种错误处理方法,哪种才是最优方案?

Python猫

编程

如何安装OpenHarmony HAR

鸿蒙之旅

OpenHarmony 三周年连更

实现CyclicBarrier的原理和在Go中的应用

Jack

Django认证系统

测吧(北京)科技有限公司

测试

2023-05-08:我们定义了一个函数 countUniqueChars(s) 来统计字符串 s 中的唯一字符, 并返回唯一字符的个数。 例如:s = “LEETCODE“ ,则其中 “L“, “T

福大大架构师每日一题

Go 算法 rust 福大大

数据脱敏技术

穿过生命散发芬芳

数据脱敏 三周年连更

Linux 中的文件锁定命令:flock、fcntl、lockfile、flockfile

wljslmz

Linux 三周年连更

所谓高手,就是跨过坑和大海| 社区征文

鸿蒙之旅

三周年征文

Fabarta 与青岛市城阳区政府达成战略合作,共同推动区域数据要素市场建设

Fabarta

数据挖掘 数据要素 数据资产管理 图智能 数据要素流通

Prometheus实战-从0构建高可用监控平台(三)

小毛驴的烂笔头

Linux Prometheus

毕业设计-100w秒杀设计

Sam

架构实战营

监控服务与zabbix介绍

乌龟哥哥

三周年连更

Java 网络编程详解

timerring

Java

已有多人中招:这张特殊二维码可致微信闪退,还会进入安全模式

Rose

微信防撤回 微信下载 微信小助手 微信闪退

数据标注——数字世界的基石

数据堂

什么是点对点传输?什么是点对多传输

镭速

Django笔记二十五之数据库函数之日期函数

Hunter熊

Python django extract trunc

程序员 35 岁危机的核心实质是什么?

海拥(haiyong.site)

三周年连更

苹果Mac电脑安装AutoCAD 2024卡死无响应,怎么办

Rose

cad AutoCAD 2024 Mac版 AutoCAD 2024下载 无响应

【深入浅出Spring原理及实战】「缓存Cache开发系列」带你深入分析Spring所提供的缓存Cache功能的开发实战指南

码界西柚

spring 缓存服务 三周年征文 CacheManager 缓存系统

pyFBI让Python运行的性能可视化

IT蜗壳-Tango

三周年连更

Prometheus实战-从0构建高可用监控平台(四)

小毛驴的烂笔头

Linux Prometheus

视频监控系统选择硬盘,绿盘、蓝盘、紫盘、黑盘、红盘到底选择哪个?

wljslmz

视频监控 三周年连更

Flink数据流元素

阿泽🧸

flink 三周年连更

Shell语法之基本运算符

芯动大师

Shell 三周年连更 shell变量

健康运动app(2)

鸿蒙之旅

OpenHarmony 三周年连更

豆包 1.5 · 深度思考模型上线边缘大模型网关,百万 Tokens 免费领_字节跳动_火山引擎_InfoQ精选文章