写点什么

节前 DeepSeek 又突击了!大方开源 V3.2 实验版,API 价格降低 50%+

  • 2025-09-29
    北京
  • 本文字数:558 字

    阅读完需:约 2 分钟

大小:259.08K时长:01:28
节前DeepSeek又突击了!大方开源V3.2实验版,API 价格降低 50%+

刚刚,DeepSeek 突然宣布 DeepSeek-V3.2-Exp 正式发布,这是其模型的实验版本。现已在 App、Web 和 API 上线, API 价格降低了 50%+。

 

模型: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp 

技术报告: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf 

 

 

作为迈向下一代架构的过渡,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力机制(DSA)——一种稀疏注意力机制,旨在探索和验证在长上下文场景下训练和推理效率的优化。此外,SGLang 是 DeepSeek-V3.2 的官方推理框架,具有优化的稀疏注意力内核、动态 KV 缓存,并能无缝扩展到 128K 个 token。

 


据介绍,该实验版本代表了 DeepSeek 团队对更高效的变压器架构的持续研究,特别注重提高处理扩展文本序列时的计算效率。

 

 

  • DSA 实现了以最小的输出质量影响实现细粒度稀疏注意力,提升长上下文性能并降低计算成本。

  • 为了严格评估引入稀疏注意力的影响,DeepSeek-V3.2-Exp 的训练配置与 V3.1-Terminus 保持一致。在各个领域的公共基准测试中,DeepSeek-V3.2-Exp 表现出与 V3.1-Terminus 相当的性能。

 


其实早在模型发布之前,就有网友猜测,DeepSeek 或者谷歌可能会在十一国庆节期间有新动作,并猜测 DeepSeek 可能会放出 V4,这次不用网友们猜了,他们在节前放出了新模型让大家踏实过节去吧!

2025-09-29 20:309299

评论

发布
暂无评论

2021 优秀开源项目公布,Apache APISIX 位列其中!

API7.ai 技术团队

api 网关 Apache APISIX 优秀开源项目

带你认识三种kafka消息发送模式

华为云开发者联盟

kafka 时间 异步 消息发送 producer

技术“开源”对于金融业软件发展的影响

Speedoooo

安全 ios开发 APP开发 Andriod开发 小程序容器

网络安全好学吗?手把手教你学主动信息收集,网络安全基础教程

学神来啦

网络安全 信息安全 渗透测试· kali kali Linux

基于磁盘量身定制,十亿规模高效向量检索方案

Zilliz

向量检索 anns 向量计算

面试官:方法重写时需要注意哪些问题?

王磊

大型集团企业云管平台建设参考架构

华为云开发者联盟

架构 运维 IT治理 分布式部署 ManageOne

QCon-oCPX多目标多场景联合建模在OPPO的实践

安第斯智能云

算法

助车企升级,旺链科技与南方电网、联想等名企同斩获「创新案例奖」

旺链科技

区块链 产业区块链 供应链金融

固定资产管理平台系统解决方案

低代码小观

企业管理 资产管理 CRM 企业管理系统 CRM系统

Linux之atime,ctime,mtime的区别

入门小站

Linux

☕【权限设计系列】「认证授权专题」微服务架构的登陆认证问题

码界西柚

微服务架构 12月日更 权限认证机制 授权设计

架构训练营模块三作业

zhongwy

架构实战营 「架构实战营」

Spring框架基础知识(03)

海拥(haiyong.site)

28天写作 12月日更

平凯星辰获评 《金融电子化》2021 金融业新技术应用创新突出贡献奖

PingCAP

使用亚马逊云科技DevOps 工具构建 InnerSource 生态系统

亚马逊云科技 (Amazon Web Services)

开源 InnerSource

实践解析可视化开发平台FlinkSever优势

华为云开发者联盟

flink kafka 流计算 华为FusionInsight MRS FlinkSever

【2021废钢铁大会】拾起卖旗下天津城矿再生资源回收有限公司三获“全国优质废钢加工配送企业”称号

InfoQ 天津

HDFS源码解析:教你用HDFS客户端写数据

华为云开发者联盟

hdfs block appendChunk

【转】大数据开发之Spark面试八股文

@零度

大数据 spark

通过一个实际例子理解Kubernetes里pod的自动scale - 水平自动伸缩

汪子熙

Kubernetes k8s 28天写作 docker build 12月日更

尚硅谷大数据之Canal视频教程发布!

@零度

大数据

Kafka 消息存储与索引设计

编程江湖

kafka

梦想起航

向往

盘点2021

兄弟要盘吗?

为自己带盐

爬虫 dotnet 28天写作 12月日更

28天写作感想

Tiger

28天写作

【转】java开发之MyBatis 原理与核心组件

@零度

mybatis JAVA开发

前端React 开发中必须知道的5个技巧

@零度

前端开发 React

填问卷抽大奖,中奖绝缘体的跨年福利快来领取!

InfoQ写作社区官方

热门活动

在线JSON转PHP Array工具

入门小站

工具

60 K8S之EFK日志管理系统

穿过生命散发芬芳

k8s 28天写作 12月日更

节前DeepSeek又突击了!大方开源V3.2实验版,API 价格降低 50%+_AI&大模型_华卫_InfoQ精选文章