写点什么

英伟达发布中国特供版 RTX 4090D:砍掉部分核心功能后,速度降低 11%,性能只差 5%

  • 2023-12-29
    北京
  • 本文字数:2643 字

    阅读完需:约 9 分钟

大小:1.26M时长:07:19
英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%

受美国今年 10 月份颁布的最新限令影响,一夜之间,英伟达顶级旗舰显卡 RTX 4090 全面下架。如今,事情似乎有了转机。

英伟达发布中国特供版 RTX 4090D

 

12 月 28 日,英伟达中文网站上线了一款名为 RTX 4090D 的显卡,这是英伟达顶级旗舰显卡 RTX 4090 的低性能版本,可以在不违背美国最新出口管制规定的前提下,出口中国。据悉,字母“D”意为 Dragon,代表 2024 年农历龙年。该显卡将于明年 1 月正式上市。

 

与 RTX 4090 相比,RTX 4090D 性能降低约 10.94%,具体差异为核心数量较少、共 14592 个 CUDA 核心,低于中国境外销售的 16384 核心版本。

 

英伟达日前在采访中表示,4090D 这张 GPU 的张量核心数也有类似幅度的削减,从 512 个减少至 456 个。除此之外,其他设计基本没有变化,峰值时钟速率仍为 2.52 GHz、内存为 24 GB GDDR6x,内存总线也继续保持 384 位。

 

尽管有所“阉割”,英伟达坚称这款显卡的性能并没有受到太大影响。

 

英伟达公司一位发言人在邮件采访中表示,“在启用光线追踪和深度学习超采样(DLSS)的 4K 分辨率游戏当中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且运行方式与全系 GeForce GPU 没有区别,所以最终用户仍可进行超频。”

 

这已经不是英伟达第一次为了遵守美国出口管制条例而主动削弱显卡性能。2022 年底,在限制对中国 AI 加速器销售风波之后,这家美国芯片巨头就降低了广受欢迎的 A100 GPU 的互连速度,由此衍生出的新版本被命名为 A800。下一代 H100 也有同样的低性能版本,预计将定名为 H800。

 

英伟达的举动也很快引起了美国商务部长 Gina Raimondo 的注意,她警告各芯片制造商不要触碰禁令的底线。“我可以告诉大家,如果你们沿着划定的边界重新设计芯片、让这些产品用于 AI 场景,那我第二天就会收紧控制。”

 

Raimondo 随后向路透社解释称,美国商务部正在与英伟达密切合作,确保不会把可能对美国国家安全构成威胁的 GPU 和 AI 加速器出售给中国。当然,这家芯片大厂可以、也应该获准在中国开展正常业务。

受“新限令”影响,RTX 4090 曾全面下架

 

此前,出口到中国的 GPU 和 AI 加速器的主要性能上限,体现在互连带宽之上——也就是处理器之间相互通信的速度。2022 年 10 月,美国商务部工业和安全局(BIS)公布对中国出口管制新规,主要针对先进芯片和芯片制造设备领域,限制了双向互连带宽为 600 GB/秒芯片的出口,规格在此之下的 GPU 无需额外申请许可。

 

作为回应,英伟达和英特尔都调整了自家最新 GPU,主动下调互连速度以回避美国商务部的限制。比如 H800 就是典型的特供版本。

 

2023 年 10 月 17 日,拜登政府更进一步,对性能密度采取了新一轮管控政策。据悉,新的政策将限制 Nvidia A800 和 H800 芯片的出口,此外,新规将豁免笔记本电脑、智能手机和游戏设备中使用的大多数消费级芯片,但其中部分芯片仍须受到美国官员的批准和专项管控。相关规定将在未来 30 天内生效。

 

根据商务部工业和安全局(BIS)提交的文件,新规则第一条、也是其中最重要的条款,限制了以下产品的对中出口:

 

“拥有一个或多个数字处理单元,且具备以下任一特征的集成电路产品:(1)「总处理性能」(TPP)为 4800 或者以上;或者(2)「总处理性能」为 1600 或更高,且「性能密度」为 5.92 或以上。”

 

其实 GPU 和加速器的总处理性能(TPP)分数计算非常简单。只需要将设备的每秒密集万亿次运算(浮点或整数)的最大数字加倍,再乘以运算的位长度。对于涉及不同精度的多项性能指标(例如 INT4、FP8、FP16 和 FP32 等),则使用最高 TPP 得分。

 

受这一新规影响,RTX 4090 成为唯一一款被禁止在中国销售的消费级显卡产品。

 

据悉,RTX 4090 的总处理性能(TPP)超过了 4800,略高于规定的消费级显卡性能上限。所谓 4800,是指先将 GPU 每秒所能运行的最大万亿次运算数字(浮点或整数运算)加倍,再乘以运算的位长度。

 

初版 4090 的 TPP 性能为 5285,也就是说英伟达必须获得美国政府颁发的许可证才能在中国合法销售这款高人气游戏显卡。需要注意的是,消费级显卡不受性能密度指标的限制,这项指标主要用于约束英伟达 L4 等性能较弱的数据中心用显卡的销售活动。

 

一时间,在京东搜索 “RTX 4090 显卡”只有少数第三方售卖,但需要预约等待到货。 同样,在淘宝搜索也是如此,标注价格基本 2 万起步,最高甚至接近 4 万元。而在二手平台咸鱼上,RTX4090 售价基本 1.2 万起步。华硕、微星、影驰等英伟达合作商也同样纷纷下架该型号的非公显卡,官方旗舰店均已显示无货状态。

 

对于“新限令”,英伟达方面曾回应称:“我们遵守所有适用的法规,同时努力提供支持不同行业的数千种应用产品。鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。”

受影响的不只有英伟达

 

虽然作为 AI 芯片市场上份额占比最高的巨头,英伟达肯定会首当其冲受到此项新规的影响,但英特尔和 AMD 的情况恐怕也好不到哪里去。

 

虽然 AMD 当前的最高规格 GPU MI250X 已经受到去年出口政策的限制,但 MI210 从技术角度讲其实低于 600 GB/秒的带宽限制。不过根据估算,该卡的 TPP 得分为 5792、功率密度为 8,所以随着新规的出台生效,MI210 恐怕也将告别中国市场。不过,AMD 曾公开表示他们正在开发一款类似于英伟达 A800 和 H800 的特殊加速器,专门面向中国销售。

 

来自 TrendForce 的行业观察师们表示,这些规定可能会抑制中国市场对英伟达高端 AI 服务器的需求,导致其全球需求份额从目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 预计字节跳动、百度、阿里巴巴和腾讯等大型 Web 和云服务商将在新规生效之前积极储备 GPU 资源。TrendForce 在一份研究报告中表示,“英伟达可能也会努力将当前稀缺的资源(例如 H800)优先交付给中国客户。”

 

从长远来看,TrendForce 预计中国企业将加快芯片自主研发力度,目前阿里巴巴打造的平头哥 ASIC 和华为投资的昇腾计算平台就是典型案例。与此同时,分析师们认为中国企业还可能调整 AI 开发思路,转而租用服务商提供的资源。

 

参考链接:

https://www.theregister.com/2023/12/28/nvidia_4090_returns_to_china/

https://www.infoq.cn/article/QJ73po4wuwTvLKcpK1Fw?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

https://www.infoq.cn/article/0AbAmTSduzAuVFFu29Nq?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

 

2023-12-29 15:1410232

评论

发布
暂无评论
发现更多内容

开源实践 | 六棱镜基于 OceanBase 选型探索与实践

OceanBase 数据库

OceanBase 开源 OceanBase 社区版 客户案例

一个cpp协程库的前世今生(十)调度的流程

SkyFire

c++ cocpp

Tableau Day1: 完成第一个可视化

贾献华

Tableau 1月月更

区块链数字藏品平台开发,区块链+数字藏品激活传统文创

电微13828808271

(1-3/3)团队OKR的设定

mtfelix

300天创作 无限生长 2022Y300P

在线JSON转HTML工具

入门小站

工具

Python猫 2021 文章小结,翻译竟比原创多!

Python猫

Python

查收新年礼物 | DevEco Studio 3.0 Beta2发布,20个新变化,等你升级

HarmonyOS开发者

HarmonyOS

龙蜥社区2021年度运营委员会会议顺利召开

OpenAnolis小助手

龙蜥社区

今晚直播:展望2022,操作系统将走向何方?

OpenAnolis小助手

操作系统 国产操作系统 龙蜥社区

04 Prometheus之配置步骤及容量规划

穿过生命散发芬芳

Prometheus 1月月更

【逆向分析】快速查找指定代码的几种方法

H

网络安全 逆向分析

政法委重点人员联防联控平台开发,跨部门大数据系统搭建

电微13828808271

科尼数字科技张彬:云设计系统助力行业数字化转型

阿里云弹性计算

阿里云 弹性计算 年度峰会

当前端渲染遇上边缘计算

火山引擎边缘云

Elasticsearch 多种跨机房灾备方案对比与实战解读

Se7en

Spring 如何解决循环依赖问题?

CRMEB

阿里云贾少天:大规模云服务器高效使用及管理实践

阿里云弹性计算

阿里云 云栖大会 云上运维

Linux之find命令的参数详解

入门小站

Linux

微博评论高性能高可用计算架构

ren

LigaAI 2021年终总结

LigaAI

团队管理 技术 成长笔记】 年度总结

架构实战 - 模块八

唐敏

「架构实战营」

JVM到底该学些什么?

蝉沐风

JVM 虚拟机 学习路线

“群舰效应”与商业市场大航海

脑极体

基于区块链和web3.0的全新社交协议Coo Social首发上线虎符创新区

区块链前沿News

Hoo 虎符交易所 coo Web3.0

应收账款的界定

whatever

供应链金融 保理

DevEco Device Tool 3.0 Beta2新版本发布,新增可视化Trace工具和Perf性能分析工具

HarmonyOS开发者

OpenHarmony

浅谈ThinkPH5.0和5.1的反序列化利用链分析

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」带你一起去探索RocketMQ服务架构的线程模型分析

码界西柚

RocketMQ SpringCloud Alibaba Alibaba技术 Apache RocketMQ

web技术分享| css filter和getUserMedia的联合使用

anyRTC开发者

CSS 前端 Web 音视频 WebRTC

悄悄告诉你,有种管理方法能让设计团队学习、产出两不误!

LigaAI

效率 技术

英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%_AI&大模型_凌敏_InfoQ精选文章