只能说老黄刀法去得太尽,RTX 40中高阶型号吸引力明显不足,市场缺乏买气,迫使NVIDIA祭出RTX 40 SUPER救市,首张登场是GeForce RTX 4070 SUPER显示卡,升级至AD104-350绘图核心,增至7,168个CUDA Cores、56个RT Cores及224个Tensor Cores,规格明显提升更重要是售价却不变, MSRP 维持在 US$599。 GameDucky 找来 NVIDIA GeForce RTX 4070 SUPER FE 新卡与 RTX 4070 / RTX 4070 Ti 进行对比测试。

NVIDIA 16日正式发布全新中端GeForce RTX 4070 SUPER显卡,这是RTX 40 SUPER系列的第一炮,CUDA Core数目相较RTX 4070提升20%但增量不加价,MSRP售价保持在US$599,紧接下来还会有RTX 4070 TiSUPER与RTX 4080SUPER型号登场。 你没看错将会有 Ti SUPER 出现,很多人以为 SUPER 是型号定位在 Ti 之下,实际上 NVIDIA 官方是把 SUPER 定义作半代更新,RTX 40 SUPER 是一个系列不是型号。

有人说老黄的刀法越来越离谱,或许是 AMD 与 Intel 都太弱了令 NVIDIA 无所顾忌,但数据却是骗不了人,对比 RTX 20、RTX 30 与 RTX 40 世代的芯片规格,中高阶型号的芯片规格与 Full Chip 的差异越来越大,举例 RTX 2070 是 TU102 Full Chip 规模的 50%,RTX 3070 是 GA102 Full Chip 规模的 54.76% ,没想到RTX 4070竟然只有AD102 Full Chip规模的31.94%,芯片规模甚至低于旧代主流卡RTX 2060(41.67%)及RTX 3060(33.33%)、相当可怜。

过去 NVIDIA 70 新卡都能以下犯上力克 80 旧卡甚至更高型号,但 RTX 4070 却完全没有这个能力,性能的提升更多来自 DLSS 3 技术的加持,主要原因是旧代库存太多,RTX 40 规格也留手让 AIC 有机会清货 。 根据 NVIDIA 官方数据,当启用 DLSS 3 的 Frame Gen 后,GeForce RTX 4070 在 2K 分辨率下平均较 GeForce RTX 3080 快 40%,没有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在游戏市场要取得销售成功,很大程度视乎 NVIDIA DLSS 3 技术的普及程度,
矿难后大量二手卡涌现、旧代RTX 30库存减价,加上全球经济低迷,市场明显对RTX 40中高阶型号兴趣缺缺,以往是RTX 20/30的中高阶型号性价比吸引,旗舰级型号是追求极致性能的金主们,但RTX 40却是中高阶型号性价比不足,反令RTX 4090性价比显得更出色,就算US$1,599甚至炒价也是大卖, 所有玩家们并非没钱只是找不到升级的理由。

对于NVIDIA来说RTX 40 SUPER是一个大升级,但笔者认为用「拨乱反正」来形容会更贴切,NVIDIA将会推出三款全新RTX 40 SUPER型号,包括GeForce RTX 4070 SUPER、GeForce RTX 4070 TISUPER及GeForce RTX 4080 SUPER,其中RTX 4070 TiSUPER与RTX 4080 SUPER 会取代旧型号,RTX 4070 Ti 及 RTX 4080 将完全停产,RTX 4080 SUPER 的 MSRP 定价会降至 US$999,当年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 敢卖 US$1,199,真是哪来的勇气啊,玩家们都说:「畀多少少钱,买 RTX 4090 好过啦」。

GeForce RTX 4070 SUPER 是三张SUPER之中进步最大的一张,CUDA Core相较RTX 4070增加了20%,回到AD102 Full Chip规格的38.89%,MSPR定价US$599取代RTX 4070沿有定位,但GeForce RTX 4070并不会停产,而是向下调至US$499美元,整个布局令NVIDIA RTX 40 产品线回复吸引力,令人期待。
NVIDIA AD104-350 绘图核心
与 RTX 4070 / RTX 4070 Ti 一样,GeForce RTX 4070 SUPER 同样采用 AD104 绘图核心,基于 NVIDIA Ada Lovelace GPU 微架构,性能提升主要来自 FP32 运算单元数目及时脉倍增,更大的 L2 Cache 容量及全新着色器执行排序技,术,升级第 3 代 RT Cores、升级第 4 代 Tensor Cores,与上代比较 Ampere GPU微架构比较,传统光栅图形运算提高了2倍,同时在光线追踪性能上提升近4倍。
采用 TSMC 4N NVIDIA Custom 制程,拥有 358 个电晶管、 Die Size 294.5mm² 与上代 GeForce RTX 3060 的 GA106-300 Die Size 276mm²相约,完整的AD104芯片内置5个GPC单元、30个TPC纹理处理群集及60个SM串流多处理器,具备7,680个CUDA Cores、60个RT Cores及 240 个 Tensor Cores。

▲ NVIDIA AD104-350 框图
GeForce RTX 4070 SUPER采用AD104-350绘图核心,规模相较RTX 4070大幅增加,回复至5个GPC单元、增至28个TPC纹理处理群集及56个SM串流多处理器,具备7,168个CUDA Cores、56个RT Cores、224个Tensor Cores、224个TextureUnit及80个RAOP。
核心时脉方面,NVIDIA GeForce RTX 4070 SUPER FE预设时脉1,980MHz、Boost频率为2,475MHz,最高TDP为220W相较RTX 4070高了20W。

▲ NVIDIA AD104 绘图核心
内存方面,NVIDIA GeForce RTX 4070与RTX 4070 SUPER一样维持192-bit内存接口,搭配21Gbps GDDR6X内存颗粒,最高内存带宽为504GB/s,但RTX 4070 SUPER的L2 Cache容量由36MB提至48MB,有助提升游戏Workload资料命中率,降低读取延迟达并减少GDDR6X 内存带宽使用,内存子系统性能将会相较 RTX 4070 有明显改善。
NVIDIA GeForce RTX 4070 Family 完整规格
Graphics Card | GeForce RTX 4070 Founders Edition | GeForce RTX 4070 SUPER Founders Edition | GeForce RTX 4070 Ti Founders Edition |
GPU SKU | AD104-250 | AD104-350 | AD104-400 |
GPU Architecture | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace |
GPCs | 4 | 5 | 5 |
TPCs | 23 | 28 | 30 |
SMs | 46 | 56 | 60 |
CUDA Cores / SM | 128 | 128 | 128 |
CUDA Cores / GPU | 5888 | 7168 | 7680 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 184 (4th Gen) | 224 (4th Gen) | 240 (4th Gen) |
RT Cores | 46 (3rd Gen) | 56 (3rd Gen) | 60 (3rd Gen) |
Frame Buffer Memory Size and Type | 12GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X |
Memory Interface | 192-bit | 192-bit | 192-bit |
Memory Clock (Data Rate) | 21 Gbps | 21 Gbps | 21 Gbps |
Memory Bandwidth | 504 GB/sec | 504 GB/sec | 504 GB/sec |
ROPs | 64 | 80 | 80 |
L1 Data Cache/SharedMemory | 5888 KB | 7168 KB | 7680 KB |
L2 Cache | 36864 KB | 49152 KB | 49152 KB |
Video Engines | 1x NVENC (Gen 8) 1x NVDEC (Gen 5) | 1x NVENC (Gen 8) 1x NVDEC (Gen 5) | 2x NVENC (Gen 8) 1x NVDEC (Gen 5) |
TGP Power | 200W | 220W | 285W |
Transistor Count | 35.8 Billion | 35.8 Billion | 35.8 Billion |
Die Size | 294.5mm² | 294.5mm² | 294.5mm² |
Manufacturing Process | TSMC 4N | TSMC 4N | TSMC 4N |
PCIe Interface | Gen4 x16 | Gen4 x16 | Gen4 x16 |
