英伟达正在为基于Ada Lovelace GPU架构的下一代GeForce RTX 40 系列游戏显卡在2022年的发布做准备。DigiTimes在其最新报告中表示,与 NVIDIA 合作的中国台湾厂商正在为明年英伟达 GeForce RTX 40系列的重大更新做准备。Uqhesmc
爆料的信息直接来自将制造这些 GPU的中国台湾工厂,RetiredEnginner (@ chiakokhua ) 在Twitter上透露了一些信息片段。Uqhesmc
Uqhesmc
推特中文:英伟达两年一度的GPU更新将于2022年推出,以元宇宙和游戏为基础。继H100之后,基于Hopper架构,采用台积电的5nm + CoWoS,针对数据中心/AI,基于Ada Lovelace架构的游戏GPU RTX40系列也将利用台积电的5nm。Uqhesmc
NVIDIA Ada Lovelace GPU将为下一代GeForce RTX 40显卡提供动力,这些显卡将与 AMD 基于 RDNA 3 的 Radeon RX 7000 系列显卡正面交锋。关于 NVIDIA 使用 MCM 仍有一些猜测。据称即将推出的Hopper GPU,主要针对数据中心和人工智能领域,并将采用 MCM CoWoS 架构。NVIDIA 不会在其 Ada Lovelace GPU 上使用 MCM 设计,因此他们将保留传统的单片设计。Ada Lovelace GPU有望在架构上带来一系列关键创新。Uqhesmc
根据之前的传闻,NVIDIA 将在其 Ada Lovelace GPU 上使用台积电的 N5 (5nm) 工艺节点。这也包括 AD102 SKU,它将是一个完全单体设计。在关于这款 GPU 配置的最新推文中, AD102 GPU 的时钟速度高达 2.5 GHz(平均提升 2.3 GHz)。Ada Lovelace 'AD102' 的 GPU 时钟可能是 2.3 GHz 或更高。所以可以将其作为基线和之前泄露的规格,以确定性能应该落在何处。Uqhesmc
NVIDIA AD102“ADA GPU”似乎有 18432 个基于初步规格(可能会改变)的 CUDA 核心,安装在 144 个 SM 单元内。这几乎是 Ampere 中核心的两倍,而 Ampere 已经是 Turing 的一大进步。2.3-2.5 GHz 的时钟速度将为我们提供高达 85 到 92 TFLOP 的计算性能 (FP32)。这是现有 RTX 3090 FP32 性能的两倍多,后者具有 36 TFLOP 的 FP32 计算能力。Uqhesmc
150% 的性能提升看起来很大,但应该记住,NVIDIA 在这一代 Ampere 的 FP32 数量上已经有了很大的提升。Ampere GA102 GPU (RTX 3090) 提供 36 TFLOPs,而Turing TU102 GPU (RTX 2080 Ti) 提供13 TFLOPs。这比 FP32 Flops 提高了 150% 以上,但 RTX 3090 的实际游戏性能提高平均比 RTX 2080 Ti 快 50-60%。所以我们不应该忘记的一件事是,如今的 Flop 并不等于 GPU 游戏性能。此外,暂时还不知道 2.3-2.5 GHz 是平均提升还是峰值提升,前者意味着 AD102 可能具有更高的计算潜力。Uqhesmc
除此之外,爆料还表示,NVIDIA GeForce RTX 40 旗舰将保留 384 位总线接口,类似于 RTX 3090。有趣的是爆料者提到G6X,这意味着 NVIDIA 不会转向直到 Ada Lovelace 之后的新内存标准,并在我们看到更新的标准(例如 GDDR7)之前为其下一代卡使用更高的 21 Gbps G6X 引脚速度。该卡将配备 24 GB 内存,因此我们可以期待单面 16Gb DRAM 或双面 8Gb DRAM 模块。Uqhesmc
Uqhesmc
NVIDIA CUDA GPU(推测)来源WccftechUqhesmc
责编:Momoz