深度分析AMD游戏GPU架构的成功与优点

作者：techspot时间：2023-11-21来源：半导体产业纵横收藏

2019 年，AMD 推出了一款新的 GPU 架构，这是该公司七年来首次推出主要的图形芯片设计。自首次亮相以来，该架构经历了两次修订，强调了 chiplet 和缓存在渲染领域的重要性。鉴于这些发展，评估 AMD 凭借其工程能力所取得的成就并考虑每次更新的影响是有意义的。

本文引用地址：http://www.amcfsurvey.com/article/202311/453142.htm

我们将探索这项技术，评估其在游戏中的表现，并研究其对 AMD 的财务影响。

RDNA 是否像 Zen 一样取得了巨大的成功? 或者，各种各样的修改是否会给 AMD 带来另一个「Bulldozer」时刻? 让我们来看看。

为什么 GCN 需要改变

目前 AMD 的 GPU 分为两个截然不同的产品领域，一个是针对游戏的，另一个是用于超级计算机、大数据分析和机器学习系统的。

然而，它们都有着相同的传统——一种被称为 Graphics Core Next（GCN）的架构。它首次出现于 2012 年，尽管在此过程中进行了一些重大修改，但仍使用了近 10 年。GCN 是对其前身 TeraScale 的彻底改革，从一开始，它就被设计为具有高度可扩展性，在图形和通用计算（GPGPU）应用中同样适用。

缩放是处理单元组合在一起的方式。从 GCN 的最初版本到最终版本，GPU 的基础由 4 个计算单元 (CU) 组成。

每个处理器都包含 4 个 SIMD(单指令，多数据) 矢量单元，在 16 个数据点上执行数学运算，大小为 32 位，还有一个标量单元用于基于整数的逻辑运算。

每个矢量 SIMD 都有一个 64 kB 的寄存器文件，所有四个单元共享一个 64 kB 的暂存块 (称为本地数据共享，LDS)，所有处理单元共享一个 16 kB 的 L1 数据缓存。四组 CU 共享一个 16 kB 的标量缓存和一个 32 kB 的指令缓存，所有这些缓存都链接到一个 GPU 级的 L2 缓存。

到 2018 年 GCN 5.1 发布时，这些都没有太大变化，尽管对缓存层次结构的操作方式进行了多次改进。然而，对于游戏世界来说，GCN 有一些明显的缺点，但可以总结为，对于开发者来说，从芯片中获得处理吞吐量和带宽利用率方面的最佳性能是一个挑战。

例如，GPU 以 64 个线程为一组 (每个线程称为一个波或波前) 进行调度，每个 SIMD 单元可以使用不同的波发出，最多排队 10 个深度。然而，指令的发布率是每 4 个周期 1 次，因此为了确保单元保持繁忙，需要调度大量线程——这在计算世界中是可以实现的，而在游戏中则不然。

GCN 的第一个版本拥有称为异步计算引擎（ACE）的硬件结构。当涉及到在 3D 游戏中的渲染帧时，GPU 会由排在长队列中的系统发出命令。然而，它们并不都需要按照严格的线性顺序完成，这就是 ACE 发挥作用的地方。

基于 GCN 的 GPU 基本上可以将队列分成三种不同的类型 (分别用于图形命令、计算工作和数据事务)，然后相应地对它们进行调度。然而，当时 Direct3D API 对该系统没有太多支持，尽管 2015 年 Direct3D 12 发布后，异步着色就风靡一时。AMD 利用了这一点，使 GCN 更加专注于计算。

这一点从 AMD 在高端游戏显卡市场推出的最新产品——售价 700 美元的 Radeon VII(见下图) 中可以明显看出。它在 4096 位宽总线上拥有 60 个 cu(完整芯片有 64 个 cu) 和 16gb HBM2 内存，绝对是一个 GPU 怪物。

与同样售价 700 美元的 GeForce RTX 2080 相比，它在某些游戏中可能会更快，但大多数基准测试结果表明，该架构并不适合现代 3D 游戏世界。

GCN 5.1 主要用于专业工作站卡，Radeon VII 本质上只不过是一款权宜之计的产品，专为游戏爱好者而设计，而下一代 GPU 正准备亮相。

仅仅四个月后，AMD 发布了长期运行的 GPU 架构的继任者 RDNA。通过这一新设计，AMD 成功解决了 GCN 的大部分故障，第一款采用这种架构的显卡 Radeon RX 5700 XT 清楚地突显了它比 GCN 更适合游戏。

GPU 的「一小步」

2017 年推出 Ryzen 系列 CPU 时，采用了新的 Zen 设计，买家得到了全新的架构，从头开始重新构建。RDNA 的情况并非如此，因为基本概念在本质上仍然类似于 GCN。然而，几乎所有内部的东西都经过了调整，使游戏开发者更容易从 GPU 中获得最大可能的性能。

每个 CU 的 SIMD 计数从 4 个切换到 2 个，每个 CU 现在处理 32 个数据点，而不是 16 个。调度单元现在可以以 32 或 64 的批处理线程，在前者的情况下，SIMD 单元现在可以被发出，并在每个周期处理一条指令。

仅这两个变化就使开发人员更容易让 GPU 保持忙碌，尽管这确实意味着编译器在选择正确的波大小进行处理时需要做更多的工作。AMD 为计算和几何着色器选择了 32，为像素着色器选择了 64，尽管这并不是一成不变的。

CU 现在是成对分组的（称为工作组处理器，WGP），而不是四元组，虽然指令和标量缓存仍然是共享的，但它们现在只需要为两个 CU 提供服务。最初的 16kB L1 缓存被调整并重新标记为 L0，而新的 128kB L1 现在为四个 WGP 提供服务——两个 WGP 都具有 128 字节大小的缓存线（有助于提高内部带宽利用率）。

现在，GPU 的每个部分都使用了无损数据压缩，全面降低了延迟，甚至更新了纹理寻址单元。所有这些更改都有助于减少移动数据、刷新缓存等所浪费的时间。

但也许 RDNA 第一个版本最令人惊讶的方面不是架构上的变化，而是它的第一次迭代是在中端、中等价位的显卡上。Radeon RX 5700 XT 中的 Navi 10 芯片并不是一块巨大的硅片，里面装有计算单元，而是只有 251 平方毫米的大小和 40 个 CU。它与 Radeon VII 中的 Vega 20 GPU 在同一台积电 N7 工艺节点上制造，体积小 24%，这对晶圆产量来说非常好。

然而，它的 CU 也减少了 38%，尽管就晶体管数量而言，人们不可能指望所有额外的更新和缓存都是免费的。但在游戏中测试时，它的平均速度仅比 Radeon VII 慢 9%，最重要的是，它便宜了 300 美元。

总的来说，它是新架构的一个有希望的入口，因为 RDNA 是朝着正确方向迈出的一步，尽管有点小。由于其性能介于 Radeon RX Vega 56 和 Radeon VII 之间，它在速度、功耗和零售价格之间取得了良好的平衡。

不过，新 GPU 的推出并非没有问题，尽管 RDNA 在近 30 种不同的产品中找到了归宿（通过三种芯片设计变体），但一些人对 AMD 没有更强大的产品可供销售感到失望。

幸运的是，他们不用等太久这一问题就能被解决。

RDNA 第二轮

Radeon RX 5700 XT 发布一年多后，当世界正在与全球疫情作斗争时，AMD 发布了 RDNA 2。从表面上看，除了两个新的东西之外，几乎没有什么变化——纹理单元被升级，以便它们可以执行光线三角形相交测试，并且添加了额外的最后一级缓存 (LLC)。

前者是一个具有成本效益的补充，使 GPU 能够以最少的额外晶体管数量处理光线跟踪，但后者并不是零碎的产品，因为它远不止几 MB。在 GPU 历史上，6MB 的 LLC 被认为是「大」的，所以当 AMD 在第一个 RDNA 2 芯片 Navi 21 中硬塞进 128MB 时，它不仅震惊了 GPU 爱好者，而且永远改变了图形处理器的发展方向。

虽然由于芯片制造方法的改进，处理器变得越来越快，能力也越来越强，但 DRAM 却很难跟上。要使数十亿个微小的电容器收缩而不出现问题要困难得多。不幸的是，GPU 越强大，就需要越多的内存带宽来保持数据。

英伟达选择采用美光的 GDDR6X 技术，并在 GPU 上添加大量内存接口来解决这个问题。然而，这种 RAM 比标准 GDDR6 更贵，额外的接口只会使芯片尺寸更大。AMD 的方法是利用其 CPU 部门的缓存技术，并在其 RDNA2 芯片中注入大量 LLC。

通过这样做，对容纳快速 RAM 的宽内存总线的需求显著减少，所有这些都有助于控制 GPU 芯片尺寸和显卡价格。芯片尺寸在这里很重要，因为 Navi 21 本质上是两个 Navi 10（总共 80 个 CU），都被一堵缓存墙包围。

后者由 103 亿个晶体管组成，而新芯片容纳了这个数字的两倍多——268 亿个。额外的 62 亿美元主要用于所谓的无限缓存，尽管还有其他变化。AMD 对整个架构进行了重新调整和精简，使 RDNA 2 芯片能够以比其前身更高的时钟速率运行。

当然，如果最终产品不好，这些都无关紧要。尽管 Radeon RX 6900 XT 的售价为 1000 美元，但它提供了 GeForce RTX 3090 级别的性能，价格比它低 500 美元。它并不总是处于平均水平，根据所使用的游戏和分辨率，700 美元的 GeForce RTX 3080 也一样快。

在这个价位，AMD 的 Radeon RX 6800 XT 和 RX 6800 分别比 RTX 3080 低 50 美元和 120 美元。6800 和 RTX 3090 的性能相差近 30%，但价格相差 63%。AMD 可能没有赢得性能桂冠，但不可否认，在 GPU 价格无处不在的时候，这些产品仍然非常强大，物有所值。

但与此相反的是光线追踪性能。简言之，它远不如英伟达的 Ampere GPU 所实现的好，尽管考虑到这是 AMD 首次涉足物理正确光建模领域，其功能并不令人惊讶。

英伟达选择设计和实现两个大型定制 ASIC（专用集成电路），用于处理射线三角形相交和 BVH（边界体积层次结构）遍历计算，AMD 选择了一种更温和的方法。对于后者，将没有专门的硬件，通过计算单元处理例程。

这个决定是基于保持模具尺寸尽可能小。Navi 21 芯片相当大，面积为 521 平方毫米，虽然英伟达很乐意提供更大的处理器（RTX 3090 中的 GA102 面积为 628 平方毫米），但增加定制单元会使该领域更加突出。

同年 11 月，微软和索尼发布了他们的新 Xbox 和 PlayStation 游戏机，这两款游戏机都采用了定制的 AMD GPU（CPU 和 GPU 在同一个芯片中），它使用 RDNA 2 来处理图形方面的问题，不包括 Infinity Cache。由于需要保持这些芯片尽可能小，AMD 选择这一特定路线的原因变得非常清楚。

这一切都是为了改善其图形部门的财务状况。

资金和利润很重要

在 2021 年下半年之前，AMD 仅将其收入和营业收入数据分为两个部门：处理器和显卡，以及企业、嵌入式和半定制。笔记本电脑中显卡和独立 GPU 的销售收入流入前者，而 Xbox 和 PlayStation 主机的 APU 销售收入流入后者。

下图是 2018 年第一季度到 2021 年第一季度的营业利润率情况。

RDNA 于 2019 年第二季度推出，但这种销售的收入要到下个季度才会真正开始显现，因为只有两种型号的显卡安装了这种新芯片。我们无法判断运营利润率的增长是否得益于 GPU 架构，因为这些数据还包括 CPU 销售。

然而，从 2021 年第二季度开始，AMD 将报告部门重新划分为四个部门:数据中心、客户端、游戏和嵌入式。第三个部门涵盖了所有与 GPU 相关的内容，包括最终出现在主机中的 APU，并且画面更加清晰。

现在可以看到，AMD 的显卡部门的利润是四个部门中最弱的。AMD 曾表示，在 2022 财年，仅一家客户就贡献了该公司全部收入的六分之一，其他人猜测这家客户就是索尼。如果情况确实如此，那么 PlayStation 5 APU 的销售额就占了游戏行业收入的 50% 以上。

在那个财政年度，独立显卡的发货量急剧下降，毫无疑问，该部门的运营利润率是由游戏机销售保持的。AMD 使用台积电制造绝大部分芯片，但订单必须提前几个月下——如果处理器在制造后没有很快售出，它们必须留在配送中心，这损害了这段时间的利润率。

目前还没有足够的信息来判断 AMD 在 RDNA 上的投资是否盈利，因为不可能将对 Zen 的投资与数据中心和游戏的利润分开。但收入数据显示，在以上 6 个季度中，平均 16 亿美元的收入导致了平均 15% 的营业利润率——只有客户端部门低于这个数字，这主要是由于个人电脑销售的下滑。

与此同时，在同一时期，英伟达的图形部门 (包括台式机、笔记本电脑、工作站和汽车等的图形处理器) 平均每季度收入约为 36 亿美元，平均营业利润率为 43%。这家绿色巨头在独立 GPU 市场上的市场份额比 AMD 大，所以更高的收入数字并不令人惊讶，但营业利润率却令人大开眼界。

大部分 PS5 的 APU 是一个 RDNA2 GPU。来源：Fritzchen Fritz

但值得考虑的是，AMD 卖给微软和索尼的 APU 不会有很大的利润，因为如果他们有，你就不可能花 400 美元买到一台最新的游戏机了。一体机芯片的大规模生产有利于增加收入，但对直接利润的影响不大。

如果去掉主机芯片带来的收入，假设它们产生 10% 的利润，这就意味着 RDNA 产生了相当多的利润——运营利润率可能高达 20%。虽然比不上英伟达，但我们都知道为什么这家公司的利润率如此之高。

Chiplets 与计算

对于 AMD 来说，RDNA 2 无疑是一个工程上的成功，该设计在近 50 种不同的产品中得到了应用。然而，从财务角度来看，与其他领域相比，GPU 一直处于次优地位。与此同时，AMD 发布了对 RDNA 的首次更新，该公司还宣布了一种新的仅用于计算的架构，称为 CDNA。

这是 GCN 的哥斯拉，第一个使用该设计的芯片 (Arcturus) 拥有 128 个 CU，在 750 mm2 的芯片中。计算单元已经升级为专用矩阵单元 (类似于英伟达的 Tensor)，在接下来的一年里，AMD 将两个巨大的处理器装进了一个 724 平方毫米的芯片中。它的代号为 Alderbaran(下图)，很快成为许多超级计算机项目的首选 GPU。

回到游戏图形领域，AMD 希望更多地利用其 CPU 专长。RDNA 2 中的无限缓存是由于为其 Zen 处理器开发高密度 L3 缓存和无限 Fabric 互连系统而产生的。

因此，对于 RDNA 3 来说，很自然地，它将使用另一个 CPU 成功:chiplets。

但是怎么做呢? 在中央处理器中物理分离内核要容易得多，因为它们完全独立运行。在绝大多数 AMD 的台式 PC、工作站和服务器 cpu 中，你会发现至少有两个所谓的 chiplets:一个容纳核心 (核心复杂芯片，CCD)，另一个容纳所有输入/输出结构 (IOD)。它们之间的主要区别是 CCD 的数量。

在 GPU 中做这样的事情是一项艰巨得多的任务。Navi 21 GPU 是一个由四个独立处理器组成的大块，每个处理器包含 10 个 WGP、光栅化器、渲染后端和 L1 缓存。有人可能会认为这些将是分离成离散 chiplets 的理想选择，但是大量数据事务所需的互连系统将抵消任何成本节约，并增加了许多不必要的复杂性和功耗。

对于 RDNA 3, AMD 采取了一种更慎重的方法，一种产生于越来越小的工艺节点所面临的限制。当台积电等公司宣布一种新的制造工艺时，通常会提出更高的性能、更低的功耗和更高的晶体管密度。

然而，后者是一个整体数字——晶体管和其他与逻辑和处理相关的电路当然在继续缩小，但与信号和存储器有关的任何东西都没有缩小。SRAM 使用一组晶体管作为易失性存储器的一种形式，但这种排列不能像逻辑那样被压缩。

随着 USB、DRAM 等的信号传输速度不断提高，将这些电路更紧密地封装在一起会导致各种干扰问题。台积电的 N5 工艺节点的逻辑密度可能比 N7 高 20%，但 SRAM 和 IO 电路只好几个百分点。

这就是为什么 AMD 选择将 VRAM 接口和 L3 无限缓存推到一个芯片中，而将 GPU 的其余部分推到另一个芯片中。前者可以用更便宜、更不先进的工艺制造，而后者可以利用更好的东西。

2022 年 11 月，AMD 以 Navi 31 GPU 的形式推出了 RDNA 3。主芯片 (称为图形计算芯片，GCD) 是在台积电的 N5 工艺节点上制造的，包含 96 个计算单元，芯片面积仅为 150 平方毫米。围绕它的是 6 个内存缓存芯片 (MCD)，每个芯片只有 31mm2 的硅，包括 16MB 的无限缓存，两个 32 位 GDDR6 接口和一个无限链接系统。

如果 AMD 在 Navi 31 上坚持采用单片方法，那么整个芯片的尺寸可能只有 500 到 540 平方毫米左右，并且不需要在所有 chiplets 之间建立复杂的连接网络，那么将它们全部封装起来也会更便宜。

AMD 已经为这一切计划了很多年，所以它显然在盈利方面做得很好。这一切都源于晶圆产量和芯片制造成本的增加。让我们用一些估计的价格来强调这一点——用于制造 MCD 的单个 N6 晶圆可能是 12,000 美元，但它可以产生超过 1,500 个这样的芯片 (每个芯片 8 美元)。一块 1.6 万美元的 N5 晶圆可能生产 150 块 GCD，每个晶圆的价格为 107 美元。

将一张 GCD 与 6 张 MCD 组合在一起，在你需要将它们包装在一起的成本加进去之前，你需要花费 154 美元左右。另一方面，来自 N5 晶圆的单个 540 mm2 芯片的成本可能在 250 美元左右，因此使用 chiplets 的成本效益是显而易见的。

前沿与保守变革

与 RDNA 3 小片段的使用一样大胆，其余的更新则更为保守。寄存器文件以及 L0、L1 和 L2 缓存的大小都增加了，但是 L3 无限缓存的大小减小了。每个 SIMD 单元扩展到同时处理 64 个数据点，因此 wave64 处理现在是单周期的。

光线追踪性能得到了适度的提升，通过调整单元来提高光线三角形相交的吞吐量，但在这方面没有其他专门的硬件。CDNA 的矩阵单元也没有被复制到 RDNA 上——这样的操作仍然由计算单元处理，尽管 RDNA 3 确实有一个「人工智能加速器」(AMD 对这个单元的功能几乎没有说)。

新设计的处理性能引起了相当大的轰动，「双重问题」一词被广为流传。当使用时，它允许 SIMD 单元同时评估两条指令，AMD 的营销部门通过声明 RDNA 2 的峰值 FP32 吞吐量加倍来证明这一点。

唯一的问题是，执行双重指令的能力严重依赖于编译器 (将程序代码转换为 GPU 操作的驱动程序中的程序) 能够发现何时可能发生这种情况。编译器在这方面做得并不好，通常需要训练有素的人眼输入才能获得最佳结果。

搭载 RNDA 3 芯片的最强大显卡是 Radeon RX 7900 XTX，它一上市就受到了好评，价格为 1000 美元。虽然通常不如英伟达的 GeForce RTX 4090 快，但它肯定可以与 RTX 4080 相媲美，从那以后的几个月里，AMD 的降价使它成为一个更好的选择。

光线追踪再一次不是一个优势，尽管声称提高了电源效率，但许多人对 Navi 31 所需的电量感到惊讶，尤其是在空闲时。虽然它确实比以前的 Navi 21 需要更少的功率，但对 Infinity Link 系统的需求部分抵消了使用更好的处理节点所带来的好处。

与 RDNA 2 相比，另一个不足之处是产品范围的广度。在撰写本文时，RDNA 3 可以在 18 个不同的产品中找到，尽管市场状况可能迫使 AMD 在这件事上采取行动。

对一些人来说，更糟糕的是，当中低端 RDNA 3 显卡最终出现时，它们相对于旧设计的性能改进有些被低估了——以 Radeon RX 7800 XT 为例，它只比即将推出的 RX 6800 XT 快了几个百分点。

chiplets 的使用似乎并没有给 AMD 的营业利润率带来多少好处。在 RDNA 3 出现后的三个季度中，游戏部门的收入和利润率基本保持不变。当然，新的 GPU 实际上有可能有所改善，因为如果控制台 APU 销量下降，那么财务状况保持不变的唯一途径似乎是 GPU 变得更有利可图。

然而，AMD 不再只向微软和索尼销售 APU。掌上电脑，如 Valve 的 Steam Deck，越来越受欢迎，由于所有这些电脑都配备了 AMD 芯片，这些销售额将为游戏部门的银行余额做出贡献。

RDNA 的未来

如果盘点一下 AMD 在四年时间里通过 RDNA 所取得的成就，并评估这些变化的总体成功，最终结果将从 Bulldozer 和 Zen 之间得出。前者最初对该公司来说是一场近乎灾难性的产品，但多年来因制造成本低廉而挽回了自己。另一方面，Zen 从一开始就表现出色，并迫使整个 CPU 市场发生了翻天覆地的变化。

在这段时间里，AMD 在独立 GPU 领域的市场份额略有波动，有时会超过英伟达，有时会失去，但总的来说，它保持不变。

自成立以来，游戏部门已经获得了少量但稳定的利润，尽管利润率目前似乎在下降，但没有迹象表明厄运即将来临。事实上，仅就利润率而言，这是 AMD 第二好的部门。即使不是这样，AMD 从嵌入式业务中赚取的现金 (多亏了收购赛灵思) 也绰绰有余，足以避免任何短期的整体亏损。

但 AMD 接下来将走向何方?

只有三种前进的道路:第一种是保持目前的小架构更新进程，继续积累微薄的利润，并保持整个 GPU 市场的一小部分。第二种是放弃高端桌面 GPU 领域，完全专注于主导预算和低端市场，专注于进一步缩 chiplet 尺寸和提高晶圆产量的技术。

第三条路线与第二条截然相反——忘记「物有所值」和拥有一个可以扩展到所有可能级别的架构，并尽一切努力确保它是 Radeon 显卡，而不是 GeForce 显卡，在每个性能图表中都名列前茅。

来源：Fritzchen Fritz

英伟达在 RTX 4090 上实现了这一点，因为它使用了台积电最好的工艺节点，就着色单元而言，它是能买到的最大的消费级 GPU。没有什么花哨的把戏——这是一种蛮力的方法，而且效果很好。RTX 4080 中的整个 AD103 芯片仅比 Navi 31 中的 GCD 大 20%，并且具有相当相似的性能。

然而，RDNA 一直致力于最大限度地利用现有的处理能力。RDNA 2/3 中缓存系统的复杂性证明了这一点，因为英特尔和英伟达在他们的 GPU 中使用了更简单的结构。

说到缓存，决定将大量的最后一级缓存插入 RDNA GPU 以抵消对超高速 VRAM 的需求，并提高光线追踪性能，几乎可以肯定是英伟达在 Ada Lovelace 架构上做同样事情的灵感。

现在正处于 GPU 发展的一个阶段，不同厂商设计图形处理器的差异相对较小，仅从架构设计就能看到性能的巨大改进的日子已经一去不复返了。

未来的 RDNA GPU 会像英特尔的 Ponte Vecchio 一样多的芯片吗?

如果 AMD 想要独占鳌头，它就需要推出一款拥有比我们目前看到的更多计算单元的 RDNA GPU。或者只是更有能力的—RDNA 3 中 SIMD 单元的变化可能是一个信号，表明在下一个版本中，我们可能会看到 CU 使用四个 SIMD 而不是两个，以消除所有的双重发行限制。

但即便如此，AMD 仍需要拥有更多的 CU，而实现这一目标的唯一途径是拥有更大的 GCD，这意味着接受更低的产量或将芯片转移到更好的工艺节点上。当然，这两项都会影响利润率，而且与英伟达不同，AMD 似乎不愿将 GPU 价格推高。

它也不太可能采取第二条路线，因为一旦完成了这一点，就几乎没有机会回来了。GPU 的历史上有很多公司尝试过，失败过，一旦他们停止了在高端市场的竞争，就永远消失了。

这就剩下了一个选择——继续当前的行动方针。在架构方面，英伟达已经对其着色器内核进行了多年的重制，只有过去两代才显示出许多相似之处。它还在开发和营销机器学习和光线追踪功能方面投入了大量资源，前者与 GeForce 品牌有着独特的联系。

AMD 多年来开发了许多技术，但在 RDNA 时代，它们都没有特别要求 Radeon 显卡来使用它们。凭借其 Zen 架构和其他 CPU 发明，AMD 将计算世界带入了未来，迫使英特尔提高其游戏水平。它为大众带来了高能效的多线程处理——不是通过成为英特尔的廉价替代品，而是通过竞争。胜利，迎头而上。

不可否认，RDNA 是一个成功的设计，因为它的使用是如此广泛，但它肯定不是 Zen。如果游戏行业想要发展的话，仅仅做到物有所值或者以开源方式获得社区的喜爱是不够的。AMD 似乎拥有实现这一目标的所有工程技术和诀窍;他们是否会冒险完全是另一回事。

俗话说，幸运眷顾勇者。

新闻中心