日志

性能好于台积电3纳米！英特尔公布Intel 4工艺技术细节

已有 1569 次阅读| 2022-6-21 12:07 |系统分类:芯片设计

来源：semiwiki 作者：Scotten Jones 编译：EETOP

原文：

https://semiwiki.com/semiconductor-manufacturers/intel/314047-intel-4-presented-at-vlsi/

英特尔将在 VLSI 技术会议上展示他们的Intel 4工艺。近期，来自英特尔的 Bernhard Sell (Ben) 向媒体简要介绍了Intel 4这一工艺，并为我们提供了早期访问该论文的机会。

“Intel 4 CMOS 技术采用先进的 FinFET 晶体管，针对高密度和高性能计算进行了优化。”

该论文包括判断工艺密度所需的关键间距，性能数据显示在具有实际单位的图上，并且讨论提供了有关工艺的有用信息。

英特尔已经公布了未来四个节点（Intel 4、3、20A 和 18A）的路线图，其中包含日期、设备类型和性能改进目标。他们现在正在提供有关Intel 4的更多详细信息。相比之下，三星面临着从 3nm 开始的风险，并且已经披露了 PPA（功率、性能和面积）目标，但没有其他细节，对于 2nm，他们已经披露这将是他们的第三个新一代 Gate All Around (GAA) 技术将于 2025 年到期，但没有性能目标。台积电已经披露了目前处于风险启动中的 3nm 的 PPA，对于 2nm，风险启动日期已经披露，但没有关于性能或设备类型的信息。

在深入了解 Intel 4 的细节之前，我想评论一下这个制程的目标。当我们仔细研究细节时，很明显这个过程是针对英特尔内部用于制造计算块（compute tiles）的，它不是一个通用的代工工艺。

Intel 4 将于今年晚些时候发布，Intel 3 将于明年发布；Intel 3 是英特尔代工服务的重点。具体来说，Intel 4 没有I/O Fin，因为在仅与基板上的其他芯片通信的计算块上，这毫无用处。并且Intel 4 仅提供高性能单元并且没有高密度单元。Intel 3 将提供 I/O Fin和高密度单元，以及更多的 EUV 使用和更好的晶体管和互连。Intel 3 旨在成为Intel 4 的简单端口。

Intel 4 使用目标

在深入了解 Intel 4 的细节之前，我想评论一下这个工艺制程的目标。当我们了解细节时，很明显这个过程是针对英特尔内部用于制造计算块（compute tiles）的，它不是一个通用的代工工艺。Intel 4将于今年晚些时候发布，Intel 3将于明年发布；Intel 3是英特尔代工服务的重点。具体来说，Intel 4没有 I/O 鳍，因为它们不需要在仅与基板上的其他芯片通信的计算块上，并且Intel 4仅提供高性能单元并且没有高密度单元。Intel 3 将提供 I/O 鳍片和高密度单元，以及更多的 EUV 使用和更好的晶体管和互连。

工艺密度

任何读过我以前的文章和比较的人都知道我非常强调密度。在 Intel 4 论文的图 1 中，他们披露了 Intel 4 的关键间距并将其与 Intel 7 进行比较，见图 1。

图 1. Intel 4 与 7 间距

Intel 7的高性能单元高度 (CH) 为 408 纳米，Intel 4为 240 纳米。Intel 7 的 Contacted Poly Pitch (CPP) 为 60，Intel 4 为 50，Intel 7 的 CH 和 CPP 的乘积为 24,480nm 2，Intel 4 为12,000nm 2，为高性能提供了约 2 倍的密度提升单元。与 Intel 7 相比，Intel 4 的每wall性能提高了 20%，高密度 SRAM 扩展了 0.77 倍。

为了更好地了解英特尔最近的工艺进展是有用的。我们给出了四代英特尔 10nm 工艺总结，如图2。

图 2. Intel 10nm

TechInsights 于 2018 年 7 月首次分析了英特尔 10nm，并将其称为第 1 代， TechInsights 于 2019 年 12 月完成的另一次 10nm 分析，发现相同的密度但不同的鳍片结构，我们将其称为第 2 代。2021 年 1 月，TechInsights 分析了 10nm Super Fin 部件提供 60nm CPP 选项以提高性能以及原始 54nm CPP（第 3 代）。最终在 2022 年 1 月，TechInsights 分析了 10nm 增强型 Super Fin 部件，英特尔现在称之为Intel 7（10nm 第 4 代）。关于Intel 7分析结果的一件有趣的事情是 TechInsights 仅在逻辑区域发现 60nm CPP，没有 54nm CPP 和更高的单元。

我描述工艺密度的政策是以工艺上可用的最密集的单元为基础。对Intel 7来说，高272纳米的54纳米CPP单元是 "可用的"，但没有使用，而高408纳米的单元与60纳米的CPP产生的晶体管密度为每平方毫米约6500万个晶体管（Mtx/mm2）。因此，我们如何将英特尔4号与前几代工艺和即将推出的英特尔3号工艺相比较，见图3。我表征工艺密度的策略是基于工艺中可用的最密集单元。对于 Intel 7，272nm 高的 54nm CPP 单元“可用”但未使用，而 408nm 高单元和 60nm CPP 产生的晶体管密度为每平方毫米约 6500 万个晶体管，而前几代约为 100 MTx/mm²。那么我们如何将Intel 4与上一代工艺和即将推出的Intel 3工艺进行对比，见图 3。

图 3. 英特尔密度比较

在图 3 中，我分别展示了高密度和高性能单元密度。正如英特尔所披露的，Intel 4的高性能单元密度约为Intel 7的 2 倍。与Intel 4相比，Intel 3应该具有更高密度的库。如果我假设Intel 3 的间距相同但轨道高度更小，那么与Intel 10/7相比，我得到的高性能单元密度约为 1.07 倍，高密度单元的密度约为 1.4 倍。

另一个有趣的比较是Intel 4 高性能单元尺寸与 TSMC 5nm 和 3nm 的高性能单元尺寸，见图 4。

图 4. Intel 4 与 TSMC N3 和 N5 高性能单元

TSMC N5 具有 51nm CPP 和 34nm M2P 以及 9.00 轨（track）高性能单元，可产生 306nm CH 和 15,606nm² CPP x CH。我们相信台积电 N3 具有 45nm CPP 和 28nm M2P，以及 9.00 轨道的高性能单元，可产生 252nm 的 CH 和 11,340nm 2的CPP x CH 。

对于 Intel 4，CPP 为 50nm，M2P 为 45nm（在简报中披露，但未在论文中），对于引用的 240nm CH 和 CPP x CH 为 12,000nm²，这产生的轨道高度仅为 5.33. 这些值与 4 名称一致，因为它位于领先的代工公司台积电的 N5 和 N3 之间，想比台积电 N5 ，Intel 4更接近台积电 N3。我们也相信 Intel 4 的性能会略好于台积电 N3。

令我惊讶的是，英特尔的高性能单元的高度刚好超过 5 条轨道，但这是公开的单元高度和 M2P 的数学计算。

DTCO

从设计-技术-协同优化 (DTCO) 的角度来看，Intel 4比Intel 7有 3 项改进：

Contact Over Active Gate 针对 Intel 4 进行了优化。
去除伪栅极的扩散中断过去需要两个伪栅极（双扩散中断），Intel 7 变为 1（单扩散中断）。
n 到 p 间距曾经是两个鳍片间距，现在是 1 个鳍片间距。当我们在 M2P 和轨道方面谈论 CH 时，很容易忘记设备必须适应相同的高度，图 5 说明了 n 到 p 间距如何影响单元高度。

图 5. 像元高度 (CH) 缩放

在简报问答中，有一个关于每个晶体管成本的问题，Ben 说Intel 4与Intel 7相比，每个晶体管的成本下降了。

性能表现

Intel 10/7 提供 2 个阈值电压（2 个 PMOS 和 2 个 NMOS = 总共 4 个）和 3 个阈值电压（3 个 PMOS 和 3 个 NMOS = 总共 6 个）版本。Intel 4 提供 4 个阈值电压（4 个 PMOS 和 3 个 NMOS = 8 个）。这导致功耗降低约 40%，性能提高约 20%。

我相信简报中提到的驱动电流值对于 PMOS 是 2mA/μm，对于 NMOS是 2.5mA/μm。

EUV 使用

EUV 用于工艺的后端和前端。英特尔将 EUV 的使用重点放在了单次 EUV 曝光可以取代多次浸没式曝光的地方。尽管 EUV 曝光比浸入式曝光更昂贵，但用相关的沉积和蚀刻步骤代替多次浸入式曝光可以节省成本，提高周期时间和产量。事实上，Ben 提到单次 EUV 曝光导致 EUV 取代的部分中的步骤减少了 3-5 倍。Intel 7到Intel 4看到掩码和步数减少。在生产线的前端，EUV 专注于替换复杂的切割、栅极或接触。英特尔没有明确披露 EUV 用于鳍片图案化，但我们认为Intel 7片鳍片图案化涉及一个心轴掩模（英特尔称其为光栅掩模）和 3 个切割掩模（英特尔称这些掩模掩模）。对于 Intel 4，这可以很容易地转换为 4 cut mask。没有提到用单个 EUV 掩模替换 4 个切割掩模的层，我们相信这可能就是发生这种情况的地方。

在论文中，英特尔提到 M0 是四重图案。对于英特尔 10/7，英特尔还披露了四重图案化，TechInsights 分析表明需要 3 个块掩模。Intel 4可能需要 4 个用于 M0 的块掩模，这可能是 EUV 消除 4 个切割/块掩模的另一个地方。

网格布局用于互连以提高产量和性能。

我们相信在这个过程中使用了大约 12 次 EUV 曝光，但英特尔没有透露这一点。

互连

众所周知，英特尔在 10nm 时为 M0 和 M1 选择了钴 (Co)。Co 提供比铜 (Cu) 更好的电迁移电阻，但电阻更高（作者指出，金属的电迁移电阻与熔点成正比）。对于英特尔 4，英特尔采用了“增强型”铜方案，其中纯铜被包裹在钴中（过去英特尔掺杂铜）。将 Cu 封装在 Co 中的典型流程是用 Co 层放置阻挡层，作为电镀的种子。一旦电镀完成并平坦化以形成互连，Cu 就会被 Co 覆盖。该过程导致电迁移电阻与 Co 相比略有下降，但仍高于 10 年寿命目标，并且线路的电阻降低。事实上，即使 Intel 4 的互连线比 Intel 7 的互连线更窄，RC 值仍然保持不变。

该工艺有 5 个增强铜层、2 个巨型金属层和 11 个“标准”金属层，共 18 层。

MIM caps

随着电力传输的重要性日益增加，金属-绝缘体-金属 (MIM) 电容器被用于减少功率波动，并不断得到改进。对于英特尔的 14nm 工艺，实现了 37 fF/μm 2，10nm 提高到 141 fF/μm 2 ，Intel 7提高到193 fF/μm 2 ，现在Intel 4提高了约 2 倍，达到 376 fF/μm 2。更高的值使 MIM 电容器具有更大的电容，从而提高功率稳定性，而不会占用过多的空间。

生产基地

在问答环节中，Ben 还被问及生产地点。他说，最初的生产将在Hillsboro，然后是爱尔兰。他说他们没有透露除此之外的其他生产计划。

我们相信英特尔目前拥有约 10 到 12 个 EUV 设备，直到最近它们都在 Hillsboro。其中一个设备现已移至爱尔兰的 Fab 34，我们相信，随着英特尔今年收到更多 EUV设备，他们将能够扩大 Fab 34。今年晚些时候，我们预计以色列的 Fab 38 将开始加速生产，我们相信这将成为下一个英特尔 4/3 生产基地。随后在 2023 年下半年，亚利桑那州的 Fab 52 和 62 应该开始接收 EUV设备。

产量和准备情况

在整个简报中，我们听到的关于产量的一切都是“健康的”和“按计划进行的”。Meteor Lake 计算块已启动并在进程中运行。该工艺已准备好在明年下半年生产。

结论

我对这个过程印象深刻。我越是将它与台积电和三星的产品进行比较，我的印象就越深刻。在 2000 年代和 2010 年代初，英特尔是逻辑处理技术的领导者，之后三星和台积电以卓越的执行力领先。如果英特尔继续走上正轨并在明年发布Intel 3，他们将拥有一个在密度上具有竞争力并且可能在性能上处于领先地位的代工工艺。英特尔还制定了 2024 年英特尔 20A 和 18A 的路线图。三星和台积电都将在 2024/2025 年推出 2nm 工艺，它们需要在 3nm 工艺上进行重大改进，以跟上英特尔的步伐。