注册登录

EETOP 创芯网论坛 (原名：电子顶级开发网) 返回首页

xf2016的个人空间 https://blog.eetop.cn/?1536195 [收藏] [复制] [分享] [RSS]

日志

DDR4 PHY的training实现过程

热度 14已有 980 次阅读| 2025-7-4 17:31 |个人分类:ＤＤＲ　ＰＨＹ|系统分类:芯片设计| ＰＨＹ

根据dwc_ddr54_phy_tsmc7ff18_databook文档内容，PHY 的 training（训练）实现过程是一个由硬件加速引擎和固件协同完成的精密校准流程，主要涉及阻抗匹配和时序校准两大核心功能。以下是详细的实现过程解析：

一、Training 的总体框架

PHY 的 training 由 PHY Utility Block (PUB) 中的嵌入式微控制器（uCtl）协调执行，依赖 MASTER、ACX4 和 DBYTE 硬宏的专用硬件资源。整个过程分为：

阻抗校准（输出驱动与终端电阻匹配）
时序校准（数据眼中心对齐、读写延迟补偿）
多状态保存（支持 ≤4 组频率/配置的快速切换）

二、关键模块的协同作用

1. MASTER 模块：基准生成与全局校准

阻抗校准引擎

流程：
a. 通过外部精密电阻（BP_ZN）校准驱动器的上拉电阻（Pull-Up）。
b. 用已校准的上拉电阻作为基准，校准下拉电阻（Pull-Down）。
c. 通过数字状态机（PUB 控制）将校准码分发到所有 I/O 单元。
硬件支持：

dwc_ddrphy_cmpana 比较器模块（图 8-5）执行电压比较。
calDrvPU/calDrvPD 输入校准码，Cmpana_Out 输出比较结果。

PHY 框图.png

　　　　　　　　　　　　　　　　　　　ＰＨＹ　内部框图

参考电压生成

dwc_ddrphy_vrefglobal 生成全局参考电压 VrefGlobal，供接收器使用（表 8-8）。

2. DBYTE 模块：数据通道的动态校准

接收时序校准（Read Training）

BDL 延迟线：每个 DQ 位有独立的可调延迟（RxPhase<6:0>），用于补偿 DQ-DQS 偏移。
DFE 均衡：通过 csrDfeCtrl_b0/b1 配置决策反馈均衡器（1-tap for DDR4, 2-tap for DDR5），优化数据眼（图 8-8）。
DQS 采样：RxClk0_DqsSampPosRxEn 等信号捕获 DQS 边沿位置（表 5-7）。

发送时序校准（Write Training）

LCDL 延迟线：通过 TxDllPhaseIn 控制写入数据（DQ）和选通信号（DQS）的相对延迟（表 5-9）。
驱动强度控制：csrTxStrenEqHiPu_b0 等信号调节预加重，改善信号完整性。

3. ACX4 模块：地址/命令的时序对齐

时钟与命令对齐

TxDllPhaseIn 延迟链调整 MEMCLK 与命令信号的相位，确保时钟中心对齐数据眼（4.10 节）。
支持 DDR4 的 Write Leveling 和 DDR5 的 per-rank 时序训练（1.3.5 节）。

三、Training 流程详解

步骤 1：初始化与阻抗校准

PUB 通过 APB 接口配置 MASTER 的校准寄存器（csrPllEnCal）。
MASTER 启用 cmpana 比较器，执行以下序列：

校准比较器内部偏移（Cmpdig_CalCmpr）。
用外部电阻校准上拉电阻（Cmpdig_CalExt）。
用上拉电阻基准校准下拉电阻（Cmpdig_CalInt）。

校准码通过 calDrvPU/calDrvPD 分发至所有 DBYTE 和 ACX4 的 I/O 单元。

步骤 2：时序校准（固件控制）

读取训练

PUB 发送伪随机序列（PRBS）到 DRAM，并启动接收路径：
a. 调整 RxPhase 延迟码，扫描 DQ 采样点。
b. 通过 csrDfeCtrl 启用 DFE 均衡器，优化信号幅值（表 8-9）。
c. 用 RxClkX_DqsSampNegRxEn 捕获 DQS 边沿位置（表 5-7）。

写入训练

PUB 控制 DBYTE 发送测试模式：
a. 通过 TxDllPhaseIn 调整 DQ 和 DQS 的相位差（表 4-10）。
b. 使用 csrTxStrenEqHiPu 调节预加重，抑制码间干扰。

多频率状态保存

校准结果（阻抗码、延迟值、均衡设置）存入 PUB 的 CSR 寄存器，支持 ≤4 组配置（1.3.3 节）。
频率切换时（如 DDR4 3200Mbps → DDR5 4800Mbps），通过 DFI_PHYUPDATE 信号在 <5μs 内加载新配置（1.3.1 节）。

步骤 3：抗老化与温度跟踪

NBTI/HCI 补偿：定期重校准阻抗码，抵消晶体管老化效应（1.3.1 节）。
温度跟踪：内置传感器触发周期性校准（2.7.3 节）。

四、关键创新与性能

硬件加速：专用校准引擎（MASTER）和延迟线（DBYTE/ACX4）提升训练速度。
低延迟切换：多状态配置支持 <5μs 频率切换（DDR4 模式）。
信号完整性优化：DFE 均衡 + 可调预加重，支持最高 DDR5 4800Mbps（表 7-20）。
生产测试支持：集成 Loopback/PRBS 检测路径，简化 ATE 测试（1.1 节）。

总结

PHY 的 training 是一个高度自动化的闭环过程：

MASTER 提供全局基准（阻抗/电压）；
PUB 固件协调训练算法；
DBYTE/ACX4 执行 per-bit 时序微调。
通过多级校准和状态保存，PHY 在保证信号完整性的同时，实现了对电压/温度漂移和老化效应的鲁棒性，满足 JEDEC DDR5/4 的严苛要求（1.4 节）。

刚表态过的朋友 (3 人)

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (1 个评论)

回复 msbmsbmsb 2025-9-16 16:14: 学习一下，谢谢

xf2016

0
周排名
0
月排名
11
总排名
0
关注
6
粉丝
6
好友
21
获赞
4
评论
51
访问数

关闭

站长推荐 /1

手机版| 小黑屋| 关于我们| 联系我们| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号京公网安备:11010502037710 )

GMT+8, 2025-9-29 06:13 , Processed in 0.016198 second(s), 9 queries , Gzip On, Redis On.

eetop公众号

创芯大讲堂

创芯人才网

返回顶部