| |||
根据dwc_ddr54_phy_tsmc7ff18_databook文档内容,PHY 的 training(训练)实现过程是一个由硬件加速引擎和固件协同完成的精密校准流程,主要涉及阻抗匹配和时序校准两大核心功能。以下是详细的实现过程解析:
一、Training 的总体框架
PHY 的 training 由 PHY Utility Block (PUB) 中的嵌入式微控制器(uCtl)协调执行,依赖 MASTER、ACX4 和 DBYTE 硬宏的专用硬件资源。整个过程分为:
阻抗校准(输出驱动与终端电阻匹配)
时序校准(数据眼中心对齐、读写延迟补偿)
多状态保存(支持 ≤4 组频率/配置的快速切换)
二、关键模块的协同作用
1. MASTER 模块:基准生成与全局校准
阻抗校准引擎
流程:
a. 通过外部精密电阻(BP_ZN)校准驱动器的上拉电阻(Pull-Up)。
b. 用已校准的上拉电阻作为基准,校准下拉电阻(Pull-Down)。
c. 通过数字状态机(PUB 控制)将校准码分发到所有 I/O 单元。
硬件支持:
dwc_ddrphy_cmpana 比较器模块(图 8-5)执行电压比较。
calDrvPU/calDrvPD 输入校准码,Cmpana_Out 输出比较结果。
PHY 内部框图
参考电压生成
dwc_ddrphy_vrefglobal 生成全局参考电压 VrefGlobal,供接收器使用(表 8-8)。
2. DBYTE 模块:数据通道的动态校准
接收时序校准(Read Training)
BDL 延迟线:每个 DQ 位有独立的可调延迟(RxPhase<6:0>),用于补偿 DQ-DQS 偏移。
DFE 均衡:通过 csrDfeCtrl_b0/b1 配置决策反馈均衡器(1-tap for DDR4, 2-tap for DDR5),优化数据眼(图 8-8)。
DQS 采样:RxClk0_DqsSampPosRxEn 等信号捕获 DQS 边沿位置(表 5-7)。
发送时序校准(Write Training)
LCDL 延迟线:通过 TxDllPhaseIn 控制写入数据(DQ)和选通信号(DQS)的相对延迟(表 5-9)。
驱动强度控制:csrTxStrenEqHiPu_b0 等信号调节预加重,改善信号完整性。
3. ACX4 模块:地址/命令的时序对齐
时钟与命令对齐
TxDllPhaseIn 延迟链调整 MEMCLK 与命令信号的相位,确保时钟中心对齐数据眼(4.10 节)。
支持 DDR4 的 Write Leveling 和 DDR5 的 per-rank 时序训练(1.3.5 节)。
三、Training 流程详解
步骤 1:初始化与阻抗校准
PUB 通过 APB 接口配置 MASTER 的校准寄存器(csrPllEnCal)。
MASTER 启用 cmpana 比较器,执行以下序列:
校准比较器内部偏移(Cmpdig_CalCmpr)。
用外部电阻校准上拉电阻(Cmpdig_CalExt)。
用上拉电阻基准校准下拉电阻(Cmpdig_CalInt)。
校准码通过 calDrvPU/calDrvPD 分发至所有 DBYTE 和 ACX4 的 I/O 单元。
步骤 2:时序校准(固件控制)
读取训练
PUB 发送伪随机序列(PRBS)到 DRAM,并启动接收路径:
a. 调整 RxPhase 延迟码,扫描 DQ 采样点。
b. 通过 csrDfeCtrl 启用 DFE 均衡器,优化信号幅值(表 8-9)。
c. 用 RxClkX_DqsSampNegRxEn 捕获 DQS 边沿位置(表 5-7)。
写入训练
PUB 控制 DBYTE 发送测试模式:
a. 通过 TxDllPhaseIn 调整 DQ 和 DQS 的相位差(表 4-10)。
b. 使用 csrTxStrenEqHiPu 调节预加重,抑制码间干扰。
多频率状态保存
校准结果(阻抗码、延迟值、均衡设置)存入 PUB 的 CSR 寄存器,支持 ≤4 组配置(1.3.3 节)。
频率切换时(如 DDR4 3200Mbps → DDR5 4800Mbps),通过 DFI_PHYUPDATE 信号在 <5μs 内加载新配置(1.3.1 节)。
步骤 3:抗老化与温度跟踪
NBTI/HCI 补偿:定期重校准阻抗码,抵消晶体管老化效应(1.3.1 节)。
温度跟踪:内置传感器触发周期性校准(2.7.3 节)。
四、关键创新与性能
硬件加速:专用校准引擎(MASTER)和延迟线(DBYTE/ACX4)提升训练速度。
低延迟切换:多状态配置支持 <5μs 频率切换(DDR4 模式)。
信号完整性优化:DFE 均衡 + 可调预加重,支持最高 DDR5 4800Mbps(表 7-20)。
生产测试支持:集成 Loopback/PRBS 检测路径,简化 ATE 测试(1.1 节)。
总结
PHY 的 training 是一个高度自动化的闭环过程:
MASTER 提供全局基准(阻抗/电压);
PUB 固件 协调训练算法;
DBYTE/ACX4 执行 per-bit 时序微调。
通过多级校准和状态保存,PHY 在保证信号完整性的同时,实现了对电压/温度漂移和老化效应的鲁棒性,满足 JEDEC DDR5/4 的严苛要求(1.4 节)。