xf2016的个人空间 https://blog.eetop.cn/1536195 [收藏] [复制] [分享] [RSS]

空间首页 动态 记录 日志 相册 主题 分享 留言板 个人资料

日志

DDR4 PHY的training实现过程

已有 141 次阅读| 2025-7-4 17:31 |个人分类:DDR PHY|系统分类:芯片设计| PHY

根据dwc_ddr54_phy_tsmc7ff18_databook文档内容,PHY 的 training(训练)实现过程是一个由硬件加速引擎和固件协同完成的精密校准流程,主要涉及阻抗匹配时序校准两大核心功能。以下是详细的实现过程解析:

 

一、Training 的总体框架

PHY 的 training 由 PHY Utility Block (PUB) 中的嵌入式微控制器(uCtl)协调执行,依赖 MASTER、ACX4 和 DBYTE 硬宏的专用硬件资源。整个过程分为:

  1. 阻抗校准(输出驱动与终端电阻匹配)

  2. 时序校准(数据眼中心对齐、读写延迟补偿)

  3. 多状态保存(支持 ≤4 组频率/配置的快速切换)

二、关键模块的协同作用

1. MASTER 模块:基准生成与全局校准

  • 阻抗校准引擎

    • 流程
            a. 通过外部精密电阻(BP_ZN)校准驱动器的上拉电阻(Pull-Up)。
            b. 用已校准的上拉电阻作为基准,校准下拉电阻(Pull-Down)。
            c. 通过数字状态机(PUB 控制)将校准码分发到所有 I/O 单元。

    • 硬件支持

      • dwc_ddrphy_cmpana        比较器模块(图 8-5)执行电压比较。

      • calDrvPU/calDrvPD        输入校准码,Cmpana_Out 输出比较结果。

PHY 框图.png

                   PHY 内部框图



  • 参考电压生成

    • dwc_ddrphy_vrefglobal       生成全局参考电压 VrefGlobal,供接收器使用(表 8-8)。

2. DBYTE 模块:数据通道的动态校准

  • 接收时序校准(Read Training)

    • BDL 延迟线:每个 DQ 位有独立的可调延迟(RxPhase<6:0>),用于补偿 DQ-DQS 偏移。

    • DFE 均衡:通过 csrDfeCtrl_b0/b1 配置决策反馈均衡器(1-tap for       DDR4, 2-tap for DDR5),优化数据眼(图 8-8)。

    • DQS 采样:RxClk0_DqsSampPosRxEn 等信号捕获 DQS 边沿位置(表 5-7)。

  • 发送时序校准(Write Training)

    • LCDL 延迟线:通过 TxDllPhaseIn 控制写入数据(DQ)和选通信号(DQS)的相对延迟(表 5-9)。

    • 驱动强度控制:csrTxStrenEqHiPu_b0 等信号调节预加重,改善信号完整性。

3. ACX4 模块:地址/命令的时序对齐

  • 时钟与命令对齐

    • TxDllPhaseIn       延迟链调整 MEMCLK 与命令信号的相位,确保时钟中心对齐数据眼(4.10 节)。

    • 支持 DDR4 的 Write Leveling 和 DDR5 的 per-rank 时序训练(1.3.5 节)。

三、Training 流程详解

步骤 1:初始化与阻抗校准

  1. PUB 通过 APB 接口配置 MASTER 的校准寄存器(csrPllEnCal)。

  2. MASTER 启用 cmpana 比较器,执行以下序列:

    • 校准比较器内部偏移(Cmpdig_CalCmpr)。

    • 用外部电阻校准上拉电阻(Cmpdig_CalExt)。

    • 用上拉电阻基准校准下拉电阻(Cmpdig_CalInt)。

  3. 校准码通过 calDrvPU/calDrvPD      分发至所有 DBYTE 和 ACX4 的 I/O 单元。

步骤 2:时序校准(固件控制)

  • 读取训练

    • PUB 发送伪随机序列(PRBS)到 DRAM,并启动接收路径:
            a. 调整 RxPhase 延迟码,扫描 DQ 采样点。
            b. 通过 csrDfeCtrl 启用 DFE 均衡器,优化信号幅值(表 8-9)。
            c. 用 RxClkX_DqsSampNegRxEn 捕获 DQS 边沿位置(表 5-7)。

  • 写入训练

    • PUB 控制 DBYTE 发送测试模式:
            a. 通过 TxDllPhaseIn 调整 DQ 和 DQS 的相位差(表 4-10)。
            b. 使用 csrTxStrenEqHiPu 调节预加重,抑制码间干扰。

  • 多频率状态保存

    • 校准结果(阻抗码、延迟值、均衡设置)存入 PUB 的 CSR 寄存器,支持 ≤4 组配置(1.3.3 节)。

    • 频率切换时(如       DDR4 3200Mbps → DDR5 4800Mbps),通过 DFI_PHYUPDATE 信号在 <5μs 内加载新配置(1.3.1 节)。

步骤 3:抗老化与温度跟踪

  • NBTI/HCI 补偿:定期重校准阻抗码,抵消晶体管老化效应(1.3.1 节)。

  • 温度跟踪:内置传感器触发周期性校准(2.7.3 节)。

 

四、关键创新与性能

  1. 硬件加速:专用校准引擎(MASTER)和延迟线(DBYTE/ACX4)提升训练速度。

  2. 低延迟切换:多状态配置支持 <5μs 频率切换(DDR4 模式)。

  3. 信号完整性优化:DFE 均衡 + 可调预加重,支持最高 DDR5 4800Mbps(表 7-20)。

  4. 生产测试支持:集成 Loopback/PRBS 检测路径,简化      ATE 测试(1.1 节)。

 

总结

PHY 的 training 是一个高度自动化的闭环过程:

  1. MASTER 提供全局基准(阻抗/电压);

  2. PUB 固件 协调训练算法;

  3. DBYTE/ACX4 执行 per-bit 时序微调。
         通过多级校准和状态保存,PHY 在保证信号完整性的同时,实现了对电压/温度漂移和老化效应的鲁棒性,满足 JEDEC DDR5/4 的严苛要求(1.4 节)。

 



点赞

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 注册

  • 关注TA
  • 加好友
  • 联系TA
  • 5

    周排名
  • 1

    月排名
  • 10

    总排名
  • 0

    关注
  • 2

    粉丝
  • 1

    好友
  • 4

    获赞
  • 1

    评论
  • 21

    访问数
关闭

站长推荐 上一条 /1 下一条

小黑屋| 手机版| 关于我们| 联系我们| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 )

GMT+8, 2025-7-5 19:42 , Processed in 0.016819 second(s), 8 queries , Gzip On, MemCached On.

eetop公众号 创芯大讲堂 创芯人才网
返回顶部