Mellanox特性系列之: ZTR(Zero Touch RoCE)技术 是什么?零接触 RoCE 技术,本质是使用RTT不用配置PFC和ECN水位等

Mellanox特性系列之: ZTR(Zero Touch RoCE)技术 是什么?零接触 RoCE 技术,本质是使用RTT不用配置PFC和ECN水位等如果需要 可以强制使用 ZTR RTTCC 即使 RDMA CM 尚未同步状态

大家好,欢迎来到IT知识分享网。

要点:

  • Zero Touch RoCE (ZTR) 零接触 RoCE 技术,类似物联网设备中的零配技术
  • RTTCC 主动监控拥塞
  • 优势:无缝集成、无需配置、主动拥塞

其他信息:

  • Zero Touch RoCE (ZTR):NVIDIA开发的一种技术,允许在不需要特殊交换机配置的情况下,在聚合以太网上无缝部署RDMA (RoCE)。遵循InfiniBand Trade Association (IBTA) RDMA标准,并完全符合RoCE规范。
  • 显式拥塞通知 (ECN):一种网络拥塞控制机制,通过在网络设备上设置特定的位来指示即将发生的拥塞。
  • 数据中心量化拥塞通知 (DCQCN):一种拥塞控制算法,能够响应拥塞通知并动态调整流量传输速率。
  • 往返时间拥塞控制 (RTTCC):NVIDIA的新拥塞控制算法,通过监控网络往返时间 (RTT) 来主动检测和适应拥塞的发生,提高网络性能。
  • 【主动CC】通过添加 RTTCC 主动监控拥塞。新的 NVIDIA 拥塞控制算法 RTTCC 主动监控网络 RTT ,以便在丢弃数据包之前主动检测并适应拥塞的发生。比如微软ZTR 依赖于隐式丢包通知,这对于小规模部署来说已经足够了。通过添加新的基于往返计时器( RTT )的拥塞控制算法, ZTR 变得更加健壮和可扩展,而无需依赖丢包来通知服务器网络拥塞。
  • RTTCC 使用基于硬件的反馈环路实现动态拥塞控制
  • (个人)ZTR所谓的无需配置,主要是ECN以及PFC等配置
  • 优势:
    • 无需配置:比如ECN和PFC配置交换机信息,ZTR RTTCC不需要,因为他是基于RTT的
    • 无缝集成:ZTR允许RoCE流量与非RoCE流量在同一个TCP/IP环境中并行运行,而不需要对现有网络架构进行大的改动。
    • 主动拥塞控制
  • 低延迟对金融交易、实时分析等对延迟敏感的应用非常重要。

使用方式

【开关】启用可编程拥塞控制:

配置网络接口卡,启用ZTR-RTTCC拥塞控制算法:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s ROCE_CC_LEGACY_DCQCN=0 

将ROCE_CC_LEGACY_DCQCN设置为0,从而启用ZTR-RTTCC算法。

【重启】重置设备或重启主机:

在更改配置后,重置网络设备或者重启主机以使更改生效。例如:

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r 

使用ZTR-RTTCC:

完成上述步骤后,当使用RDMA-CM(RoCE CM)进行连接建立时,将自动使用ZTR-RTTCC。

强制使用ZTR-RTTCC:

如果需要,可以强制使用ZTR-RTTCC,即使RDMA-CM尚未同步状态。通过mlxreg命令来实现。

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len 0x40 --set "0x0.0:8=2,0x4.0:4=15" -y 

直接配置寄存器

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/130747.html

(0)
上一篇 2025-08-13 13:26
下一篇 2025-08-13 13:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信