今天分享的是:ODCC开放数据中心委员会::2025年ETH-X Scale Up 协议测试报告
报告共计:39页
2025年ETH-X Scale Up协议测试报告核心总结
开放数据中心委员会(ODCC)发布的《2025年ETH-X Scale Up协议测试报告》(编号ODCC-2025-03005),依据《ETH-X Scale Up互联协议规范》,通过原型验证平台实现协议全栈功能,与高性能交换机组网测试,系统验证了该协议在scale-up场景下的可行性与性能优势,为工程优化与部署提供量化依据。
测试聚焦ETH-X协议(PAXI+PRI)的核心能力,以主流RoCEv2协议为对比基线,覆盖五大测试维度:组网连通性、转发性能、Direct Access性能、Direct Copy性能及MOE通信性能。测试环境由1台51.2T容量、128个400G端口的高性能交换机与4台合见工软原型主机组成,主机支持RoCEv2与PAXI+PRI双协议栈,通过400G端口实现一对一至多对多场景覆盖。
组网连通性测试验证了协议互通基础。端到端RoCEv2测试中,主机间成功建立QP连接,完成4KB写入与128B读取操作,报文封装、转发与解析功能正常;ETH-X PAXI测试同样实现4KB写入与128B读取的数据正确性,交换机可正确转发PAXI报文,为后续性能测试奠定基础。
转发性能测试聚焦时延核心指标。通过直连与过交换机的RTT对比测量,交换机在无负载与有负载场景下的转发时延分别为466.5ns与469ns,均低于480ns目标值。结合端侧PAXI单向收发<200ns、光模块时延110ns及光纤链路时延,端到端RTT可控制在2us以内,满足scale-up域互联时延要求。
Direct Access性能测试凸显小报文优势。报文承载效率方面,128B、256B、512B场景下,PAXI PRI增强模式承载效率分别达81.26%、85.62%、87.97%,显著优于RoCEv2的55.65%、71.5%、83.39%。单事务响应时延中,写操作平均1787.82ns、读操作平均1789.82ns,均满足<2us诉求。访存队列有效吞吐随单笔数据量与MAC帧长度增大而提升,4KB帧场景性能优于1KB帧,验证了协议对细粒度数据访问的适配性。
Direct Copy与MOE通信测试验证复杂场景适配性。HBM间数据拷贝中,PAXI PRI模式有效吞吐随MAC帧长度增长而提升,可达RoCEv2基线水平(390.66Gb/s)。MOE架构下,Dispatch(一对多)、Combine(多对一)及All-to-All(多对多)三种通信模式中,PAXI PRI承载的通信完成时间均低于RoCEv2基线,尤其在小数据量场景优势显著,仅1792KB超大 payload场景下RoCEv2吞吐量略优。
报告结论显示,ETH-X Scale Up协议通过PAXI访存语义与PRI增强承载的协同,在低时延、高承载效率及复杂通信模式下表现优异,可满足AI训练等scale-up场景的高吞吐、低时延互联需求,为高性能计算集群互联提供了可靠技术选择。
以下为报告节选内容