今天分享的是:2025年ETH-X Scale Up 协议测试报告
报告共计:39页
ETH-X Scale Up协议测试完成:AI算力互联迈入高吞吐低时延新阶段
随着人工智能模型向大规模训练与推理场景快速演进,计算集群内部的互联性能已成为制约系统效率提升的关键瓶颈。近日,开放数据中心标准推进委员会(ODCC)发布《ETH-X Scale Up协议测试报告》,通过多维度测试验证了ETH-X Scale Up协议在高吞吐、低时延互联场景的技术优势,为AI算力网络的优化升级提供了重要技术支撑。
此次测试围绕ETH-X Scale Up协议(PAXI+PRI)展开,以当前数据中心广泛应用的RoCEv2协议作为性能对比基线,搭建了包含1台高性能以太交换机与4台主机原型的测试环境。其中,交换机整机容量达51.2T,支持128个400G高速端口,主机原型则搭载合见工软验证平台,可同时运行RoCEv2与PAXI+PRI两种协议,全面覆盖从基础连接到复杂通信场景的测试需求。
在组网连通性测试中,测试团队分别验证了基于RDMA的RoCEv2报文与基于PAXI的ETH-X报文的端到端收发能力。结果显示,两种协议均能实现节点间的稳定互联互通:RoCEv2协议下,主机间可通过RDMA RC类型队列对(QP)完成4KB数据写入与128B数据读取操作;ETH-X PAXI协议则在完成初始寄存器配置后,成功实现4KB数据写入与128B数据读取,且数据传输准确性与完整性均符合预期,为后续性能测试奠定了坚实基础。
转发时延是衡量算力互联效率的核心指标之一,尤其对AI场景中load、store等时延敏感型事务操作至关重要。测试数据显示,ETH-X Scale Up协议在转发性能上表现突出:无负载情况下,交换机报文转发时延低至466.5ns,即使在增加负载后,时延也仅小幅上升至469ns,远低于480ns的目标阈值。结合端侧200ns的单向收发时延、110ns的光模块时延及50ns的光纤链路时延,整个系统端到端RTT时延可控制在2μs以内,完全满足scale-up互联的主流时延要求,能够有效提升算力引擎同步操作的完成效率。
Direct Access性能测试聚焦小报文场景下的访存效率,从报文承载效率、单事务响应时延与访存队列有效吞吐三个维度展开。在报文承载效率方面,ETH-X PAXI PRI增强协议优势显著:128B数据场景下,其承载效率达81.26%,远超RoCEv2协议的55.65%;256B与512B场景下,PAXI PRI增强协议承载效率分别为85.62%、87.97%,同样大幅优于RoCEv2的71.5%、83.39%,这意味着在传输相同数据量时,ETH-X协议可显著减少网络带宽占用。
单事务响应时延测试结果进一步印证了ETH-X协议的低时延特性。在128B数据的写操作与读操作中,PAXI PRI增强承载的平均响应时延分别为1787.82ns与1789.82ns,均控制在2μs以内,且端侧收发时延仅157.31ns,能够满足细粒度数据访问的时延需求。访存队列有效吞吐测试则显示,随着单笔数据大小从128B增至1KB,ETH-X协议的有效吞吐呈稳步上升趋势,且4KB MAC帧长度场景下的吞吐表现优于1KB场景,为不同数据量的访存操作提供了灵活的优化方向。
针对大批量数据搬移场景的Direct Copy性能测试中,ETH-X协议展现出与RoCEv2协议相当的高吞吐能力。RoCEv2协议在满队列状态下实现了390.66Gb/s的有效吞吐,而ETH-X PAXI PRI增强协议在HBM间数据拷贝测试中,随着MAC帧长度从1KB增至8KB,有效吞吐呈持续增长趋势,可稳定达到与基线持平的高性能水平,且依托专用硬件进行数据拷贝,能有效减轻CPU与GPU的负载压力,适用于结构化数据的高效批量处理。
在AI领域重要的MoE(专家混合模型)通信场景测试中,ETH-X协议在多类型通信模式下均表现出色。Dispatch(一对多)通信场景下,PAXI PRI增强承载的通信完成时间全面低于RoCEv2基线;Combine(多对一)通信场景中,面对1KB至32KB不同通信量,ETH-X协议的尾时延始终处于更低水平,能更好地应对多节点数据汇聚需求;All-to-All(多对多)通信场景下,除1792KB超大数据量场景因RoCEv2协议包效率优势略占上风外,ETH-X协议在中小数据量场景下的通信完成时间与有效吞吐均展现出竞争力,可满足MoE模型不同阶段的通信需求。
此次ETH-X Scale Up协议测试的完成,不仅验证了该协议在高吞吐、低时延互联场景的技术可行性与性能优势,更为AI算力集群的互联架构优化提供了量化数据支撑。随着AI技术在各行业的深度应用,算力需求将持续爆发,ETH-X Scale Up协议有望成为未来超节点架构互联的重要选择,推动数据中心算力网络向更高效、更可靠的方向发展,为人工智能产业的规模化落地提供有力保障。
以下为报告节选内容
报告共计: 39页
中小未来圈,你需要的资料,我这里都有!