新思科技Synopsys白皮书:AI数据中心网络技术的演进
作者:Jerry Lotto
以太网是互联网的核心技术,在数据中心网络中发挥着关键作用。本文阐述了以太网标准的发展历程,探讨了高性能计算(HPC)的演进及其对网络的需求,强调了 SoC 设计师对超越 IP 的以太网解决方案的需求,以及 Synopsys 在相关领域的支持。
●以太网标准及关键要素
发展历程:1972 年在施乐公司帕洛阿尔托研究中心诞生,受 ALOHANet 启发开发出 CSMA/CD 协议定义以太网 MAC 层,1979 年商业化,1983 年 IEEE 批准首个 10Base5 以太网标准。此后物理层不断改进,速率和可用性提升。
IEEE 标准:IEEE 的 802.3 标准涵盖从 10Mbit/s 到 800G 以太网的规范,802.1Q 标准对工业控制和车辆应用至关重要。
物理层挑战与技术:100G 以上高速以太网面临功率和距离挑战,NRZ 在 200Gbps 以上有局限,PAM-4 可提升带宽和连接性,还可通过 QAM 扩展,光纤借助 WDM 技术能延长通信距离。
网络组成元素:现代以太网网络由许多不同的元素组成。承载它的介质可以从无线无线电、蜂窝或无线网络,到同轴的铜,再到光纤传输中的许多波长和强度变化。集线器、交换机、路由器、网关、网桥、媒体转换器、光放大器转发器和多路转换器创造了以太网可以传输的路径。
●HPC 的演进
从大型主机发展到网络连接的个人计算机集群,再到配备加速器等组件的专业计算机集群,如今已发展为虚拟化按需高性能计算的云计算模式。HPC 计算效率不断提升,对数据中心的规模扩展架构提出了更高要求。
在一个数据中心内,HPC 的规模 --尤其是虚拟化云托管基础设施上的 HPC 工作流聚合 -- 需要大规模的横向扩展架构。根据 2021年6月的Green500列表<2021年6月TOP500>,HPC 计算效率接近 30 Gflops/watt,标准 42"机架可以在一个封闭的 pod 中冷却近 40 kW,在该机架中提供高达 1.2 Pflops的功率!对数据中心电力利用率的合理估计将每个大约 40% 分配给正在运行和冷却的服务器,20% 分配给存储和网络,对数据中心的增长和容量施加了实际限制。对于需要在 19"42U 机架内连接的以太网端口的数量和容量,电力情况有所不同。机架顶部(TR)聚合可能需要支持数百个以太网连接,用于主要通信和带外管理目的。
●HPC 驱动的需求
通信需求:HPC 依赖集群内计算机间的低延迟、快速通信,使用 MPI 等通信框架,流量突发,数据包较小。
存储和其他工作负载需求:存储流量带宽需求大,数据包大,机器学习和大数据分析工作负载也类似,都需要大数据包通信。
网络分层与技术需求:互联网本身是通过 OSI模型的第3层(又名 IPv4 或 IPv6)进行数据通信的。以太网流量的 VLAN 隔离是第 2层协议,它允许管理、数据、存储和进程间通信以相对安全和排他性的方式遍历公共以太网基础设施,即使流量共同驻留在活动数据流中。VXLAN 将这一功能转移到第3层,并允许 VLAN 在多个数据中心共存。除了数据中心之外,图形可视化/交互、文件传输和命令/控制 I/0 扩展到世界各地的最终用户机器和终端。
●总结
互联网发展超出预期,对带宽需求增长迅速,以太网成为数据中心高性能计算的事实标准。SoC 设计师需要更具差异化的以太网解决方案,包括集成 MAC 和 PHY IP、低延迟、支持多种共封装光学器件等。Synopsys 凭借经验帮助设计师应对挑战,与各方合作确保 IP 的互操作性,协助解决技术问题和降低集成风险。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-18,如有侵权请联系 cloudcommunity@tencent 删除流量数据中心通信网络科技发布者:admin,转转请注明出处:http://www.yc00.com/web/1747613169a4670508.html
评论列表(0条)