超高速乙太網路測試
針對 AI 與 HPC 網路優化乙太網路
所謂的「擴展型乙太網路」(Scale-up Ethernet),一般是指一種針對乙太網路部署的架構概念,旨在針對緊密耦合的人工智慧(AI)與高效能運算(HPC)領域(例如節點內與機架內環境)的高頻寬、低延遲通訊進行優化。部分廠商更進一步,定義了特定的協定擴充功能或幀格式,以反映不同的實作選擇,旨在滿足擴展型工作負載嚴苛的效能需求。
在人工智慧(AI)與高效能運算(HPC)領域中,乙太網路被用於連接參與集體運算與同步工作負載的 GPU、加速器及其他運算裝置。其主要需求包括極高的頻寬、可預測的延遲行為,以及在突發性流量模式下仍能維持高度可預測的效能。
隨著人工智慧系統規模不斷擴大,頻寬需求也急速攀升,推動乙太網路鏈路速度從 400G 提升至 800G,並進一步邁向 1.6 Tbps,這一切皆得益於新一代 224G 序列資料傳輸技術。與此同時,對延遲的敏感度也日益顯著,使得傳輸的一致性與低抖動變得與峰值吞吐量同樣關鍵。即使傳輸時序出現微小偏差,也可能影響集體運算的效率,以及整體的訓練或推論效能。
因此,對乙太網路架構的擴展性測試,主要著重於驗證其在短路徑與最小跳數下的頻寬擴展效率、延遲確定性,以及丟包恢復行為。這可能包含對 Ultra Ethernet 功能與高速物理介面的驗證,以確保乙太網路實作能在要求嚴苛的人工智慧與高效能運算系統中,可靠地支援高階的 GPU 對 GPU 及加速器通訊。
在大型人工智慧與高效能運算系統中,乙太網路被用於連接不同機架間的運算資源,形成可擴展至數千個節點的網路架構。這些橫向擴展環境支援分散式訓練與推論工作負載,在此類環境中,通訊需跨越眾多裝置與交換機跳躍,且整體系統效能取決於整個網路的協調運作,而非單一鏈路。
隨著網路規模擴大,主要挑戰已從原始的點對點頻寬,轉變為大規模環境下的彈性、擁塞管理及公平性。封包遺失、擁塞熱點或鏈路故障可能同時影響大量流量,並干擾整體運作。在確保跨多跳路徑行為可預測的同時,維持共享網路資源的高效利用率,對於維持大規模 AI 工作負載的吞吐量並將迭代時間降至最低至關重要。
為滿足這些需求,橫向擴展型乙太網路設計通常會整合多種機制,旨在管理擁塞、吸收故障,並在相互競爭的流量流之間維持公平性。 歷來,廠商會透過不同組合的佇列策略、擁塞控制技術、遠端監測及傳輸優化,來應對大型多跳結構中的這些挑戰。這些實作選擇反映了在大規模環境中實現可靠且高效乙太網路運作的不同方法,而「橫向擴展乙太網路」一詞本身,仍著重於部署特性與工作負載需求,而非任何單一的標準化協定。
Ultra Ethernet 引入了一系列架構機制,旨在提升以人工智慧為核心的乙太網路織網在可靠性、擁塞處理及復原行為方面的表現。在橫向擴展環境中,這些功能可與現有乙太網路技術相輔相成,有助於限制資料遺失或擁塞在多跳傳輸過程中的影響,從而使織網層級的行為更為可預測,且無需限定特定的拓撲結構或供應商實現方案。
因此,對擴展型乙太網路架構的測試,已不僅限於驗證鏈路速度或單一裝置的運作。必須在貼近實際的多跳拓撲結構與分散式流量環境下,對網路設備進行評估,以檢視其在大規模環境下的擁塞應對能力、公平性、故障恢復能力及互通性。這包括在測試既有的乙太網路行為之同時,也需驗證 Ultra Ethernet 功能,以確保大型 AI 與 HPC 架構能在嚴苛的實際工作負載下,仍能高效、可靠且可預測地運作。
Ultra Ethernet 正在 Ultra Ethernet 聯盟 (UEC)內進行,該聯盟是一個致力於推進乙太網路演進的產業合作組織,旨在更好地滿足人工智慧(AI)與高效能運算(HPC)網路在效能、擴展性及可靠性方面的需求。
Ultra Ethernet 引入了一套架構機制,旨在提升高速乙太網路結構中的可靠性、確定性與效能。與其定義一套全新的協定,Ultra Ethernet 選擇利用並擴展現有的乙太網路機制——包括探測、幀結構與編碼行為——以實現更快速的丟失恢復、更有效的擁塞處理,以及連線裝置間更完善的協調。
在 Ultra Ethernet 環境中,LLDP 被用作功能偵測與網架感知的基本機制。Ultra Ethernet 在 LLDP 中引入了專屬的 UE 類型-長度-值 (TLV) 擴展,使直接連接的裝置能夠廣播並協商對 Ultra Ethernet 功能的支持。
這些 TLV 使對等端能夠交換有關支援功能、運作模式及功能適用性的資訊,在資料流量傳輸之前,就對鏈路行為建立一致的理解。此功能偵測機制有助於確保 Ultra Ethernet 增強功能僅在鏈路兩端均支援的情況下才會啟用,從而促進異質 AI 與 HPC 網格間可預測且具互通性的運作。
鏈路層重傳 (LLR) 引入了局部化的第二層重傳機制,可讓直接相連的裝置之間快速恢復遺失的乙太網路幀。Ultra Ethernet 在沿用現有乙太網路幀結構與編碼架構的同時,亦引入了對符合 LLR 條件與不符合 LLR 條件之幀的明確識別機制。
從高層次來看,這包括利用前導信號和 PCS 區塊編碼指示來區分流量類型,以及使用專用的控制幀(CtlOS 幀)來協調對等節點之間的重傳行為。 透過在鏈路層進行本地重傳,LLR 減少了對更高層端到端恢復的依賴,並限制了暫時性丟包的傳播,有助於在垂直擴展和水平擴展環境中維持低延遲及更具確定性的效能。
基於信用的流量控制(CBFC)能強化乙太網路架構在人工智慧工作負載中常見的高度同步且大量採用內投(incast)的流量模式下,對擁塞的應對能力。Ultra Ethernet 在既有的乙太網路擁塞信令概念基礎上,進一步引入了裝置間更明確且及時的擁塞與反壓通訊機制。
透過讓擁塞狀況能在更接近發生地點之處被偵測並採取應對措施,CBFC 有助於防止擁塞在網路架構中擴散,並提升競爭流量間的公平性。這有助於提升效能的可預測性,並提高共享資源的利用效率,特別是在擁有眾多平行流量流的大型 AI 和 HPC 網路架構中。
雖然 Ultra Ethernet 的增強功能在幀、前導碼和編碼層面上看似細微,但其正確的實作對於匯流排結構的運作至關重要。透過 LLDP TLV 進行功能偵測、正確識別符合 LLR 資格的流量、精確處理控制幀,以及 PCS 區塊編碼的正確運作,這些功能都必須在各裝置間精確地相互協作。
因此,對 Ultra Ethernet 的測試不僅限於吞吐量或連線驗證。必須在乙太網路幀和符號層級對網路設備進行驗證,以確保在實際的 AI 流量條件下,這些機制能正確地解讀、傳輸訊號並相互協作。驗證這些細節對於在實際運作的 AI 和 HPC 網路中實現預期的可靠性、確定性及效能提升至關重要。