中國經濟正在向“新”而行。從中央到地方,一系列支持新質生產力發展的舉措相繼推出。新質生產力的發展呼喚更加高質量、高效率、高智能、高安全的基礎網絡來承載。業界將這一新型的網絡技術體系稱爲“新質互聯網(Net5.5G)”。“新質互聯網”不僅僅連接傳統的網絡用戶、系統、應用,而且要進一步連接算力、數據,並不斷擴展其物理空間範疇;其業務模型不僅僅是信息的訪問,而更多表現爲信息的產生、爆發、重組、流動,從而極大地改變網絡的整體結構和技術需求。目前看來,“新質互聯網”主要面向聯算、聯智、聯數、聯空四大場景。
算力是數字經濟時代的核心基礎設施,對促進經濟增長、推動科技進步以及滿足日益增長的數據處理需求具有至關重要的作用。隨着ChatGPT引爆大模型熱潮,讓人類看到了通用人工智能“生成創造世界”的曙光,也促使人們對人工智能加快社會各領域數字化轉型及智能化發展、促進全社會生產效率提升抱有極高的期望。算力既是智能時代的“引擎”,也是智算時代最寶貴的資源。智算廣域網在算力供給者和用算企業與用戶之間架起連接的橋樑,同時也是連接不同數據中心之間算力、算卡的網絡,從算力使用場景上需要關注入算、算間、算內三張網絡。
入算網絡需具備差異化調度和調優能力
2023年10月,工業和信息化部等六部門印發了《算力基礎設施高質量發展行動計劃》,文中首次提出了入算網絡概念,並明確彈性大帶寬接入、確定性承載、高安全可靠是算力網絡的基本特徵。
入算網絡作爲算力管道,連接大量企業、科研機構與算力中心,需要具備差異化調度和調優能力,滿足海量數據高效入算的需求。AI大模型訓練催生大數據入算需求,模型數據集通常需要數十GB到數百TB的數據。如某車企每天上傳一次100T~160T數據,年數據量約38PB;某基因公司每天上傳一次15T數據,年數據量約4.5PB。大數據量入算對網絡的挑戰主要在三方面:一是接入帶寬挑戰,大數據量上傳百兆專線耗時太長,萬兆專線成本太高;二是網絡利用率挑戰,大數據量入算產生大量大象流,現有網絡負載均衡策略中無法區分出智算業務流,將由於流量不均衡而造成網絡利用率的大幅下降;三是數據安全挑戰,部分企業敏感數據需要入算訓練,但又不希望異地存儲造成可能的泄露。這些挑戰導致目前90%以上的企業還都選擇寄硬盤方式傳遞數據。因此,新質互聯網給需要的企業構建一張更具備性價比和傳輸安全性的入算網絡,提供任務式服務的高彈性,提升整網帶寬利用率,並實現數據的高安全傳輸和數據主權保護。
因此,“入算”需要具備超寬、彈性、大運力、無損、安全的新質聯接力,爲千行百業提供高效智能算力,這也是“新質互聯網”的核心競爭力所在。
算間網絡需實現多智算中心間的高速互聯
大模型算力需求快速增長,由於電力資源等限制,單數據中心算力規模受限,業界大模型廠商採用多數據中心資源聯合訓練大模型。另外,當前國內普遍是千卡集羣,單體無法滿足萬卡訓練訴求。通過構建多數據中心協同訓練能力,城市內多智算中心、區域內(區域省份間)、區域間(國家算力樞紐間)算力可實現高效協同,實現碎片化算力整合利用,提升算卡利用率,支撐更大模型的訓練和縮短模型訓練時間。多DC互聯網絡需要具備長距無損、高吞吐的能力,以支持算間協同,突破地域限制,整合全國算力資源。由於跨DC聯算的計算效率對於數據丟失十分敏感,0.1%的丟包會造成50%的算力損失,跨上千公里的算力無損傳輸對於網絡可靠性提出了新的考驗。需要引入更智能的流調度算法來充分釋放AI算力,還要有基於租戶級的流控技術防止擁塞在大網上擴散。
算內網絡需超大規模組網和無損高吞吐
算內網絡要實現數據中心內算卡的互聯,需滿足單數據中心算卡從百卡到萬卡、十萬卡的超大規模集羣連接需求,需要具備超大規模組網、無損高吞吐以及智能容錯能力。業界推測GPT-4參數量約1.8萬億,訓練中使用了大約2.15e25Flops算力,訓練集羣使用約25000個A100GPU。隨着模型參數量從千億到萬億、十萬億的增長,模型訓練使用的算力卡也從萬到十萬發展,對數據中心的網絡提出了超大規模組網調度、超高吞吐、無損傳輸、快速故障閉環的要求,以實現算力效率的100%釋放。
不難看出,“新質互聯網”需要構建入算、算間、算內三張網絡,構建多級推理中心和高質量的邊端網絡,構建高速連接的數據網絡,構建空天地一體的全域覆蓋網絡。
中國電信上海公司聯合華爲打造了業界首張端到端400GE的IP智算廣域試驗網絡,採用RDMA(Remote Direct Memory Access)廣域無損傳輸、新型智算業務流級調度算法、網絡數字地圖等技術,爲千行百業提供高彈性、高吞吐、高可靠的一跳入多算網絡新服務……
“新質互聯網”是國內產業界在總結新產業需求、新應用領域、新技術方向的基礎上提出的數據通信網絡技術體系,是適應新質生產力發展的網絡新底座,是智能化時代網絡技術升級的演進新方向,服務於全社會的數字化轉型和高質量發展。智算廣域網融合了算力時代的最新關鍵技術和能力,將爲“新質互聯網”打好根基,爲新質生產力的發展保駕護航。 (餘從)