◎本報記者 都 芃 通訊員 申 暢 王 聰
深入推進建設以國家超算互聯網爲代表的新一代算力網絡基礎設施,並不能靠簡單的算力堆砌,而是要實現網絡、算力調度、產業鏈、數據要素治理等多方面的資源協同,強化東西部跨域統籌發展。
吳曉明 國家超級計算濟南中心主任
讓算力像電力一樣走進千家萬戶、賦能千行百業,這一20年前提出的設想如今正成爲現實。8月26日,2023年CCF全國高性能計算學術年會在山東省青島市落下帷幕,超算互聯網成爲與會專家學者熱議的話題。
目前,我國算力網絡基礎設施不斷完善,各行各業數字化進程持續加速,人工智能、數字孿生等技術迅速發展,對算力,尤其是高性能算力的需求呈爆發式增長。與此同時,高性能算力地區供需分佈不均、應用生態不完善、持續運營困難等問題制約着我國數字經濟高質量發展。在這一背景下,超算互聯網應運而生,成爲破解我國超算發展難題的一把關鍵“鑰匙”。
用互聯網思維發展超算服務
作爲當之無愧的“國之重器”,超級計算機距離我們的日常生活並不遙遠。小到每天看到的天氣預報,大到國產大飛機C919,背後都有超算的身影。中國工程院院士、清華大學計算機系教授鄭緯民表示,超算如今已廣泛應用於氣象預測、生物製藥、航空工業等領域,並在產業數字化過程中發揮着重要作用。
鄭緯民指出,我國超算的實力毫無疑問處於國際第一梯隊。在6月份發佈的最新一期全球超算500強榜單中,我國有兩臺超級計算機位列前十,超級計算機總數更是達到了134臺,位列全球第二。
但也應該看到,我國超算面臨着算力設施分佈不均衡、水平參差不齊、應用軟件自主研發和推廣應用不足等問題。國家超級計算濟南中心主任吳曉明表示,由於超算的技術門檻比較高,且尚未形成豐富的應用軟件生態,目前超算的應用仍侷限於比較傳統的高性能計算領域,如天氣預報、大型工程設計、基礎科學研究等。
超算互聯網的核心目標是讓超級計算機實現從傳統的提供算力到提供服務的革命性轉變。“我們希望通過打造超算互聯網,把各個超算中心連在一起,形成更大的算力平臺,並且利用互聯網思維,打造更爲豐富的超算應用生態,從而能夠直接通過平臺對外提供超算服務。”吳曉明表示,超算互聯網及其應用生態的打造,將有利於降低超算應用的門檻,讓超算從“陽春白雪”走向普及普惠,加快滲透千行百業、走進千家萬戶。
未來,有超算需求的用戶可以直接打開超算互聯網,實現一站式的超算產品瀏覽、下單、支付、應用等。用戶看到的將不再是某個超算中心、某臺計算機,而是一個能夠直接解決問題的完整應用軟件或解決方案。“我們希望超算互聯網未來能像淘寶、京東一樣,直接向用戶提供可應用的超算產品,降低超算的應用門檻,更好地賦能數字經濟發展。”吳曉明說。
研發新技術破解互聯難題
超算互聯網的關鍵在於互聯。只有實現高速互聯,分佈在各地的超算資源纔有可能整合爲一個有機整體,面向各行各業提供高性能的計算服務。“雖然叫作超算互聯網,但在網絡中流動的並不是算力,而是數據。”國家超級計算濟南中心副主任潘景山表示,在超算互聯網中,數據的傳輸速度直接影響到計算效率。
影響數據傳輸速度的兩大因素是帶寬和延遲。帶寬即單位時間內能夠通過的最大數據量,延遲則是信息在傳輸介質中傳輸所用的時間。
“比如,在網絡正常的情況下,從北京的清華大學傳輸4T大小的數據到江蘇的國家超級計算無錫中心太湖之光超級計算機需要5天。但若我們把數據都刻成盤,然後用快遞寄過去,第二天下午就到無錫了。”談及目前帶寬較低、延遲較高帶來的影響,鄭緯民形象地解釋道。
目前我國正式掛牌的超算中心有十餘家。讓這十餘家超算中心連在一起成爲一臺“大機器”,需要網絡具有極高的帶寬和極低的延遲。高帶寬、低延遲實現起來並不容易。
“以往我們用的光纖鏈路最大的帶寬約爲100G或200G,每百公里延遲約爲1.5毫秒,但這並不能滿足超算互聯網建設的需求。”潘景山介紹,通過持續攻關,國家超級計算濟南中心已在高速網絡通信、網絡資源感知調度、算力網絡融合和安全方面突破了一批關鍵技術,並首次建立起了基於長距IB通信技術的濟南—青島超算互聯網試驗網,它的帶寬達400G,500公里通信距離的網絡延遲由原先的雙向10毫秒以上降低至5毫秒左右。“通過這一網絡,濟南、青島兩地的超級計算機可以連接成一個整體,發揮更大的作用。”潘景山舉例道,當藉助濟南—青島超算互聯網試驗網進行地球系統模擬計算時,可以將其拆分爲大氣和海洋兩個模式,在兩地分別進行協同計算,大大提升計算效率。
高帶寬、低延遲給超算互聯網帶來的極致性能,也將顯著擴大其在產業中的應用規模。例如國家超級計算濟南中心與濰柴集團合作開展的發動機仿真模擬計算項目,產生的數據量達到TB級。“如果我們用傳統互聯網傳輸這些數據,可能需要傳2—3天,對設計人員來說,這嚴重影響工作效率。”潘景山表示,藉助高帶寬、低延遲的超算互聯網,TB級的數據量只需極短時間便可完成傳輸。“如果說傳統互聯網是數據傳輸的‘高速公路網’,那麼高帶寬、低延遲的超算互聯網則是運行能力成倍提升的‘高鐵網’。”潘景山如是說。
壯大平臺生態賦能產業發展
相比傳統的超算應用模式,超算互聯網可提供統一、完整的超算服務。實現這個目標,需要在運營模式、平臺生態、產業培育等方面同步發力。
“我們深知,深入推進建設以國家超算互聯網爲代表的新一代算力網絡基礎設施,並不能靠簡單的算力堆砌,而是要實現網絡、算力調度、產業鏈、數據要素治理等多方面的資源協同,強化東西部跨域統籌發展。”吳曉明建議,超算互聯網未來發展需要連接產業生態中的算力供給、應用開發、運營服務、用戶等各方能力和資源,構建一體化超算算力網絡和服務平臺。同時,還需要緊密連接供需雙方,通過市場化的運營和服務體系,實現算力資源統籌調度,降低超算應用門檻,並推動計算技術向更高水平發展,促進核心軟硬件技術深度應用,輻射帶動產業生態的發展與成熟。潘景山也指出,應聯合超算中心、運營商、軟件供應商和用戶合作建設超算互聯網,打造超算共同體,這樣才能讓我國數字經濟真正實現以“高鐵速度”發展。
高性能算力能夠驅動產業的發展,大範圍、大規模的產業應用也能爲算力升級提供動力。目前,國家超算互聯網平臺已開放第三方企業入駐,並明確了入駐企業條件:可提供基礎超算IAAS服務等基礎資源;提供行業應用軟件資源;提供多學科行業應用服務等平臺資源;提供多樣數據模型、源碼等資產資源,以及提供各種類型的算力服務。截至8月,已有35家超算上下游單位成功入駐國家超算互聯網平臺,另外有近百家單位遞交了聯合體入會申請,這將爲超算互聯網平臺持續注入活力。