從國家工業(yè)和信息化部傳來捷報,由我單位主導(dǎo)的超算中心核心網(wǎng)絡(luò)設(shè)備自主研發(fā)項目,成功入選工信部2023年新一代信息技術(shù)與制造業(yè)融合發(fā)展試點示范項目名單。這一殊榮不僅標志著該項目在技術(shù)先進性、產(chǎn)業(yè)帶動性和模式創(chuàng)新性方面獲得了國家層面的高度認可,更是對我國在高性能計算關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域自主創(chuàng)新能力的一次有力彰顯。
超算中心作為支撐前沿科學(xué)研究、重大工程仿真、人工智能訓(xùn)練等國家戰(zhàn)略任務(wù)的核心算力底座,其網(wǎng)絡(luò)系統(tǒng)的性能、可靠性與安全性至關(guān)重要。長期以來,高速、低延遲、可擴展的互聯(lián)網(wǎng)絡(luò)設(shè)備是制約我國超算中心效能進一步提升的關(guān)鍵瓶頸之一。本項目聚焦這一“卡脖子”環(huán)節(jié),組建了跨學(xué)科攻關(guān)團隊,歷時三年,成功研發(fā)了擁有完全自主知識產(chǎn)權(quán)的新一代高性能計算網(wǎng)絡(luò)交換設(shè)備與智能網(wǎng)卡。
項目突破的核心技術(shù)包括:
- 超低延遲交換架構(gòu):創(chuàng)新設(shè)計了軟硬件協(xié)同的極簡轉(zhuǎn)發(fā)路徑,將端到端通信延遲降低至納秒級,滿足了大規(guī)模并行計算對通信實時性的嚴苛要求。
- 自適應(yīng)無損網(wǎng)絡(luò)技術(shù):通過智能流量感知與動態(tài)擁塞控制算法,實現(xiàn)了在超高負載下網(wǎng)絡(luò)零丟包,極大提升了大規(guī)模作業(yè)的運行效率與穩(wěn)定性。
- 跨層協(xié)同與智能運維:開發(fā)了從芯片、設(shè)備到集群管理系統(tǒng)的全棧可控解決方案,內(nèi)置AI運維引擎,可實現(xiàn)對網(wǎng)絡(luò)健康狀態(tài)的預(yù)測性維護與性能調(diào)優(yōu)。
此次入選工信部試點示范項目,意味著該項目的技術(shù)路線與產(chǎn)業(yè)化模式將被作為典型范例,在全國范圍內(nèi)進行推廣。這不僅將加速國產(chǎn)高性能網(wǎng)絡(luò)設(shè)備在更多超算中心及大型數(shù)據(jù)中心的應(yīng)用部署,降低對國外技術(shù)的依賴,保障國家算力基礎(chǔ)設(shè)施的安全可控;更將帶動從芯片設(shè)計、設(shè)備制造到系統(tǒng)集成、應(yīng)用服務(wù)的全產(chǎn)業(yè)鏈發(fā)展,培育具有國際競爭力的產(chǎn)業(yè)生態(tài)。
項目團隊將繼續(xù)深化與產(chǎn)學(xué)研各界的合作,以入選示范項目為新起點,持續(xù)迭代產(chǎn)品性能,拓展在人工智能、工業(yè)互聯(lián)網(wǎng)、元宇宙等新興領(lǐng)域的高性能互聯(lián)應(yīng)用場景,為筑牢國家數(shù)字基礎(chǔ)設(shè)施的基石、推動數(shù)字經(jīng)濟高質(zhì)量發(fā)展貢獻核心力量。