當中國算力發展遇上“東數西算”工程,大家都在談論算力網絡。當前,算力與網絡并未融合,而兩者不融合就無法提供算力網絡服務。我認為,只有“確定性網絡”才能保障算力網絡的健康發展,而確定性網絡的建設,其實也正是算力網絡面臨的挑戰。
建設確定性算力網絡的挑戰,可簡要提煉如下。
算力網絡的確定性挑戰
首先是實時性的挑戰。目前互聯網幾乎沒有實時性的能力,而不論是工業控制、能源,還是電力,都對網絡實時性提出了確定性指標,如時延指標、抖動指標。如果這些領域不解決網絡確定性問題,算力網絡根本無法實現。
第二是帶寬的挑戰。500米口徑球面射電望遠鏡(FAST)每天產生的數據大概有2000多TB,散裂中子源每天產生的數據有600多TB,這么大量的數據,每天要與全球網絡共享,網絡帶寬的不確定直接導致傳輸效率低下。
第三是算力成網的挑戰。現在的算力網絡是“煙囪化”的算力,相互獨立、缺乏感知、缺乏調度,算力利用率低,這增加了大家使用算力的成本。
將來的算力應該都是易用的,就像水電一樣即取即用,這也是算力網絡的愿景。但從以上幾點來看,算力和網絡還是“兩張皮”,這背后需要大帶寬、低時延、低抖動、高可靠的確定性網絡作為支撐,需要確定性的算力網絡做基礎。
如何解決這個問題,使算力與網絡深度融合,無疑是一個非常大的挑戰。
這已不是人們第一次面對確定性網絡的命題。早在2015年,國際互聯網工程任務組(IETF)就成立了一個工作小組,專門研究廣域網的確定性標準,但至今沒有實現標準化。國內包括電力、工業互聯網等在內的行業,也曾發布有關確定性網絡的白皮書。
但為何現在還沒有解決這個問題?因為很難。要滿足人們對算力網絡大帶寬、低時延、零丟包等的需求,就好比在一條普通的馬路上,突然要開辟出一段高速公路甚至高鐵軌道。
我們目前使用的互聯網就好比一條普通馬路,堵堵停停,時延和抖動難以控制。而確定性網絡則是利用新技術構建“信息高鐵”,是完全暢通的一條路,時延和抖動是可定制的,可按用戶需要提供服務,如此方能有效解決工業制造、能源、元宇宙等應用的精準控制問題。
確定性網絡的實踐探索
我認為,確定性網絡是我國數字經濟最重要的基礎之一,遠程醫療、新能源、交通系統、交易系統等應用場景,如果沒有確定性網絡作支撐,其既定的產業愿景就難以很好地實現。
為了解決這些問題,我們(未來網絡團隊)不斷探索,并取得了一些成果。
首先,針對當前互聯網從“消費型”向“生產型”的轉變需求,我們提出了服務定制網絡(Service Customized Network,SCN)技術體系,來解決網絡架構問題。SCN包括新型網絡承載、網絡操作系統與云網超融合三大平面,具有支撐產業互聯網發展所急需的智能、安全、柔性、可定制等特性。
第二,我們發展了用確定性網絡的操作系統來進行全網調度。未來網絡承擔了國家大科學裝置——未來網絡實驗設施(CENI)的建設工作。CENI是我國通信與信息領域首個大科學工程,該設施于2019年啟動建設,建設周期為5年,將建成一個開放、易使用、可持續發展的大規模通用試驗設施,為研究新型網絡體系架構提供簡單、高效、低成本的試驗驗證環境,支撐我國網絡科學與網絡空間技術研究在關鍵設備、網絡操作系統、路由控制技術、網絡虛擬化技術、安全可信機制、創新業務系統等方面取得突破。
基于全新的網絡架構,CENI已具備按需定制服務、確定性服務、多云互聯服務、智驅安全防護四大關鍵能力,能夠為企業提供低時延、低抖動、高可靠網絡接入服務,更好地滿足產業互聯網對網絡性能的苛刻要求。
目前,依托未來網絡確定性網絡技術,山東已建成并運行覆蓋16個地市、5600公里的全球首張確定性網絡,經中國信息通信研究院測試,該確定性網絡核心節點時延抖動控制在20 微秒以內,主要性能指標達到國際領先水平。今年6月30日前,該確定性網絡升級完成2.0版。升級后,山東省16個地市中,任何兩個地市端到端的時延抖動都小于20微秒,而且能做到在高負載的情況下(負載92%)零丟包。
此外,在南京到貴陽的傳輸距離上,我們對確定性網絡與非確定性網絡做了對比實驗,反復證明了確定性網絡與非確定性網絡的傳輸有明顯差距。
在從南京到貴陽跨2450公里的100G試驗網絡中,由于傳統網絡存在大量丟包與擁塞,在網絡擁塞情況下,帶寬利用率不足10%,難以滿足算力數據中心跨廣域的無損數據傳輸需求;而采用新型確定性無損傳輸技術后,可系統性解決網絡帶寬、時延、丟包問題,為業務提供有確定性保障的服務,峰值傳輸速率可提升至88%,達到數據中心內部無損網絡傳輸水平。
另外,我們還構建了確定性云網的算力網絡操作系統,即算網的操作系統,解決了算力資源和網絡資源統一調度問題。在煙臺和濰坊部分能源企業的試驗結果表明,該系統的算力速度比傳統方式大概提高了75%。該綜合能源系統可根據每家企業的實時數據,經過算力系統的算法,提出科學解決方案,降低能源用戶成本,提高能源服務的質量和安全,最終達到降碳的目標。
確定性算力網絡剛剛開始
基于確定性網絡,我們也開展了一些業務應用示范。
在遠程醫療場景中,確定性網絡讓手術操作跨越時空。今年2月,青島大學附屬醫院副院長牛海濤團隊在濟南操控一臺機器人,“隔空”給青大附院市南院區動物實驗室的實驗動物豬進行了遠程機器人輔助腹腔鏡下腎臟切除術,用時20多分鐘。整個過程網絡時延不到6毫秒,創造了新的紀錄,而此次遠程手術應用的正是確定性網絡。
目前通過確定性網絡進行的遠程手術已經有幾十例。在遠程手術應用場景中,高清鏡頭下,醫生可以通過遠程操作機器人完成手術,而患者遠在幾百公里之外。在確定性網絡的保障下,遠程手術中的時延、抖動都控制到了肉眼無法察覺的程度,醫生操作穩定無卡頓,大大提高了手術成功率,讓有需要的患者能夠享受到千里之外專家級別的治療。
在濟南,我們針對智慧交通系統,通過確定性算力網絡采集攝像頭數據,得到了一份優化的調度方案,將交通流量提高了16%,這個應用我們計劃繼續做下去。
另外,在我們和浪潮集團的合作中,利用浪潮的算力,建立了礦山遠程操作系統。使用確定性網絡后,可實現整座礦山的無人駕駛,一個人就可以遠程操作多輛礦車,減少了人力成本,提高了工作效率。
此外,確定性網絡+算力,在數字孿生、元宇宙等方面也大有可為。
在中國,確定性算力網絡還只是個開始,我們相信在算力網絡建設方面,中國大有可為。未來,我們希望在標準體系、產業生態、原始創新等方面,與大家共同努力,開展更深入廣泛的合作,讓確定性算力網絡從技術創新走向生產生活的方方面面!
(作者系中國工程院院士,記者趙廣立根據其在2022中國算力大會上的發言整理)