信息社會進入智能化新階段,信息基礎設施的主要作用已不是解決連通問題,而是為人類的生產與生活提供充分的分析、判斷和控制能力。因此,計算能力和大數據資源成了新的信息基礎設施的關鍵。算力作為數字經濟時代的新生產力,必須實現基礎設施化。
算力和國內生產總值(GDP)呈正相關的關系,未來算力指數可能是比電力指數更重要的經濟指標。因此,未來信息基礎設施必須通盤考慮算力網絡和通信網,還要與電力等能源網絡協同配合,做好算力、通信、電力網全國“一盤棋”的頂層設計,統籌兼顧,力爭全局優化。
算力網絡是新型基礎設施的一個組成部分,而“東數西算”又是算力網絡的一個組成部分。我們要基于經濟社會發展的大邏輯、大格局、大趨勢,做好頂層路線圖的設計,避免“只見樹木不見森林”。
不同視角下的未來信息基礎設施
計算機界和通信界對未來的信息基礎設施有著不同的視角。
計算思維的核心是分層次抽象,對應到未來信息基礎設施,就是以新的抽象來屏蔽不同“云”的差異,實現“跨云計算”。眾所周知,互聯網是網際網,未來的信息基礎設施就是“互聯云”。
從計算機的視角來看,這是以云為中心,強調以云調網、云網融合、一云多網的信息基礎設施,重點是解決各種軟硬件的不兼容問題。算力網絡基本載荷單元不是消息,而是計算任務。核心創新是做任務交換和高通量的計算,追求低熵有序。
而通信界的視角則是以網絡為中心,把計算和存儲能力看成是可調動的資源,即“網調云”,因而強調算力資源評估、交易和調度,目標是構建網絡和計算高效協同的網絡架構。新的網絡架構重視算力的感知、異構算力的統一標識和算力資源的標準化等。
目前,算力網絡被認為是6G與未來網絡中一項重要的基礎技術,即在網絡中部署數據處理能力。這一理念目前主要是電信運營商在推動,中國電信等運營商先后發布了《算力網絡白皮書》,也提出了國際標準。2021年7月,國際電信聯盟電信標準分局(ITU-T)發布了第一個算力網絡技術的國際標準“Y.2501”。算力網絡的提出不僅僅是技術發展趨勢,更是市場競爭的需求。電信運營商希望在“連接+計算”一體化服務場景下實現業務擴展,避免被管道化。
工信部通信科技委常務副主任、中國電信科技委主任韋樂平曾提出“網是基礎、云為核心、網隨云動、云網一體”,我認為這是云網融合一個正確的發展原則。我希望通信領域的專家考慮“網調云”的時候,要充分理解哪些計算資源現在可以通過網絡進行調配、哪些還不能。實際情況是,目前只有相當少量的計算資源可以調配,很多還不能調配。
算力網絡是前景光明的宏偉目標
“人工智能之父”約翰•麥卡錫早在1961年就提出效用計算(Utility Computing)的目標:“有一天,計算可能會被組織成一個公共事業,就像電話系統是一個公共事業一樣。”讓計算能力成為像電一樣的公共基礎設施,這是計算機界已經奮斗了半個多世紀的宏偉目標。1984年,SUN公司提出的“網絡就是計算機”也是今天講的算力網絡的美妙前景。
從提出Utility Computing的奮斗目標開始,計算機界就清楚公共計算服務與公共電網不同,至少需要關注三個問題。一是接口——用戶如何和資源進行對接?二是服務設備——用戶通過什么設備將資源轉換成服務?三是產品的異質性——計算是一種復雜的服務,存在多樣性,不同的編程語言和硬件如何兼容?通過幾十年的努力,人們已經發明了用于遠程接入的互聯網、管理物理計算資源的操作系統、把資源分給多人同時使用的虛擬化技術。近十年廣泛流行的云計算集成了這些技術,為實現“計算的公共基礎設施”找到了出路。只要云、邊、網、端都盡可能地實現云化,就有可能將原本不是公共物品的計算能力變成虛擬的公共物品。從長遠目標來看,算力網絡的前景一定是光明的。
算力資源還需大量原始創新
媒體上有些文章將目前在做的算力網絡與交通網絡、電力網絡等量齊觀,認為算力現在就可以做到像供水和供電一樣方便,這顯然太樂觀了。計算能力終究不是像水電一樣具有同質性的公共品,每個算力產品都想通過專有的特性贏得競爭,所以算力網絡的實現比交通和能源網絡復雜得多也困難得多。構建算力網絡的技術還不成熟,還需要做很多基礎性的原始創新和大量的技術攻關。
正在研究突破的與算力網絡有關的計算技術包括任務交換技術、智能流抽象、資源賦名、控域、網程、標簽化體系結構、內構安全、在網計算等等,突破這些技術都需要付出艱苦的努力。通信與網絡界也要突破許多關鍵技術,其中確定性網絡對實現性能與用戶體驗可控的算力網絡具有重要意義。
算力網絡要為減熵作貢獻
傳統的“信息高速公路”的技術天花板已出現。“信息高速公路”遵循“無序共享”原則,這一原則為現有的信息基礎設施埋下了巨大隱患——性能干擾,用戶可感知的服務質量存在很大的不確定性(從信息論的角度看就是“熵”比較大)。由于采用大量冗余,各大云計算中心均面臨總體效率不高的問題,許多數據中心的利用率甚至不到20%。因此,在計算機界人士的眼中,算力網絡作為未來網絡的組成部分,要為減熵作貢獻。
中國科學院計算技術研究所(以下簡稱計算所)提出的“信息高鐵”就是建設高通量低熵算力網絡。“信息高鐵”強調“低熵有序”,針對高通量計算,其性能指標是“通量”(goodput,通量=任務吞吐率×良率),即“保質任務吞吐率”,也就是單位時間完成的保質任務數。“信息高鐵”追求的目標是可測、可控、可調、可信,希望能顯著改善應用品質,提升系統通量與效率。
“信息高鐵”按照“一橫一縱”的思路,重新定義下一代信息基礎設施的邊界。“一橫”是通過“聯邦制”的方式橫向聯通,最大化組織起所有愿意共享的大/小數據中心的各類異構算力資源,為用戶提供統一封裝、抽象易用的算力資源;“一縱”是縱向打通云、網、邊、端全鏈路基礎設施資源,通過全鏈路多級多維度測調、控域隔離等方式,實現海量物端應用的端到端服務確保質量。
計算所對“信息高鐵”做了初步的測試實驗,結果表明,不管是任務的良率還是通量,都比傳統互聯網高出6~7倍。而且,越是負載高的時候,“信息高鐵”的優勢越明顯,良率也是如此。
算力網絡要避免“帝國制”壟斷運營
從頂層設計的角度,我認為國家算力網絡的建設應由三部分組成。第一部分是由國家或地方財政建立的公共算力基礎設施,第二部分是電信運營商和龍頭云服務商建設的骨干企業級算力基礎設施,第三部分是由大量中小型信息服務企業協作建立的算力網絡。
算力網絡的構建要高度重視中小企業。我希望全國的算力網絡避免單一“帝國制”壟斷運營,探索新型的“聯邦制”管理模式,激活中小企業的參與熱情。運行方式是否得當,決定著算力網絡的前途。
在布局上,算力網絡既要“全局統一”,又要“環節解耦”。“全局統一”是指全國主要算力中心協同管理,形成東西互補、南北貫通的一體化算力網絡,提供統一的算力資源服務。“環節解耦”是指算力的設備提供商、運營商和增值服務商合理解耦,消費者僅需按統一定價支付費用就可得到多樣性服務。在我看來,算力網絡的生命力在于協同合作,過分強調一家企業的端到端一體化,不利于算力網絡的發展。
計算的應用可分為實時(數據處理)和非實時兩大類。一般而言,有實時要求的應用并不要求很強大的算力,但那些面向基礎研究的科學計算、人工智能的訓練等,雖不要求實時的應用,往往需要使用超級計算機和超大規模的人工智能訓練平臺。
新藥研制和新材料研發、集成電路等新產品的設計等,都需要巨大的算力。非實時的計算可能對國家發展具有更基礎、更長遠的作用,國家級的算力網絡資源應優先考慮非實時的高性能計算和智能計算(模型的訓練)。實時性強的工業互聯網和金融網絡等大多由企業自建。此外,邊緣計算和物聯網大多有實時要求,算力網絡建設要高度重視確定性網絡的研究。
不能無限夸大“東數西算”的減排貢獻
啟動“東數西算”工程,有利于集中建設數據通信網絡,促進我國西部地區的數字經濟發展,能在一定程度上緩解東部供電壓力。但是,放在全國的大盤子上,“東數西算”工程對全國節能減排只有一定比例的貢獻,不能無限制地夸大。
數字中心只要建了,不管建在東部還是西部,都是要耗電的。在西部建數據中心有兩方面的好處。
一是西部的電源使用效率(PUE)值低一點,相對于在東部建數據中心,有可能會節省20%的用電。但如果采用曙光公司發明的浸沒相變液冷技術,耗電量對數據中心所在地的平均氣溫就不是十分敏感。
二是傳輸線路的損耗,2000公里長距離輸電的損耗在6%左右。根據中國信息通信研究院統計的各省區市2020年的算力規模,貴州、甘肅、寧夏、新疆、重慶等西部各省區市算力總和還不到5Eflops,只占我國數據中心算力總規模(140Eflops)的4%左右。即使未來幾年翻倍增長,估計西部新建數據中心的算力5年內也難以超過全國算力的20%。
全國數據中心每年耗電量在2000億度左右,未來西部數據中心最多用電120億度。能節省120億度電當然是值得努力爭取的大事,但與我國總用電量8萬億度相比,只占0.15%。與每年跨省輸電2萬億度相比,也只有“西電東輸”的0.6%。
因此“東數西算”的意義不能光拿省電來說事,也不能把“東數西算”看作是我國算力基礎設施的整體戰略和全部內容,應從國家東西部平衡發展、構建全國算力網絡新基礎設施的大局著眼。目前東部大城市建數據中心的需求很迫切,但沒有用電指標,批地也很困難,向西部尋求算力資源是迫切而合理的選擇。
需要指出的是,我國現行的《供電營業規則》不允許光伏和風力發電站直接給數據中心供電——發電必須入網,電力統購統銷。這種政策不利于在西部建設數據中心。建議國家給數據中心一定的靈活性,推行“源網荷儲一體化”理念,支持算力跟著能源走,促進綠電的消納。
取得實效尚需艱苦努力
另外值得注意的是,雖然中西部地區數據中心在用機架數的全國占比已上升到39%,超過北京、上海、廣東三個數據中心聚集區的在用機架數的全國占比(31%),但機器利用率不高。“東數西算”工程在西部建設的四個數據中心基地如何開展業務、大幅度提高算力的利用率,要做大量細致的工作。“東數西算”要達到“西電東輸”和“南水北調”的實效,還要做艱苦的努力。
美國擁有多個開放的、全球性的、與算力網絡有關的科研創新綜合試驗平臺,它們為美國信息領域科研創新提供了肥沃的土壤。而我國現在僅有一個國家級的未來網絡實驗平臺,先進算力、分布式系統、云計算、邊緣計算等領域的國家級科研試驗平臺還處于空白狀態。
建議國家盡快成立算力基礎設施研究中心和“東數西算”工程技術的試驗場,建設一些開放性的平臺。這些平臺不能是一個“孤島”,應該與現有網絡系統互聯互通,研發面向“東數西算”的“聯邦制”管理、算力測調和撮合交易系統等,形成算力基礎設施化的核心技術、基礎軟件和關鍵系統,并向“東數西算”工程推廣,加快各環節關鍵技術從孵化到完善的全過程,最終形成一套可面向“一帶一路”推廣的新信息技術體系。■
(作者系中國工程院院士、中國計算機學會名譽理事長,記者趙廣立根據其在信息化百人會第八屆信息戰略論壇上的發言整理)