當前,我國產(chǎn)業(yè)正處于蓬勃發(fā)展之中,在取得快速增長的同時也實現(xiàn)了質(zhì)量提升。而從規(guī)模上來看,我國數(shù)據(jù)中心還有巨大的增長空間。如何在前進的道路上實現(xiàn)高質(zhì)量發(fā)展?日前,《人民郵電》報記者獨家專訪了中國工程院院士鄔賀銓,而云與綠色無疑是答案中的兩大關(guān)鍵詞。
中國潛力巨大
“中國的數(shù)據(jù)中心盡管增長很快,但相對美國來說總量還是比較少,而巨大的互聯(lián)網(wǎng)用戶群體,注定中國未來數(shù)據(jù)中心的機架數(shù)不會低于美國。”鄔賀銓強調(diào)。
當前,我們身處一個“數(shù)據(jù)大爆炸”的時代。統(tǒng)計顯示,人類歷史上90%的數(shù)據(jù)都是在過去幾年產(chǎn)生的,50%是在短短兩年內(nèi)產(chǎn)生的。聯(lián)合國《2019年數(shù)字經(jīng)濟報告》顯示,全球IP每秒流量1992年僅為1.16MB,但是到2022年將達到150TB,30年增長1.3億倍。而根據(jù)《華為全球產(chǎn)業(yè)展望GIV》,全球新產(chǎn)生的數(shù)據(jù)量將從2018年的32.5ZB快速增長到2025年的180ZB。
中國的數(shù)據(jù)中心規(guī)模迅速擴大。近日36氪研究院發(fā)布的數(shù)據(jù)顯示,截至2019年年底,我國在用數(shù)據(jù)中心機架達到315萬架,其中大型以上數(shù)據(jù)中心增長較快已超過250個,機架達到236萬架,占比超過70%。
從全球數(shù)據(jù)中心的發(fā)展來看,美國數(shù)據(jù)中心機架數(shù)目前已占據(jù)全球40%的市場,其后是中國和日本,分別占8%和6%。鄔賀銓認為:“中國數(shù)據(jù)中心發(fā)展比美國晚5年,但中國的互聯(lián)網(wǎng)用戶數(shù)決定了中國數(shù)據(jù)中心規(guī)模將來不會小于美國。”
云數(shù)據(jù)中心成為方向
數(shù)據(jù)中心是各種IT資源的集成中心,也是數(shù)據(jù)存儲、處理和交互的中心。伴隨著的發(fā)展,數(shù)據(jù)中心也開始云化轉(zhuǎn)型。“云數(shù)據(jù)中心,采用超融合架構(gòu),可以實現(xiàn)更好調(diào)度。”鄔賀銓指出。
云數(shù)據(jù)中心相比傳統(tǒng)數(shù)據(jù)中心,有著一系列的優(yōu)勢。首先,采用超融合架構(gòu),將物理分布的服務(wù)器、存儲、網(wǎng)絡(luò)等資源虛擬化為邏輯集中的巨大資源池。其次,采用容器和微服務(wù)模式,通過云計算管理平臺可動態(tài)監(jiān)控、調(diào)度和部署各種資源,從而按需向用戶提供差異化服務(wù)。再次,基于IPv6協(xié)議,能夠?qū)崿F(xiàn)云網(wǎng)協(xié)同與多云融合。最后,改進數(shù)據(jù)中心的可擴展性,降低管理的復雜度,提升運營維護效率,增加安全可靠性。
數(shù)據(jù)中心能耗不容忽視
“相比傳統(tǒng)產(chǎn)業(yè),數(shù)據(jù)中心作為一項ICT產(chǎn)品,本身的能源利用效率是比較好的,但是數(shù)據(jù)中心的能耗還是會伴隨著快速發(fā)展而較快上升,因此其自身的能耗仍不可忽視。”鄔賀銓指出。
數(shù)據(jù)中心自帶“綠色”基因。有資料認為,ICT產(chǎn)業(yè)單位增加值能耗僅為全國單位GDP能耗的1/5,僅為全國單位工業(yè)增加值能耗的1/9。尤為值得注意的是,數(shù)據(jù)中心還將助力傳統(tǒng)行業(yè)節(jié)能減排,對全社會碳達峰、碳中和的貢獻都是正面的。
但是,數(shù)據(jù)中心自身能耗上升較快不容忽視。中國電子學會等編寫的《中國數(shù)據(jù)中心可再生能源應(yīng)用發(fā)展報告(2020)》顯示,截至2019年,全國各類數(shù)據(jù)中心用電量占全社會用電量的0.8%~ 1%,預計到2030年達到1.5%~2%。目前,我國數(shù)據(jù)中心在能耗上的表現(xiàn)不一。中國數(shù)據(jù)中心工作組(ODCC)的數(shù)據(jù)顯示,PUE(電能使用效率)在1.0和1.2之間的占比僅為5%,高達51.6%的數(shù)據(jù)中心PUE為1.4%~1.8%,PUE降低還有很大空間。
我國數(shù)據(jù)中心PUE降低還有很大的空間。
多措并舉提高能效
“提升數(shù)據(jù)中心的能源利用效率,可以從建設(shè)和技術(shù)兩方面優(yōu)化,多措并舉。”鄔賀銓指出。
在建設(shè)方面,可以通過優(yōu)化選址和充分利用綠色能源來提高能效。所謂優(yōu)化選址,就是選擇氣候條件適宜、綠電供應(yīng)充足的地區(qū)建設(shè)數(shù)據(jù)中心。此外,還可利用山洞自然冷風循環(huán)、海水制冷等。而在數(shù)據(jù)中心的園區(qū)建設(shè)上,可采用預制化裝配式建筑,在建設(shè)上疊加光伏,采用綜合供能、高效制冷、余熱循環(huán)利用等措施。
在技術(shù)方面,數(shù)據(jù)中心提升能效其實大有可為。例如,通過優(yōu)化數(shù)據(jù)存入與讀出的體系架構(gòu)與機制,實現(xiàn)上級可調(diào)用下級數(shù)據(jù),但不必將下級數(shù)據(jù)庫數(shù)據(jù)再復制存儲至上級數(shù)據(jù)中心,從而避免了重復存儲帶來的巨大浪費。
數(shù)據(jù)預處理可以僅存儲有效數(shù)據(jù)并提升數(shù)據(jù)利用率。當前,數(shù)據(jù)預處理能力不足導致數(shù)據(jù)存儲與利用率低。有資料認為,當前企業(yè)的數(shù)據(jù)僅有不到2%被保存。而保存下來的數(shù)據(jù),由于技術(shù)與流動性的問題,只有10%的數(shù)據(jù)能得到分析。通過數(shù)據(jù)清洗與標注提升存儲數(shù)據(jù)的質(zhì)量,可以減少無效數(shù)據(jù)的存儲。數(shù)據(jù)清洗是對數(shù)據(jù)進行一致性檢查,處理無效值和缺失值,從而大大減少數(shù)據(jù)的存儲量。數(shù)據(jù)標注通過對數(shù)據(jù)進行分類標注、標框標注、區(qū)域標注、描點標注等,也能夠減少存儲量。不過,“目前數(shù)據(jù)的預處理70%的工作量還是主要依靠人工完成,因此數(shù)據(jù)中心目前還是勞動密集型行業(yè)。”鄔賀銓特別指出。
云邊端協(xié)同可以有效提升數(shù)據(jù)處理效率。例如,一個城市的視頻監(jiān)控數(shù)據(jù)如果直接送到云端進行AI分析將占用大量計算與存儲資源,需要云邊端都具有一定的數(shù)據(jù)處理能力并協(xié)同。又如,VR視頻需要交互而且畫面需要渲染,手機的GPU來做渲染時會遭遇畫面卡頓且手機發(fā)熱的挑戰(zhàn)。對此,可以將視頻圖像分解為前景與背景,分別由手機與邊緣計算完成。與此同時,可以通過采用預渲染全景幀、移動預測、多核CPU并行解碼等技術(shù)以降低時延。
正確應(yīng)對小數(shù)據(jù)帶來的挑戰(zhàn),例如通過遷移學習和高效AI分析,實現(xiàn)“小數(shù)據(jù)小算力大任務(wù)”,也可以有效減少數(shù)據(jù)存儲量。2020年6月,IEEE舉辦了世界計算機視覺植物病理學細粒度分類挑戰(zhàn)賽,考察對蘋果樹葉銹病、痂病等疾病的AI識別能力。IEEE提供了含標簽錯誤的1821張訓練照片和1821張試題照片,這是典型的“小數(shù)據(jù)小算力”問題。支付寶天筭安全實驗室采用了隨機光照、隨機對比增強、上下與左右翻轉(zhuǎn)等數(shù)據(jù)增強技術(shù),得分居1327個參賽團隊之首。
特別值得注意的是,“比特幣耗能驚人且毫無社會價值,必須加以限制。”據(jù)英國劍橋大學的替代金融研究中心(CCAF)計算,比特幣的能耗已超過全球所有數(shù)據(jù)中心的一半,而中國幾乎擁有世界上一半的“礦工”。隨著比特幣不斷被挖掘,規(guī)則設(shè)計就會變得越來越難,這就意味著需要越來越高的算力投入到比特幣挖礦上。“巨大的能耗,并沒有給人類帶來任何有用的幫助,還縱容了一些投機行為,應(yīng)該限制比特幣的應(yīng)用。”鄔賀銓指出。事實上,針對比特幣帶來的巨大能耗,我國相關(guān)監(jiān)管機構(gòu)已經(jīng)開始采取有效措施進行遏制。例如,5月21日,國務(wù)院金融穩(wěn)定發(fā)展委員會召開的第五十一次會議提出,打擊比特幣挖礦和交易行為。