北京時間今日凌晨 4:20 時許美國鹽湖城 SC16大會上,我國自主研發的超算系統「神威·太湖之光」繼日前蟬聯TOP 500世界第一殊榮後,一舉拿下高性能計算應用最高獎「戈登•貝爾獎」,實現了我國在該獎項上零的突破,成為中國高性能計算應用發展新的里程碑。
2016年11月17日(北京時間 18日凌晨4:20左右),美國鹽湖城 SC16 大會上,我國全自主國產處理器構建的超級計算機「神威·太湖之光」,繼不久前蟬聯TOP 500榜單世界第一後,一舉拿下「戈登•貝爾」獎,實現了我國高性能計算應用在此項大獎上零的突破,成為我國高性能計算應用發展的一個新的里程碑。
「戈登•貝爾」獎(ACM Gordon Bell Prize)設立於1987年,是國際高性能計算應用領域最高獎,由美國計算機協會(ACM)每年11月在美國召開的超算領域頂級會議(SC)頒發,旨在獎勵時代前沿的並行計算研究成果,特別是高性能計算創新應用的傑出成就,被譽為「超級計算應用領域的諾貝爾獎」。與TOP 500著眼於高速計算硬體性能不同,戈登•貝爾獎更注重於高性能計算應用水平。美日研究人員憑藉運行在美國「泰坦」超級計算機、日本「京」超級計算機上的應用,都曾經連續獲得該獎項。而事實上,近30年來,該獎項一直被美國和日本壟斷。
今天,中國終於打破了這一壟斷!本次獲獎表明,「神威·太湖之光」不僅多項指標世界第一,也可依託其強大的運算能力解算出世界一流的應用成果,未來更有能力開展實際大規模挑戰性應用。
蟬聯 Top 500 榜首,硬體指標世界第一
「神威·太湖之光」的名字在今年 6 月就刷爆過朋友圈,在第 47 次 HPC TOP500 榜單上,它取代天河2號,成為全球運算速度最快的計算機,也是世界上第一台性能接近100P 的機器。不僅如此,神威的上榜也讓中國首次超越美國,成為入圍 TOP500 超級計算機總數量最多的國家。
幾天前,每年按例發布兩次的 ISC TOP500 榜單再次公布,神威·太湖之光蟬聯第 48 次 HPC TOP500 冠軍。
今年11月公布的第 48 屆Top500 榜單,排名前十的超級計算機系統,神威·太湖之光繼今年6月首次登頂後,蟬聯榜首
TOP 500 評選注重高速計算硬體性能,神威·太湖之光的表現足以證明中國的超算運算能力。平台已經搭建好,只待在基礎上開展深度研究,解決很多只有超算才能解決的重大科學與產業問題。
軟體應用迎頭趕上,戈登·貝爾獎實現零的突破
「戈登•貝爾」獎領獎現場
此次全球共有 6 項應用成果入圍「戈登·貝爾」獎最終提名,其中 5 項都來自中國,幾乎包攬了該獎項 2016 年全部提名。在這 5 項提名中,又有 3 項都是基於「神威·太湖之光」系統的全機應用:「千萬核可擴展全球大氣動力學全隱式模擬」、「高解析度海浪數值模擬」、「鈦合金微結構演化相場模擬」。另外 2 項應用分別為國家海洋局海洋一所與清華大學合作的「高解析度海浪數值模擬」,還有中科院網絡中心的「鈦合金微結構演化相場模擬」。
2016 年度的「戈登•貝爾」獎授予了基於「神威·太湖之光」的全機應用《千萬核可擴展全球大氣動力學全隱式模擬》,由中國科學院軟體研究所、清華大學、北京師範大學、國家並行計算機工程技術研究中心,以及國家超級計算無錫中心的聯合團隊共同完成。
「戈登•貝爾」獎證書
該應用團隊設計並開發了一種新的用於大氣動力框架的高可擴展全隱式求解器,世界上首次在大規模異構系統上實現了高效和千萬核可擴展的全隱式求解,並將模擬解析度提升至500米以內,有望未來應用於全球高解析度氣候模擬和高精細數值天氣預報。
該課題在應用與算法兩個層面實現了重大突破:
應用層面,大氣動力過程的模擬速度較美國下一代大氣模擬系統(AM3,GFDL開發)的計算效率提升近一個數量級,全隱式求解方法是未來超高解析度大氣模式構建的一種新選擇;
算法層面,實現目前世界上第一個可擴展到千萬核,峰值效率超過 6% 的隱式求解器,較 2015 年「戈登•貝爾」獎工作在並行度和峰值效率均提升一個數量級。
國家超級計算無錫中心付昊桓副主任、甘霖博士與楊超研究員在獲獎現場
國家超級計算無錫中心赴美人員獲獎集體合影
本次榮獲戈登·貝爾獎,是對「神威·太湖之光」開展實際應用課題的肯定。可以預見,「神威·太湖之光」將圍繞世界重大科技需求,持續開展高性能計算應用服務,支持高性能計算髮展戰略及創新型國家建設,特別將在能源環境、先進位造等領域發揮重要作用。
獲得「戈登·貝爾」獎,對中國超算意味著什麼?
根據微信公眾號「本來科技」趙廣立報道《「神威」應用摘得「戈登·貝爾」獎!向世界證明中國超算不光拼速度》,超級計算機系統作為各國科技競爭力和綜合國力的重要標誌,是世界高技術領域的一個戰略制高點。而使超級計算機系統真正發揮效用、為各領域提供高效計算服務,還是由高性能計算的應用發展水平決定。如果說超算設備和性能是各國高性能計算的硬實力,那麼應用水平則象徵著各國高性能計算的軟實力。也就是說,各國卯足了勁兒發展高性能計算,不僅在於其戰略地位,更在於其應用實效。
這些年來,中國超算取得的成績有目共睹。「天河二號」、「神威·太湖之光」屢屢在性能指標上攀上世界之巔,我國在高性能計算機的數量和用戶類型上也達到了前所未有的層次。然而卻始終未能獲得戈登·貝爾獎。
2014年的中國計算機大會專門召開專題論壇,聚焦「戈登貝爾獎離我們還有多遠」。
因此,本次獲獎消息比「神威·太湖之光」登頂世界超算500強更令人振奮!朋友圈裡的大佬們都難掩激動!
超算界第一時間向團隊表示祝賀
從另一個角度,高性能計算機系統研製水平的不斷提高,最終的落腳點仍應是為了更好地使用其計算資源,並在此基礎上產生更為廣泛的成果和效益。「用好超級計算機甚至比研製超級計算機更難」已成為國內外業界共識。
諾貝爾評選委員會在2013年將諾貝爾化學獎授予美國化學家的「為複雜化學系統創立了多尺度模型」研究時就在聲明中說:「對化學家來說,計算機是同試管一樣重要的工具。」因此,如果只有計算機而不會用它,無異於空有寶刀而不能斷朽木。
神威·太湖之光技術三大突破
今年 6 月,神威·太湖之光首次登頂 Top 500 榜首時,新智元就對此進行了報道。神威·太湖之光由國家並行計算機工程技術中心研發,在無錫國家超算中心安裝完成,2015年12月21日完成整機系統性能測試,目前由清華大學負責運營。
神威·太湖之光使用我國自主研發和製造的 CPU 處理器——申威 26010(SW 26010),採用眾核+CPU架構,含有將近 1065 萬個內核,主內存 1.31 PB。
神威·太湖之光核心組示意圖
64個計算核心排列為8×8的矩陣。4個內存控制器總共提供了136.5GB/s的帶寬。
每組內部有自己的專屬內存空間,組間通過片上網絡(NoC)進行通訊。片上網絡還連接著系統接口(SI),供晶片同外部設備通訊。
神威·太湖之光架構示意圖
神威·太湖之光專為提升運算速度設計,簡單的架構正是它運算速度勝過其他高能耗 HPC 系統的原因。
國家超級計算無錫中心主任楊廣文教授 6 月份在接受《人民日報》採訪時表示,神威·太湖之光一分鐘的計算能力相當於全球 72 億人同時用計算器不間斷計算 32 年。
楊廣文說:「從低功耗、高集成度的處理器設計,到高速高密度的工程實現技術;從世界領先的高效水冷技術,到軟硬體協同、智能化的功耗控制方法,『神威太湖之光』實現了層次化、全方位的綠色節能,功耗比達到每瓦特 60.51 億次運算。」
神威·太湖之光運算峰值為 125.4 Pflop/s,持續性能 93 Pflop/s,比天河 2 號快了將近 3 倍,比排名第 3 的美國橡樹嶺實驗室的機器快了 5 倍,也是國際第一台性能接近 100P 的機器。
美國Titan、天河二號、太湖之光參數對比
神威·太湖之光每瓦特浮點運算次數達到了 6 億次——目前,世界排名前 10 的其他超級計算機能耗比都在 2 Gflops/W 左右——也即能耗比達到 6 Gflops/W,與 Green500 第一的日本機器相差不到10%,但太湖之光規模明顯更大,因此實現的技術獨到。
世界排名第 2 到第 6 的超級計算機,每瓦特浮點運算次數都在 2 億次左右
硬體、軟體合力推動中國智能產業發展
《環球網》記者劉揚走訪神威·太湖之光,文中提到中國超算的發展長久以來一直受到關注,但外界對於這個很燒錢的戰略項目也有不少質疑,其中很重要的一個原因就是中國花大價錢造出了全球性能最好的超算,但在應用方面卻「吃不飽」,甚至有用「十車道高速路上跑著很少的車輛」來形容中國超算性能與應用水平之間的關係。
11月,採用中國自主設計和研發的晶片的神威·太湖之光蟬聯 Top 500 榜首,在超算領域樹立了新的標杆,在美國 X86 之外建立了新的生態。而今,再一舉拿下戈登貝爾獎,意味著我國超級計算應用軟體研製水平和應用水平已得到顯著提升。
以神威·太湖之光為代表的中國超級計算系統的崛起,也預示著中國智能產業的飛速提升。