日前,有媒體發布了《除了圓珠筆頭,中國還有哪些核心技術沒掌握?答案令人震驚……》一文,並在網絡上廣泛傳播。文章中介紹了很多中國在諸多科技領域的短板,說明了在精密儀器、數控機床等領域中國依然和國際頂尖水平有較大差距。但文章存在一些明顯的謬誤,比如介紹了幾項有關超算的內容,但這幾項技術卻並非中國還未掌握的核心技術。
日本在CPU+GPU異構式超算方麵技術成果非常有限
《除了圓珠筆頭,中國還有哪些核心技術沒掌握?答案令人震驚……》一文中稱:
“cpu/gpu異構式超算係統的提倡者兼此平台程序軟件的先驅開發者,超級計算機界最高峰學術賞sidney fernbach award的新科得主——東京工業大學全球科學信息計算中心prof.satoshi matsuoka;隨著後續軟體資源的快速配套和並行集群計算技術的加速發展,cpu/gpu異構式超算已經成為整個hpc界的事實標準體係,從最早的tsubame1.2到連續green500測試頭名的tsubame-kfc,目前全球幾乎所有高性能超算係統都是此架構的支持者,matsuoka博士也因此獲得了象征超級計算機領域個人最高榮譽的sidney fernbach award”
拋開文章中非常拗口的表達方式不談,該文章中的內容很容易誤導讀者,以為日本在cpu/gpu異構式超算方麵有很高的成就。那麽,實際情況又是怎麽樣呢?
CPU+GPU異構式超算係統僅僅是異構式超算係統的一個選項,而日本matsuoka博士是CPU+GPU異構式超算係統的提倡者,而之後的完善和實現是全球眾多工程師、公司合力的結果,比如中國國防科大、美國英偉達公司等都參與其中。
就CPU+GPU異構式超算的技術成果來說,中國有天河1A,美國有泰坦。相比之下,日本在CPU+GPU異構式超算方麵卻沒有性能與泰坦相似的CPU+GPU異構式超算係統,根本沒能建成哪怕一台性能達到神威太湖之光十分之一的cpu/gpu異構式超算。即便是日本最新建的超算Oakforest-PACS,也使用的是Intel的眾核加速器,而非美國英偉達公司的GPGPU。
日本新超算Oakforest-PACS
CPU+GPU異構式超算並非高不可攀
異構計算要使用不同類型的處理器來處理不同類型的計算任務。常見的計算單元包括CPU、GPGPU、GPDSP、ASIC、FPGA和其它類型的眾核處理器等。采用異構計算架構的超算會使用至少2種類型的處理器,其中異構計算架構中通用CPU負責邏輯複雜的調度和串行任務,加速器負責並行度高的任務,實現計算加速。
具體來說,采用異構計算架構的超算在運算中既使用處理器,又使用GPU或眾核芯片等加速器。中國天河2號、美國泰坦都采用異構計算架構。
而根據使用的加速器不同,異構超算也有多種類型。
比如美國超算泰坦、中國的天河1A,就是CPU+GPGPU。
中國超算天河2號就是CPU+眾核處理器。
中國天河2A超算則是CPU+GPDSP。由於美國對中國四家超算中心禁售Intel至強PHI計算卡,升級之後的天河2A采用自主研發的矩陣2000來替代Intel的計算卡,在更換加速器之後,變成了CPU+GPDSP,這是全球首創。
此外,也可以使用直接使用經過有著特殊設計的眾核芯片,比如神威太湖之光,這也是全球首創,國外間諜對中國這款眾核芯片非常感興趣。原因就在於這款眾核芯片憑借設計理念的先進性,以落後美國Intel 公司2代的製造工藝,實現了與美國Intel公司最先進計算卡相似的性能。
從中可以看出,CPU+GPU異構體係隻是異構超算體係的一個選項,而非什麽高不可攀的黑科技。而且無論是中國天河2A的CPU+GPDSP,還是神威太湖之光的眾核異構體係目前都是全球唯一,而且性能無與倫比。
文中“目前全球幾乎所有高性能超算係統都是此架構的支持者”不符合客觀事實
文章中稱:“cpu/gpu異構式超算已經成為整個hpc界的事實標準體係”,“目前全球幾乎所有高性能超算係統都是此架構的支持者”。但這與客觀事實不相符。
舉例來說,如上圖所示:2016年TOP500前10的超算依次為:
神威太湖之光,中國,性能93P;
天河2號,中國,性能33P;
泰坦,美國,性能17P;
紅杉,美國,性能17P;
科裏,美國,性能14P;
Oakforest-PACS,日本,13P;
京,日本,性能10P;
代恩特峰,瑞士,性能9P;
米拉,美國,性能8P;
三一,美國,性能8P。
在這當中,紅杉、米拉、三一、京都是屬於同構體係超算,壓根就不是異構體係超算,更遑論cpu/gpu異構式超算。
而天河2號、科裏、Oakforest-PACS采用的是CPU+眾核加速器,雖然屬於異構超算體係,但並非cpu+gpu異構式超算。
神威太湖之光在技術上獨樹一幟,將管理核心與加速器合二為一,屬於眾核異構超算。
在全球性能最強的10台超算中,隻有泰坦和代恩特峰使用了英偉達的GPGPU,屬於cpu/gpu異構式超算。
從中可以看出,“cpu/gpu異構式超算已經成為整個hpc界的事實標準體係”,“目前全球幾乎所有高性能超算係統都是此架構的支持者”這種說法是站不住腳的。
過度鼓吹被淘汰技術並不可取
文章中稱:“NEC喧布已開發完成最新型SX係列矢量超級計算機——SX-ACE這台采用sun架構的矢量超算雖然其總體運算能力(130TFLOPS)排不進世界前5,但卻具備世界第一的單核性能(64GFLOPS)和世界第一的單核內存帶寬(64GB/s),並利用獨到的工業設計實現緊湊化與低耗能”。
首先明確的是,日本比較推崇向量機,SX-ACE其實是向量機,中國在幾十年前也曾經做過,比如已經有不少年月的國內首台銀河億次機就是向量機。因而向量機對於中國來說並非什麽沒有掌握的技術。
現在中國不做向量機,並非沒有掌握該技術而做不了,而是完全是不屑於做。因為這種向量機完全早過時了,完全是被淘汰的設計,性能低就不說了,還有成本高,應用範圍窄的缺點,更要命的是可擴展性也不好。
對於日本的SX-ACE,國內從事高性能計算機的資深工程師表示:這機器現在大概已不存在了吧.....我說大概不存在,主要是目前很少有人再去推崇向量機;第二就是這台機器的性能參數並不突出,不值得耗費時間精力去關注。
最後要補充的是SX-ACE很多技術其實源自美國SUN公司,比如其SPARC處理器,就是SUN公司的遺產。
中國在超算技術上領先日本
在2011年,日本超算京曾經位列TOP500第一。但由於日本經濟在廣場協議之後一直保持在低迷的狀態,加上超算本來就屬於偏向國家工程的項目,相對較少的建造量和昂貴的價格都很難讓私人公司通過超算獲取高額利潤,在研發成本過於高昂的情況下,使得日本NEC、日立等大公司先後退出超算研發領域,唯有富士通還在苦苦支撐。
而在超算研發經費的撥付上,日本政府相當吝嗇。而且還曾發生過這樣一件事——數位日本科學家聯名向政府申請超算研發經費,結果遭到日本政客反問:“當老二有什麽不好?”
也正是因此,由於長時間缺乏經費,導致日本在超算技術上缺乏大型工程的磨礪。對於此,日本官方也是心知肚明。在2016年,日本文部科學省發表了後續基本設計方針:“在發展方針中,日本文部科學省不再追求世界第一的計算速度,而是將目標由加快計算速度轉向了加強節能及便捷功能”。但從曾經追求計算性能最強超算,到如今的追求最節能超算,想必日本從事超算建設的工程師們心中除了無奈隻有苦笑吧。
在美國鹽湖城SC16全球超算大會期間召開的第14屆HPC Connection Workshop中外超算高峰論壇(HPCC)上,日本理化所Mitsuhisa Sato透露了日本發展E級超算的“旗艦2020計劃”,宣布將在2017年4月投入運營Post K超級計算機,其係統峰值性能約為25P, 1000P超算的升級計劃被排到了2020年。
不過,技術發展有其規律,是一步一個腳印迭代演進的,大躍進式一口吃成一個胖子的做法並不可取。而且日本的超算建設十有八九無法按時完成,舉例來說,如今已將近2017年4月份了,日本理化所計劃中投入運營的25P超算尚無音訊。何況日本最新的Oakforest-PACS也隻有13P,從13P迅速跨越到1000P,這中間的技術擴跨度實在是太大,從處理器到互聯網絡都有質的飛越,如果不謀求從美國獲取技術,這對於日本來說未必不是一個挑戰。
目前,中國三家單位同時開展了1000P超算的原型機研製,並計劃在2020年建成1000P超算。考慮到中國在過去幾年中在超算上技術成果斐然,先後研製出曙光6000、天河1號、天河2號、神威太湖之光等性能優異的超算,中國很有可能領先日本完成1000P超算的建設。