中國超級計算機
——突破技術封鎖,模擬核試驗必備設施
工程總投資:100億元以上
工程期限:1975年——至今
2011年10月27日,我國第一台完全采用國產CPU處理器的千萬億次超級計算機——神威藍光,在國家超級計算濟南中心投入使用。該機裝有8704片國產“申威1600”16核64位處理器,僅9個機櫃便能達到峰值性能1100萬億次每秒。計算能力超過20萬台普通筆記本電腦。係統綜合水平處於當今世界先進行列。該係統具備擴充至每秒萬萬億次潛力。
目前,中國已成為繼美國之後第二個可以製造和應用千萬億次超級計算機的國家。在超級計算機領域,美國占絕對領先地位,中國、日本、歐盟、俄羅斯緊隨其後,其他國家居於第三梯隊。全球各國都在大力推進千萬億次計算機計劃.比如美國能源部、DARPA、美國國家科學基金、美國國家安全局、歐盟EU-FP7計劃、日本、法國以及我國的“十一五”計劃,2010年前,曙光將推出千萬億次的曙光6000超級計算機,並大規模采用國產龍芯處理器。
世界第一台計算機
西蒙·克雷(Seymor Cray)博士與他研製的“克雷1號”億次超級計算機。Cray 1超級計算機,是1977年前世界上功能最強大的計算機。
超級計算機的前世今生
1960年,剛成立三年的控製數據公司(CDC)接受美國原子能委員會的委托,涉足萬難之險的巨型機領域。當時CDC公司的電腦總設計師就是年僅31歲的克雷,曾經是UNIVAC設計小組的成員。他是一位性格內向的“隱士”般人物,念念不忘的是建造心目中的巨型機,甚至想“隱退”回家去獨自研究。CDC慷慨地滿足了克雷的願望,在距離總部80英裏的密林深處為他建立了一個實驗室。
克雷帶領他的研究小組,遠遠避開“人世”。小組僅有34人,包括克雷本人在內,也隻有2位博士。1963年8月,克雷終於從“密林”深處複出,把一台被他親切稱作“簡單的蠢東西” —— CDC6600超級計算機公布於世。CDC6600是真正意義上的超級計算機,共安裝了35萬個晶體管,運算速度為300萬次,是其他電腦的10倍。至1969年,克雷研製的CDC6600以及改進型CDC7600巨型機共售出150餘台。
與比爾·蓋茨這樣精明的計算機商人不同,克雷是一個典型的工程師。曾經整整四個春秋,謝絕一切社交活動,埋頭繪製圖紙、製作零件。連著名的學術團體的頒獎,他也不願拋頭露麵,為此博得了“叢林隱士”的綽號。克雷生平極少發表演說。
盡管克雷在上個世紀60年代成功開發了第一代超級計算機,但是真正將這個產品應用起來的還是前麵提到的LawrenceLivermore國家實驗室和另一位超級計算機設計者Frank McMahon,目的是為了克服當時磁芯存儲器存在的延時問題。1971年前後Frank McMahon將這種想法成功地應用於CDCSTAR超級計算機的處理器CDC7600上。
接著,70年代中後期,以向量超級計算為主的超級計算機開始陸續出現,如CDC Cyber205和克雷1號。值得一提的是1975年誕生的“克雷1號”,實現了當時絕無僅有的超高速——可持續保持每秒1億次運算。然而,這台超級計算機的體積卻並不巨大,就像一套開口的沙發圈椅,靠背處立著12個一人高的“大衣櫥”,占地不到7平方米,重量不超過5噸,共安裝了約35萬塊集成電路。
從技術角度來看,克雷1號更加流行。這種機器具有8MB內存,但這種內存是晶體管存儲器,而不是CDCSTAR-100使用的磁芯存儲器。它還引入了向量寄存器的概念。
在整個70年代和80年代初期,向量計算處理對提高計算機運算速度十分有利,有利於流水線的充分利用,有利於多功能部件的充分利用。但由於時鍾周期已接近物理極限,向量計算機的進一步發展已經不太可能。所以,要繼續提高性能也就意味著必須投入多個CPU來同時為一個程序工作。在這樣的背景下,一個全新的概念被提出來了,那就是大規模並行處理(MPP),也是從這個時候,英特爾、IBM和SGI開始成為超級計算機領域的新貴。超級計算機也開始走上了真正的商用化道路。
1992年,英特爾推出Paragon超級計算機,它成為曆史上第一台突破萬億次浮點計算屏障的超級計算機。緊接著,IBM的SP2、日立公司的SR2201和SGI公司的Origin2000超級計算機都先後出現。值得一提的是Origin2000係列後來成為SGI公司製作電影CG的主力,很多大場麵的電影都有它的功勞。
1996年12月,SGI公司研製出一台具有256個處理器的超級計算機安裝在美國國家實驗室。這個係統的處理器還將增加為4096個,運算速度達到了30000億次。
進入2000年之後,超級計算機的競爭日漸激烈,日本和美國彼此成為最大的競爭對手。比如在2003年世界前十名的超級計算機名單中,日本的“地球模擬器”排在榜首,後麵全是清一色的美國產超級計算機。而保持運算速度最快記錄的超級計算機則是日本NEC剛剛發布的SX-8,每秒運算速度高達65萬億次。
在廠商之間,IBM、英特爾、DELL、NEC和SGI的競爭一向激烈,近來又冒出了蘋果。這家公司的G5蘋果超級計算機已經後來居上,超過英特爾居於超級計算機排行榜的第三位。在中國,聯想和曙光同樣開發了國產超級計算機,在全球500強超級計算機中能夠看到中國人的身影。
中國超級計算機曆史
世界上第一台數字電子計算機誕生於1946年,中國電子計算機的科研、生產和應用是從上世紀五十年代中後期開始的。1956年,周總理親自主持製定的《十二年科學技術發展規劃》中,就把計算機列為發展科學技術的重點之一,並籌建了中國第一個計算技術研究所——中國科學院計算技術研究所。1957年,哈爾濱工業大學研製成功中國第一台模擬式電子計算機。1958年8月1日,我國第一台數字電子計算機——103機誕生。
第一代計算機采用電子管。美國研製出第一代計算機用了4年(1943-1946,標誌:賓夕法尼亞大學莫爾學院的ENIAC),而中國通過學習蘇聯的技術,僅用3年就完成了(1956-1958,中科院計算所的103機),並生產了38台。
第二代計算機采用晶體管。美國從第一代計算機進入第二代計算機花了9年時間(1946-1954,標誌:貝爾實驗室的TRADIC),中國用了7年(1958-1964,標誌:哈爾濱軍事工程學院,即國防科技大學前身的441B機),生產了約200台。
第三代計算機采用中、小規模集成電路。這段發展過程美國用了11年(1954-1964,標誌:IBM公司的IBM360),中國用了7年時間(1964-1970,標誌:中科院計算所的小規模集成電路通用數字電子計算機“111機”)。
1965年,中國自主研製的第一塊集成電路在上海誕生,僅比美國晚了5年。在此後的歲月裏,盡管國外對我國進行技術封鎖,但這一領域的廣大科研工作者和工人階級,發揚自力更生和艱苦奮鬥的精神,依靠自己的力量建起了中國早期的半導體工業,掌握了從拉單晶、設備製造,再到集成電路製造全過程,積累了大量的人才和豐富的知識,相繼研製並生產了DTL、TTL、 ECL等各種類型的中小規模雙極型數字邏輯電路,支持了國內計算機行業。當時具備這種能力的國家除中國外,隻有美國、日本和蘇聯。
1983年12月22日,中國第一台每秒鍾運算一億次以上的“銀河一號”巨型計算機,由國防科技大學計算機研究所在長沙研製成功,使我國成為能研製巨型機的少數幾個國家之一,該成果榮獲特等國防科技成果獎。
"銀河"係列超級計算機
1983年12月4日,是我國計算機技術發展史上永遠值得紀念的日子。這一天,我國自行研究與設計的第一台億次巨型計算機提前一年研製成功,通過鑒定;它的誕生標誌著我國計算機技術水平踏上了一個新台階。
1986年年初,國防科技大學計算機係申請研製“銀河Ⅱ”10億次巨型計算機,得到了國務院、中央軍委和當時的國防科工委的批複,1992年11月國防科大成功研製出“銀河Ⅱ”10億次巨型機,實現了從向量巨型機到處理並行巨型機的跨越,成為繼美國、日本之後,第三個實現10億次超級計算機的國家。1994年,銀河Ⅱ超級計算機在國家氣象局投入正式運行,用於天氣中期預報。
1994年3月,在市場激烈的競爭中,“銀河-Ⅲ”正式立項。三年後,1997年6月19日,“銀河-III”百億次巨型計算機係統通過國家技術鑒定,它的研製者還是國防科技大學計算機研究所。從1億次到百億次,從多處理並行巨型機到大規模並行處理巨型機的跨越;標誌著我國已經掌握了高性能巨型計算機的研製技術,而擁有這一技術的國家屈指可數。2000年由1024個CPU組成的“銀河-Ⅳ”超級計算機問世,峰值性能達到每秒1.0647萬億次浮點運算,其各項指標均達到當時國際先進水平,它使我國高端計算機係統的研製水平再上一個新台階。
2006年9月誕生的“神威Ⅰ”的峰值運算速度為每秒3840億浮點結果,在國家氣象局用於氣象數值計算。該機在世界已投入商業運行的前500台高性能計算機中排名第48位,其主要技術指標和性能達到國際先進水平。
"神威"係列超級計算機
上世紀80年代末90年代初,世界計算機領域悄悄地孕育著一場革命,傳統的向量機發展受到了限製,大規模並行機悄然問世。金怡濂教授敏銳地洞察到這一新的發展趨勢是實現中國計算機跨越發展的一次重要機遇。與此同時,機遇也落到了他的身上,他擔任了國家重點工程———“神威”巨型計算機係統的總設計師。
金怡濂教授當即提出了一個我國超大規模巨型計算機研製的全新的跨越式的方案。這一方案不僅當時在國內尚無先例,而且把巨型機的峰值運算速度從每秒10億次跨越到每秒3000億次以上,跨越了兩個數量級。在國家並行計算機工程技術研究中心召開的“神威”機研製方案論證會上,許多人對此方案表示驚訝、懷疑,甚至反對,提出繼續搞比較保險的傳統機型。金怡濂力排眾議:“不挑戰就會失去競爭的機會,不突破就沒有中國巨型機的崛起。”經過他的精辟分析,與會專家最終通過了他提出的總體方案。實踐證明,這是一個具有戰略意義的跨越,闖出了一條中國巨型機趕超世界先進水平的發展道路。
氣象預報是超級計算機最重要的應用領域之一。在神威Ⅰ型機上運行的“集合天氣預報係統”采用了32套原始數據,輸入計算機進行運算,然後得出32個結果,再運用氣象學的知識和統計的規律,在這個結果群裏,找出可能性最大的未來天氣的情況。以往10天的天氣數值預報,在百億次機上運算大約需要640小時,等預報結果出來時,就已經不是“預報”了。利用“神威”機進行運算,則隻需要8小時。
“神威”機的另一項重要的應用就是石油勘探。要開采石油,必須鑽井。打一口井耗資巨大,差不多要幾百萬甚至上千萬,如果選擇的鑽井地點有偏差,那麽投入的人力、財力、物力就會全部浪費,損失巨大。因此提前的精確測算格外重要。
在認為可能的地方進行人工爆破,然後搜集爆破後的反應,記錄它的反射弧,把這些數據送到計算機上進行處理,地質專家再根據得出的結論分析石油的分布。應用“神威”機後,可以明顯提高分析麵積和準確程度。
“神威”機在石油領域的另一個重要應用是“油藏模擬係統”。類似大慶那樣的老油田,油采出來還要注水平以衡壓力。現在地下還剩下多少油,也是需要大量的計算。用普通的工作站,可能要算一個月才有結果,而為了提高準確度,一套程序要算好幾遍。一次就要一個月,顯然達不到要求。用了神威機之後,由一個月變成了一個星期,現在變成了幾個小時。
"深騰"係列超級計算機
中國超級計算機譜係表
國防科技大學計算機研究所——“銀河”係列
銀河-Ⅰ 1983年
銀河-Ⅱ
銀河-Ⅲ
銀河-Ⅳ
天河一號
中科院計算技術研究所——“曙光”係列
曙光一號
曙光-1000
曙光-1000A
曙光-2000Ⅰ
曙光-2000Ⅱ
曙光-3000
曙光-4000L
曙光-4000A
曙光-5000A
曙光-星雲
國家並行計算機工程技術中心——“神威”係列
神威-Ⅰ
神威3000A
神威藍光
聯想集團——“深騰”係列
深騰1800
深騰6800
深騰7000
深騰X
曙光5000百萬億次超級計算機,該係統位居最新公布的全球高性能計算機排名(TOP500)第10位。前9名均為美國研製。目前普通家用電腦的運算速度為每秒20億次左右,曙光5000百萬億次超級計算機的運算能力相當於10萬台個人電腦,共有6000顆CPU與100T海量內存,擁有30720個處理器內核,其理論浮點峰值為每秒260萬億次,采用20GB,延遲小於1.3us的Infiniband高速網絡進行互聯,采用了WCCS + SuSe Linux 雙操作係統。其每天耗電超過1萬度,售價約2億元。
聯想“深騰7000”百萬億次超級計算機,該係統位居最新公布的全球高性能計算機排名(TOP500)第19位,售價超過1億元人民幣。聯想“深騰7000”是世界上規模最大的一個結點無盤啟動的機群係統,成功實現了基於1428個無盤結點的機群係統。同時,它也是世界上第一個實現了對所有硬件部件統一管理和監控功能的機群係統,實現了對機群係統內數千個計算、互連、存儲等硬件部件的統一管理和監控。
1951年的存儲坦克(memory tank),存儲容量20000 bytes。這是史前時代的存儲器,容量相當於20K。在計算機誕生初期並不存在內存條的概念,最早的內存是以磁芯的形式排列在線路上,每個磁芯與晶體管理組成的一個雙穩態電路作為一比特(bit)的存儲器,每一比特都要有玉米粒大小,可以想象,一間的機房隻能裝下不超過百k字節左右的容量。後來才出線現了焊接在主板上集成內存芯片,以內存芯片的形式為計算機的運算提供直接支持。現在我們使用的內存條,單根容量都在1G以上,是這個家夥的50000倍。
這是計算機博物館中重達27公斤,隻能夠存儲5MB容量的硬盤。而現在我們家用電腦使用的硬盤容量,已經達到了1TG,是它的20萬倍。這種史前時代的老古董,確實很神奇。人類科技就是在這種匪夷所思的變化中不斷前進。
IBM 1965年推出的System 360大型主機,被美國航天局用於首次載人登月任務。
1978年,美國DEC公司推出第一款32位超級計算機 DEC VAX,有高達1MIPS的運算性能,售價200000美元.
日本NEC地球模擬器,基於NEC SX架構,640個節點,每個節點有8個矢量處理器(每個處理器的峰值速度為每秒8 Gflop,周期為2ns,16G共享內存,總共5140個處理器,峰值速度為每秒40萬億次,10TB內存,700TB硬盤空間,16PB海量儲存,占地麵積=4個網球場,3層樓。曾經是世界最快的超級計算機,現在已經落伍。
世界第九,歐洲最大超級計算機MareNostrum,它位於西班牙加泰羅尼亞市加泰羅尼亞科技大學(UPC)園區,巴塞羅那超級計算中心(BSC)。它擁有10240顆IBM Power PC 970MB處理器,峰值計算速度能夠達到94.21萬億次浮點計算。組成MareNostrum的2560台JS21刀片式計算結點占據了大約半個籃球場(120平米)的麵積,由美國IBM公司負責建造。
美國IBM公司為德國尤裏希研究中心(FZJ)打造歐洲首台千萬億次超級計算機,該係統擁有72個機櫃,內置294912顆IBM PowerPC 450 850MHz處理器(四路SMP)、144TB內存和6PB硬盤,網絡延遲160ns,帶寬5.1GB s,總功耗2200KW。
在2008年11月評選的超級計算機500強榜單中:
德國最快的超級計算機是美國IBM的“藍色基因”,理論峰值速度223萬億次每秒。用於FZJ研究中心,排名11位。
印度最快的超級計算機是美國惠普的EKA3000BL460C,理論峰值速度172萬億次每秒,用於塔塔公司,排名13位。
法國最快的超級計算機是美國SGI的ALTIX ICE 8200EX,理論峰值速度146萬億次每秒,用於GENCI-CINES,排名14位。
英國最快的超級計算機是美國IBM的POWER 575,理論峰值速度126萬億次每秒,用於ECMWF,排名21位。
日本最快的超級計算機是由美國Cray(日本)公司為日本築波大學、東京大學和京都大學製造的T2K開放式超級計算機係統,采用的是3808顆美國AMD四核皓龍™處理器,峰值速度113萬億次每秒,排名世界超級計算機500強的27位。日本NEC的地球模擬器已經落到了73位,峰值速度才41萬億次每秒,是聯想深騰7000的四分之一。
俄羅斯最快的超級計算機是美國惠普的MVS-100K,理論峰值速度95萬億次每秒,用於聯合超級計算中心,排名35位。
世界各大國裏麵隻有美國、中國是自己製造的百萬億次超級計算機,由於美國嚴格的高技術禁運政策,如果不是我們自己能研製出來,那麽我國現在最快的超級計算機,也就是從IBM買來的25萬億次每秒的淘汰產品。
2009年6月15日,國內首台百萬億次超級計算機 “魔方”,在上海正式啟用。
2009年6月15日,國內首台百萬億次超級計算機 “魔方”,在上海正式啟用。
2009年10月29日,中國第一台千萬億次超級計算機——天河一號,在湖南長沙亮相。“天河一號”由140個機櫃組成,每個機櫃1.45米寬、1.2米深、2米高,排成13排,這個方陣占地約700平方米,總重量約160噸。2010年11月16日,在國際超級計算機TOP500組織正式發布第36屆世界超級計算機500強排行榜上,中國研製的“天河一號”超級計算機,以峰值速度4700萬億次、持續速度2566萬億次每秒浮點運算的優異性能,位居世界第一。比排名第二的美國“美洲虎”超級計算機快了1000萬億次。
天河一號千萬億次超級計算機,運算1小時的工作量,相當於全國13億人同時計算340年;運算1天,相當於1台雙核的高檔桌麵電腦運算620年;總的存儲容量能夠容納1千萬億個漢字,相當於1個存儲10億冊100萬字書籍的巨大圖書館。目前,“天河一號”已在石油勘探、高端裝備研製、生物醫藥、動漫設計工程設計與仿真分析、氣象預報、遙感數據處理等方麵獲得成功應用。這台巨型計算機,每小時耗電4040度,日耗電近10萬度,這在世界超級計算機家族中,已經算是比較節能的“綠色電老虎”了。
天河一號千萬億次超級計算機中,安裝有2048顆國防科技大學研製的飛騰1000(FT-1000)流處理器芯片。飛騰1000(FT-1000)為64位8核處理器,采用GPGPU架構,65納米工藝,3.5億個晶體管,主頻達到1GHz,可實現64線程並行運算。
“星雲”千萬億次超級計算機位於深圳國家超級計算機中心,由曙光公司的曙光TC3600刀片係統集群組成,最大浮點性能為1271萬億次每秒,是世界第三台實現雙精度浮點計算超千萬億次的超級計算機。2010年5月,在德國漢堡舉行的2010年國際超級計算大會上,TOP500.org組織公布了第35屆全球超級計算機五百強排行榜,中國曙光公司研製的“星雲”千萬億次超級計算機,排名世界第二。當時世界最快的超級計算機,是位於美國田納西州橡樹嶺國家實驗室的“Cray Jaguar”,主要用於模擬核試驗,去年11月它的峰值速度是每秒1750萬億次。在上榜計算機總數上,中國此次共有24套超級計算機上榜,與德國持平,位列美國(282)、英國(38)、法國(29)之後,另外中國香港也有一套係統入圍,中國台灣則已從榜上消失。
神威藍光千萬億次超級計算機采用的申威1600型16核64位CPU處理器,是由無錫江南計算技術研究所研製的第三代處理器,2010年8月完成,采用Alpha RISC架構,主頻1.1G,功耗35-70瓦,65納米代工工藝,峰值運算速度達每秒1408億次。運算速度高於日本富士通研製的SPARC64 VIIIfx處理器,和美國英特爾酷睿i7 980XE。