2016年,世界上第一台可程式量子電腦(quantum computer)誕生,可編程從高階使用者介面到執行任意量子演算法。該量子電腦的設計架構規模較小,大約僅由少量的量子位元(Qubit)組成。

但諸如IBM、Google、微軟(Microsoft)等一些大型企業以及幾家新創企業,他們都有著一個終極目標,那就是在不久的將來創造更大規模的商用量子電腦。

量子電腦將會發展得更像是異質多核心電腦的組成部份,其中的古典處理器將與FPGA、GPU以及量子協同處理器等各種加速器相互作用。圖1顯示了量子電腦系統堆疊的不同層級結構。

20191001_Quantum_Computer_NT31P1

圖1:量子電腦系統堆疊圖(來源:DTIS 2018)

荷蘭台夫特理工大學(Delft University of Technology)目前正致力於實現可程式矽量子晶片的設計目標,這可望使得商業可行的量子電腦更接近現實。

如何為量子「吃電怪獸」供電?

由於迄今為止還沒有成熟的量子電腦出現,在此我們先從超級電腦的電源需求開始討論,然後針對現在可用的百萬兆級(Exascale)電腦,最後再探索量子電腦的電源需求。電源管理設計人員面臨的挑戰很快地將從Exascale電腦轉換到量子電腦,而且量子電腦的電源管理還會帶來更獨特的挑戰。但是,掌握如何為這些Exascale電腦供電將為量子電腦供電奠定基礎。

超級電腦

超級電腦通常用於建模以及模擬複雜的動態系統,這些系統的成本太高,不太可能進行實體展示或者不切實際。超級電腦能夠大力協助科學家探索宇宙的形成、生物系統、天氣預測以及甚至是再生能源。而目前最新和最快的新一代超級電腦就是Exascale超級電腦。

Exascale超級電腦

Exascale超級電腦是下一代的超級電腦,它能夠改善涉及醫學、生物技術、先進製造、能源、材料設計和天文物理學等多領域中複雜過程的模擬。這種超級電腦可以更快地執行這些應用的運算任務。

目前,世界上能量最密集的超級電腦是中國廣州的天河二號(Tianhe-2)。這台電腦需要18兆瓦(MW)功率,而Exascale超級電腦——天河三號(Tianhe-3)預計將需要更高功率。引用其他功率數據作為參考,例如一個典型的美國水電大壩大約可產生36MW的電力。

Cray和AMD正聯手為美國政府打造Frontier超級電腦,它將提供1.5EFLOPS (exaFLOPS)的原始處理能力——即每秒1.5百萬兆次(quintillion;10的18次方)的運算能力,並將於2021年投入使用,屆時它將成為世界上速度最快的Exascale超級電腦(如圖2所示)。

20191001_Quantum_Computer_NT31P2

圖2:Frontier Exascale超級電腦(來源:DoE/ Oak Ridge National Laboratory)

這種類型的電腦將大幅推動醫療進步,從而改善全球數十億人的生活。超級電腦由於能夠快速存取並分析病歷、基因和生活環境因素,可望為每個人量身打造藥物治療計劃。而且由於這些電腦具有驚人的處理速度,也有助於專攻癌症腫瘤的精準醫學(precision medicine)發展。

Vicor攜手PEZY Computing

Vicor據稱正與PEZY Computing合作朝此方向發展,因此,我採訪了Vicor公司產品行銷和技術資源副總裁Robert Gendron,和他討論如何以最佳方式為超高速、高耗能的處理器供電。

一提及量子電腦,Gendron馬上就聯想到IBM於2017年推出50-Qubit量子電腦的「金色吊燈」設計(圖3)。從那時起一直到現在,使用這種電腦都還是非常具有挑戰性的,因為量子態僅能維持90微秒。儘管IBM的量子運算不斷在進展中,但其架構仍處於早期發展階段。

如果要處理更複雜的任務,量子電腦還需要數千甚至數百萬的量子位元,設計人員們也正朝著這個目標前進。

Gendron說,日本公司ExaScaler/PEZY Computing為他們自己的處理器板、英特爾(Intel)的主機板以及其他公司的產品,提供了ZettaScaler-2.0可配置液體浸入式冷卻系統,從而有助於使我們更接近於實現Exascale超級電腦。

20191001_Quantum_Computer_NT31P3

圖3:IBM的量子電腦(來源:IBM)

Gendron還說,根據他從業界所掌握到的情報,美國政府可能會率先開發出真正的Exascale電腦。在嘗試打造更高運算能力的過程中,Vicor目前面對的最大問題是延遲。延遲存在於從處理器到記憶體或到其他處理器之間的通訊。他表示,由於晶圓良率和光罩尺寸有限,單個處理器的尺寸只能做到30mm×35mm左右,否則就得挨著放兩個處理器。Gendron說,這是一個密度問題,因為你可能受限於晶片大小,或者面對存在記憶體和其他裝置之間的通訊延遲。

他表示,由於晶圓良率和光罩尺寸有限,單個處理器的尺寸只能做到30mm×35mm左右,否則就得挨著放兩個處理器。Gendron說,這是一個密度問題,因為你可能受限於晶片大小,或者面對在記憶體和其他裝置之間的通訊延遲。

從我所瞭解的產業資訊來看,Exascale處理器以微波速度運作,10GHz處理器也將在幾年內上市。也就是說,這樣的處理器接下來將會需要更大功率以及產生更多熱量,相較於目前的浸入式冷卻,液態氮冷卻也即將到來。而且,隨著處理器速率的提升,我們可能會在這些PC板上看到微波金帶狀線或微帶線(圖4)。

20191001_Quantum_Computer_NT31P4

圖4:第一批量子電腦的兩種系統架構比較。(a) 透過微波諧振器連接的超導量子位元(來源:IBM Research);(b) 透過雷射介導的相互作用而連接的離子阱線性鏈。插圖:量子位元連接圖,星型(a)和全連接型(b)。(來源:IEEE, 2017)

在IEEE發表的《可程式量子電腦架構比較》(Comparing the architectures of the first programmable quantum computers)文獻中,作者提出了在兩種量子電腦上執行一系列演算法選擇的結果,包括第一次實現的隱藏移位演算法(Hidden Shift Algorithm)。該超導系統的優勢在於其更快的閘級速度和固態平台,而離子阱系統具有卓越的量子位元和可重新配置的連接。這些系統的性能反映了基礎硬體的連接程度,顯示量子電腦應用和硬體應該被「協同設計」。

美國能源部(US DoE)正在尋找運算能力達1,000PFLOPS (petaFLOPS)的超級電腦,到2023年這種電腦將需要大約20MW的電力。目前加拿大有一台耗電量為1.35MW的Exascale電腦。

所以,當我問Gendron,Vicor認為什麼才是為這些高耗電的處理器提供動力之最佳電源架構時,我的心中已經有了答案(請參考之前發表的《提升資料中心能源效率 節能省電再出新招》一文)。

Gendron推薦一個值得參考的Green 500網站,這個網站每六個月對電腦進行一次排名,並對其運算能力進行基準測試。他們測試的flops/watt實際上就是能效指標。在2019年6月進行的首次高性能Linpack (HPL)基準測試中,全球500大超級電腦系統已經突破千萬億次PFLOPS或更高的浮點運算速度。在Green 500的這次排名中,DGX SaturnV Volta以15.113GFLOPS/watt的能效排名第一,然而,該電腦採用的Nvidia DGX-1 Volta36處理器在按運算能力排名的TOP 500超級電腦排名中僅位於第469位。

Vicor與PEZY合作開發的Gyoukou超級電腦系統,在2017年的Green 500中排名第4,在TOP 500中排名第5。據Vicor指稱,PEZY超級電腦採用了Vicor的48V分比式電源(FPA),這是一種高效率、高密度的新型配電架構。PEZY的CPU與Vicor的合封電源(Power-on-Package;PoP)模組化電流倍增器(MCM)共同封裝,可在XPU上實現高效的48V直接降壓到低於1V的電流倍增。

PEZY採用Vicor的PoP合封電源,在CPU基板上利用一個電壓穩壓器調節48V輸入電壓,透過消除大部份電路板功耗來減少「最後一英吋」的功率損耗,從而為處理器提供更多電力。Vicor的PoP可提供的實際峰值電流高達1,000A!

例如,當大約1V@400A的電流通過400微歐姆(µΩ)的電路板走線進入處理器時,將400平方後再乘以400 µΩ得到處理器損耗I2R,再根據64W/400W,可知能效提高了近16%。如圖5所示。

20191001_Quantum_Computer_NT31P5

圖5:Vicor的PoP封裝位置接近處理器(紅色方塊)(來源:Vicor)

Gendron表示,未來更大的挑戰在於為處理器提供低於1V的電源,大約為0.5V或0.6V。其困難之處是在0.5V (500mV)範圍內製造一個負載電流級為400A的供電系統。0.5V的10%為50mV,因此需要小於20mV的分級負載,或者如果希望保持在規範範圍內,則其實要小於5mV,但這確實很難實現。

量子電腦

量子電腦自成一類,其架構與Exascale超級電腦有很大的差別。量子電腦可望大幅加速機器學習(machine learning)。

空中巴士公司(Airbus)目前正使用電腦來計算讓飛機最省油的升空和下降路線。而量子電腦可以更快且更好地完成這項任務;很可惜波音公司(Boeing)的Max 8客機未能使用量子電腦來進行其無限飛行模擬)。

最新且最快的量子IC所具有的量子位元陣列將可以在極低溫度下執行,這個溫度低至幾十毫開(milliKelvin, mK;10mK為-459.652℉),比外太空還冷。電源設計人員可以利用這樣的低溫來冷卻其電源架構。冷卻電源架構需要大量的電力,量子處理器也需要相當大的功率,但並不需要像冷卻IC到極端溫度那麼大的功率,光是高效地為量子處理器供電本身就已經是一項艱巨的任務了。在Exascale電腦上,沿著電路板導電走線為處理器供電的I2R損耗已經很巨大了,而處理器的功率要求還要更高。

為量子電腦供電

當這種新型量子電腦真正出現時,就必須為量子處理器開發諸如Vicor PoP的下一代電源架構。

新一代電源架構不僅要為量子電腦的處理器部份供電,還必須為這種新型電腦極具挑戰性的冷卻系統供電。要將系統冷卻到接近絕對零度的溫度,其所需要的龐大功率將遠超過處理器的功率需求。

為冷卻系統供電

Google的量子人工智慧實驗室(Quantum AI Lab)配置了D-Wave最新量子電腦。D-Wave可能算是迄今為止最接近商用的量子電腦之一(圖6)。

20191001_Quantum_Computer_NT31P6

圖6:D-Wave 2000Q系統架構(來源:D-Wave)

一個標準的資料中心通常大約可以容納D-Wave 2000Q量子電腦。

具有多層遮罩的D-Wave製冷系統位於內部的高真空中,溫度略高於絕對零度。這套系統讓電腦得以與外部磁場、震動和RF訊號隔離開來,免於這些訊號導致該高度敏感的量子電腦系統出錯。

D-wave quantum processing unit 700

圖7:量子處理單元(來源:D-Wave)

D-Wave系統的功耗低於25kW,而且其中大部份都用於冷卻系統和前端伺服器的運作。

D-Wave量子處理單元(QPU)由金屬鈮(Nb)的微小環形晶格構成,每個晶格都是一個量子位元(如下圖所示的紅色區域)。在低於9.2k的溫度下,鈮變成超導體並顯現量子力學效應。在量子態下,電流同時向兩個方向流動,這意味著量子位元處於疊加態——即同時處於0和1兩個狀態。在解決問題的過程結束時,這種疊加態塌縮為兩個經典狀態之一,0或1。

不久的將來,更強大的量子電腦會出現,它將需要更高的功率,尤其是用於處理器。

(參考原文:Power supply management in quantum computers,by Steve Taranovich)