提升資料中心能源效率 節能省電再出新招

作者 : Steve Taranovich,EDN資深技術編輯

針對蓬勃發展的資料中心領域,開發人員可以依據設計需求,結合自己的設計專長以及電源IC公司的專家經驗與具創造力的解決方案,為客戶設計符合需求的節能省電解決方案...

在開始討論2019年最新的資料中心電源管理解決方案之前,我想先簡要地描述資料中心的發展概況。2016年,我曾經撰寫了《下一代電源解決方案提升資料中心效率》(Data center next generation power supply solutions for improved efficiency)一文,在那之後的發展歷經了很大的變化。

圖1:Data Center Frontier網站討論了2019年資料中心的發展趨勢
(圖片由LinkedIn提供,展示該公司位於美國俄勒岡州Hillsboro的資料中心)

根據預測,到2025年,全球的總數據容量將會超過175ZB。隨著5G的來臨——最早將於2020年日本奧運會採用——以及人工智慧(AI)和機器學習(ML)的發展,資料中心的建設與部署,以及升級現有較傳統的資料中心任務都將突飛猛進。

未來會有很多連網技術希望利用5G的優勢,其挑戰是需要高速處理大量資料。至於邊緣運算,它可能會是雲端運算之後的下一個主要技術趨勢。它指的是在最接近資料來源的地方處理資料。這樣可以確保速率以及低延遲,協助達到5G的性能目標。然而,有些應用對延遲要求不高,這一類應用仍然需要中央資料中心的支援。

我們將會見到新一代電信局端(NGCO)的發展。它們是邊緣雲端資料中心,可以支援固定和行動資料串流。NGCO將設置在無線電接取網路(RAN)和中央核心網路之間,相較於目前支援大約5,000個訂戶,未來每個局端平均可支援35,000個訂戶。

無論資料在哪裡進行儲存或處理——是在邊緣、區域中心(都會區網路)或是中央——對於容量的需求都將持續增加。從2019年底開始,這一需求將會大幅提高,服務供應商因此也將必須改善或轉變其基礎架構,以便支援5G的發展。大部份接取5G網路的資料都會存在於雲端,突顯資料中心必須扮演的重要角色。

供電挑戰

預防資料中心的系統受到破壞至關重要,畢竟,停機會造成大量的金錢損失以及客戶投訴。營運商可能依靠不斷電供電系統(UPS)及配電單元,以便安全可靠地對於敏感的設備供電。擁有備用電源的中小企業和住宅建築物也可能採用負載管理方案。通常每機架的電力超過10kW,因此在機架內不太容易實現電源保護,業界即將採用機櫃列尾(end-of-row;EoR)式UPS系統。

智慧電源管理

智慧電源管理(IPM)指的是為電腦系統與資料中心實現最佳化配電與用電的軟硬體組合。雖然安裝IPM需要前期費用以及持續的維護,但從長遠來看,由於這項技術可節能省電、減少停機時間並延長硬體壽命,因而能夠節省成本。

最高效的IPM解決方案包含溫度監控與調節、穩壓、限流以及負載分配。先進的IPM技術配有支路保護(每一組插座都有自己的斷路器或熔斷器),以及集中/整合型管理功能,從而使管理人員能夠監控資料中心的所有硬體,進而快速隔離並解決問題。此外,它還具有智慧減載功能,可在特定的條件下有條不紊地關斷非必要的裝置。

三相供電

採用三相供電通常可平衡電源負載,並為每個負載提供最大電流。採用分區冷卻,還能防止產生孤立過熱事件,並使能耗降到最低。為系統提供冗餘,則可在局部硬體或軟體失效時確保不間斷操作,而對多家供應商的電源硬體進行協調管理,則可以保持資料中心持續運作。

冷卻

直接液冷等新冷卻技術開始受到關注。市場正為這種技術探討多種方案,例如直接為晶片給水,或將伺服器完全浸入到水中(詳見《將電源浸入水中或其他方案》(Submerge your power supply, and other options)。

例如,施耐德電機(Schneider Electric)的資料中心部門就把液冷定為其下一個重大成長領域。超大規模資料中心以及雲端平台是這項技術的主要推動力。此外,該公司也討論了直接為晶片給水以及完全浸入水中等方案。

宜普電源轉換公司(EPC)的增強型氮化鎵(eGaN)場效應電晶體具備散熱優勢,本文後續將會對其進行敘述。

資料中心的UPS系統開始採用鋰離子電池代替鉛酸電池,作為備用電池。

高壓配電可降低I2R損耗。相較於12V配電方案,轉用48V配電的功耗可降低16倍。

現在看看從48V轉換一直到需要超低電壓/高電流的GPU應用,業界主要的電源IC公司為此提供了哪些解決方案。我喜愛這些方案,特別是從電源工程師的角度來看,在資料中心這一越來越具挑戰性的領域,這些都是打造電源架構的理想選擇。

在作為電路設計工程師40餘年的經驗中,我體認到並非所有電路架構的創建都相同。有的架構可能非常適用於某種特定設計,而另一種不同架構可能更適合某種不同場景。請對以下解決方案保持開放心態。由於電源設計並非千篇一律,因此特別的專案會有特定的電源管理需求。尤其是要注意客戶的需求,然後利用電源設計專業知識,為最終客戶提供最佳設計。只有經過深入的溝通和討論,才能為專案找到最佳的電源解決方案。

話雖如此,但我卻非常喜歡基於氮化鎵(GaN)功率元件的解決方案——從作為設計人員的看法和經驗來說,這是我個人的首選。採用GaN取得的最終特定電源架構十分多樣——因此需要做出明智的抉擇。

EPC公司執行長兼共同創辦人Alex Lidow曾經針對隔離與非隔離、穩壓與非穩壓架構案例進行了研究。他的觀點是,第一階段可能不需要穩壓,而是作為直流變壓器(DCX)工作。在這些案例中,Lidow考慮了4種採用中間匯流排的不同解決方案:

  1. 隔離磚式穩壓轉換器
  2. 非隔離DC/DC轉換器
  3. 48V降壓LLC DC變壓器
  4. 48V-1V混合轉換器

採用雙電感混合轉換器(DIHC)或是具有6VOUT的LLC轉換器經測定可實現最高效率。然而,DIHC拓撲較新,仍待普遍採用。在新的人工智慧(AI)和電競應用中,48VIN–6VOUT LLC轉換器,配合6VIN–1OUT降壓轉換器,由於具有高效、高功率密度及低成本等優勢,因此正被快速採納中。

在所有採用48VIN的拓撲中,GaN元件實現了最高的效率。原因在於其電容更低且尺寸更小。

宜普電源轉換公司(EPC)

GaN也是資料中心電源架構的首選功率電晶體,因為小型化、高效率以及開關速度在此非常重要。由Alex Lidow所帶領的EPC公司專家團隊設計了一款非常好的電源架構。

尤其是EPC的晶片封裝將eGaN元件用於資料中心,以實現從六個邊散熱。由於GPU的電能需求與日俱增,某些資料中心開始考慮採用液冷方法。相較於其他功率元件,eGaN更有助於延緩這種費錢費力的工作。

要不要採用隔離?

隔離前端

對於前端電源設計,EPC提供硬開關、48V-12V降壓、變壓器隔離、500W穩壓以及1/8磚式轉換器,其輸出為12V、42A。EPC9115的效率是96~97%。由於高頻GaN開關縮小了磁體,因而較傳統矽基解決方案的佔板面積更小。

非隔離前端

對於非隔離前端,該公司提供48V轉5-12V、25A的同步降壓轉換器。這項設計也採用GaN功率元件,其高頻開關可實現矽基元件無法企及的更小佔板面積。該設計在15A負載條件下可實現97%的峰值效率,而在25A時則可達到96.5%。

48V-12V降壓LLC DC變壓器前端

這個設計在作為具有固定轉換比的DCX使用時,可在很寬的工作範圍內保持高效。EPC提供的48V-12V展示板效率超過98%。

圖2:(a)N:1 LLC轉換器的電源架構原理圖,其上配有中心抽頭整流器;(b)1MHz、900W、48V-12V的LLC轉換器照片及其尺寸。

採用8:1變壓器的48V–6V LLC轉換器

這個設計可以在1MHz頻率時處理900W功率,它採用了14層PCB、2.2μH磁電感,以及GaN功率元件。

圖3:1MHz、900W、48V–6V LLC轉換器設計。

48V轉4V

目前的趨勢是轉用4V來為負載架構供電。這取決於輸出電晶體和某些其它元件,但從6V改為4V輸出的影響並不大。該變壓器由於是矩陣變壓器(所有的矩陣變壓器專利都已過期,而該IP目前在公開領域),因此在900W時,其尺寸會按比例增大一點。這個架構的效率大約是98%。Alex Lidow說已可實現6V、5V、4V和3.3V的架構。他著有《利用48V匯流排對GPU供電》(powering graphics processors from a 48V bus)一文,其中分析多種中介架構到負載點(POL)。

48V-1V混合式轉換器

該設計採用基於Dickson開關電容轉換器的雙混合式轉換器(DIHC)架構,在輸出端採用兩個交錯式電感器,而不需要混合式Dickson轉換器所需的兩個大型同步開關(圖4中的S9和S10)。

圖4:8-1 Dickson轉換器。

相較於混合式Dickson轉換器,該設計可使DIHC實現約低兩倍的DC輸出阻抗(由於開關及飛跨電容導通所產生),進而實現低2倍的導通損耗。請看圖5中的DIHC效率曲線。

圖5:DIHC在48V輸入以及多種不同低電壓輸出情況下所測得的效率。

磁體

高頻變壓器的頻寬在大約2MHz時,可改善此設計的響應時間。

結果分析

DIHC或6VOUT的LLC轉換器都可以實現最高效率。EPC坦言DIHC拓撲較新,還未能普遍採用。但我認為在這種架構中採用GaN元件將具有優勢。

48VIN–6VOUT LLC轉換器配合6VIN–1VOUT降壓轉換器使用的效率會更好,而且由於其具有高功率密度和低成本等優勢,因此常適合新的AI和電競應用。

意法半導體(ST)

意法半導體(STMicroelectronics;ST)的策略及其針對資料中心電源架構的產品令人印象深刻。首先,ST加入了電源模組聯盟(Power Stamp Alliance,PSA)。我個人十分喜歡的是,在開發雲端資料中心電源方案公司工作的設計人員和採購人員,可以從不同的電源供應商取得適合各種形式和功能的電源解決方案。資料中心的人員也對此感到高興。 

圖6:ST提供一系列針對資料中心的電源解決方案。
(圖片來源:ST)

ST電源IC產品推廣經理Paolo Sandri介紹其資料中心電源管理策略的重點是,ST針對不同客戶的需要,提供多種方案,畢竟並不存在通用解決方案。

48V–12V非穩壓中介匯流排轉換器(IBC)

這個設計具40V至60V輸入、4:1轉換比以及高達1kW的散熱設計功耗(TDP)。英特爾(Intel)將TDP定義為「一種處理器的規格。OEM所設計的散熱解決方案必須符合或超過處理器資料表中所規定的TDP。」

圖7:開關式儲能轉換器(STC)、非穩壓中間匯流排轉換器。
(圖片來源:ST)

這個設計所用的MOSFET全部具有零交叉開關(ZCS),所有元件都是現貨元件,而且高度低於5mm。其尺寸是1/8磚,在360W時效率高達98%。

STBuck(堆疊降壓)、48V-12V穩壓IBC

圖8:穩壓中間匯流排轉換器可擴展架構,輸出功率高達3.2kW,TDP為800W。
(圖片來源:ST)

這個轉換器架構輸入為36V至60V,輸出為12V,可通過PMBus進行調節(我喜歡數位電源控制!)。外形尺寸是1/8磚,可擴展至4個單元。

從效率曲線可以看到,最高效率為98.4%,此時輸出為150W(圖9)。

圖9:STC的效率曲線。
(圖片來源:ST)

48V至POL直接轉換

這個設計的輸入範圍是40V至60V,針對Intel VR13HC處理器提供1.8VTyp的VOUT,完全符合Intel的測試計畫。此外,它還能以1.2VTyp對DDR供電。

圖10:48V至POL直接轉換,可支援隔離型或非隔離型。
(圖片來源:ST)

其TDP為205W,最大值為413W。在開關頻率為570KHz時,其IOUT最大值是228A。功率密度是100W/in2、佔板面積為1.6×2.6"。如果要評分的話,從設計人員提供出色的資料中心電源可選方案來看,可以評定為A。

Vicor

Vicor產品行銷兼技術資源副總裁Robert Gendron與我們分享關於該公司的資料中心市場策略。我首先問到在該公司架構中所採用的GaN元件,Vicor同時評估了這項技術與其他FET技術。

NBM及DCM

Vicor的非隔離匯流排模組(NBM)是一種雙向固定架構,從48V轉換到12V的峰值效率為97.9%。很快地,Vicor還將推出下一代版本,計劃將效率提升到98.5%。鑒於NBM具有高功率密度(在22.8×17.3×7.4mm的封裝中可提供800W的連續輸出功率),他們還有多項設計是在主機板上把NBM放在12V多相穩壓器的前面。

圖11:Vicor的穩壓器可放在處理器附近。
(圖片來源:Vicor)

其DC/DC轉換器模組(DCM)是一種48V至12V的非隔離轉換器,可以在採用傳統12V配電的資料中心內支援48V高性能GPU。

Vicor還提供一系列完整元件,可支援380V、AC和傳統的12V負載連接到48V中心。這個「中心」(hub)可在機架內實現48V或安全特低電壓(SELV)配電,從而使得損耗最小化。由於他們提供分解式電源解決方案,包括橫向及縱向供電方案,因而可實現從48V一直到為CPU供電。其NBM和DCM產品可實現48V到12V轉換,因此也支援傳統的12V多相穩壓器。

圖12:更多的Vicor解決方案。
(圖片來源:Vicor)

雖然這些12V主機板本來是設計給高性能運算(HPC)使用,但設計人員只需稍對它們進行修改,就可以給48V機架使用。

縱向供電

由於GPU需要消耗500A電流,未來還將提高到1,000A電流,再加上資料中心開始採用AI和深度學習進行處理,因而需要提供創新的設計架構,以便適時支援這些應用。

如今,為了在5G、智慧家庭和智慧工廠等應用中降低延遲,處理器設計人員正在其架構中加進越來越多的核心。現在已經有500W的處理器了。其目標是把所有的東西都放進相同的晶片中,從而降低延遲,而也因為這個原因,他們希望把光耦合器就放在處理器旁邉。

Vicor瞭解電路板功耗影響重大。他們認為,這比為電源解決方案提高1%的效率更加重要。他們研究了400μΩ走線的功耗,發現在200A電流時,電路板自身功耗就佔到10%。就算有99%的效率,在200A電流時,電路板走線的I2R功耗也會很高。

對於為資料中心處理器設計電源架構方案的設計人員來說,Vicor的電流倍增器解決方案是另一項優質的選擇。

封裝內電源(power-on-package)技術可以讓電流倍增,從而實現更高的效率、功率密度以及頻寬。在封裝中倍增電流,可以減少高達90%的互連功耗,同時讓處理器封裝接腳(通常為大電流供電才會需要)轉而用於擴展I/O功能。

由於雜訊會影響處理器精度而引起誤差,因此在處理器附近設有「禁區」(off limits)。縱向電源模組(VPM)具有超低雜訊拓撲。Intel在三年前進行了一項研究,在紅外線影像上用顏色代表雜訊,該研究顯示,處理器附近的雜訊級還可以接受。

Vicor表示多相設計中存在的一個問題是,電感器/磁性元件的雜訊很高。Vicor並未在其輸出級中採用電感,因此雜訊不高,而使得轉換器可以放置在很接近處理器和I/O線路的位置。他們表示從未在這些架構或測試中遇過雜訊問題。

另一個問題是,大多數的AI處理器和其他超高速GPU處理器都需要連接至處理器晶片的四周。資料中心以及其他電子架構常常希望幾乎看不到電源。因此,在這些架構中,這些限制為電源設計人員帶來了挑戰。

嚙合式(geared)電流倍增器架構

圖13:Vicor的嚙合式電流倍增器(GCM)架構。
(圖片來源:Vicor)

Vicor致力於發展縱向供電(VPD)。他們根據客戶對於CPU、GPU及ASIC峰值供電的要求製成了圖表。從圖14中可以看到,大約從2010年開始,峰值電流大幅增加。這是因為AI處理能力增加,以及處理器製程節點越來越先進——從14nm、12nm、10nm發展到現在的7nm。

圖14:峰值電流隨時間不斷增加。
(圖片來源:Vicor)

電路板所需的功率增加,意味著更需要關注轉換器的效率,以及供電與配電的功耗。問題之一在於:隨著功率增加,轉換器的尺寸通常隨之增加,這表示它們就不能放到處理器附近。這個佈局問題又會使電路板產生更多功耗。

採用Vicor分解式電源解決方案的AI處理器——Nvidia SXM3f,就是一個很好的例子。這種解決方案可以提供超過1,000A的峰值電流。相較於傳統的穩壓器,這些元件由於具有小型化和纖薄的優勢,更有利於放在接近處理器的位置。

圖15:縮短穩壓器與處理器的距離,可以降低I2R損耗。
(圖片來源:Vicor)

這些I2R損耗導致效率降低而且還會發熱。Vicor繪製了400μΩ電路板的損耗(圖15)。從圖中可以看到,在200A時,電路板會損失10%的效率。

當將其分解式電源解決方案用於與Nvidia解決方案中所用的類似橫向配置時,這些元件通常可將電路板的損耗降低90%。然而,隨著電流繼續增加,除了要縮小穩壓器的尺寸外,還必須降低供電損耗。隨著處理器的消耗更多電流,運算能力提高,I/O的數量和速度都必須增加,穩壓器的尺寸就成為非常重要的考慮因素。將穩壓器(任何公司的穩壓器)橫向放置在處理器旁邊,可能會擋住往返處理器的重要通道。

這正是Vicor採用縱向供電(VPD)的原因。它幾乎完全消除了供電損耗,並實現了無障礙連接處理器的四周。他們可以將用了10年的相同分解式電源架構導入VPD穩壓器中。其電流倍增器已經從VTM發展到模組化電流倍增器(MCM),再到目前的嚙合式電流倍增器(GCM),其正好是放在處理器的底部。這不僅僅可以實現供電,該GCM元件還包含正好位於處理器下方的關鍵旁路電容。

Vicor最近宣佈了與京瓷(Kyocera)公司合作,突顯其如何提供穩壓器解決方案,以及Kyocera為客戶提供的處理器基底(或封裝)設計。這項合作使得設計人員可以迅速利用其VPD穩壓器解決方案。

英飛凌科技

轉用48V拓撲架構是因為機架需要增加功率。當Nvidia去年推出DGX-2平台時,完全導入了48V。之所以採用48V解決方案,是因為截止功率是在10到20kW之間——在這種使用高電流的GPU架構中若超過這個範圍,就必須盡可能把損耗降低。英飛凌科技(Infineon Technologies)提供多種解決方案,包括使用GaN功率元件的設計,例如,直接從交流電(AC)轉到48V的電源轉換方案就採用了GaN元件。對於每個CPU/GPU來說,這一功率水準大約是每處理器約500W,而每個處理器的電路佔板面積通常為10cm×10cm。

在板卡方面,Infineon提供基於GaN的半橋以及傳統的矽基解決方案,具體取決於客戶所需的折衷和考慮因素。Infineon也提供另一種好的解決方案給客戶參考:氮化鎵電晶體。

圖16:伺服器供電包括帶兩個交錯式高頻橋臂的圖騰柱AC-DC整流器,以及帶中心抽頭變壓器的LLC DC/DC轉換器。
(圖片來源:Infineon)

圖16所示,採用這種拓撲的48V系統,可以採用全橋整流實現。隨著運算架構逐漸轉用GPU來進行平行處理,每機架功耗將增加3倍到20kW或者更高。對於這一用例,採用12V電源的配電損耗過大。通常採用GPU、高階FPGA和ASIC的加速卡以進行客製化AI工作。因此,在機架上提供48V電源越來越受歡迎,主要是著眼於其效率優勢。

在DC/DC級的原邊半橋採用35mΩ GaN元件,可實現進一步改善。利用Qoss電荷低得多的優勢,以及諧振頻率及磁化電感的相關調整,系統效率大約可以提升0.3%。把變壓器設置改為矩陣架構,加上串聯初級線圈和並聯次級線圈,可以再提升0.3%效率。

在PFC和LLC級取得改善後,在功率密度為30至35W/in3時,峰值效率可增加到98.5%。Infineon也正與所有模組化電源製造商合作,為它們提供解決方案授權。該公司仍然認為,12V伺服器還將長時間繼續主導伺服器市場。

展望未來,Infineon認為中間12V匯流排將會下降到7V、6V或5V。在這些情況下,隨著頻率提高,解決方案的尺寸將會縮小,從而使電源可以更靠近處理器。在相同的功率封包下,Infineon目前典型的功率級封裝面積為5×6mm和3×5mm。

亞德諾半導體(ADI)

亞德諾半導體(ADI)採用雙級的資料中心電源管理解決方案架構,即透過LTC7821實現48V-12V轉換,然後再用LTM4700微型模組實現12V-0.xV轉換,此時電流為100A以上(多相)。

第一步是採用LTC7821實現48V到12V轉換——其輸入電壓範圍是40V至60V。由於開關頻率高達400kHz,而在開關節點處,電感所見電壓只有輸入電壓的一半,因此可以使用小型(0.75×0.73in)2μH電感,例如SER2011-202ML。

圖17:LTC7821將48V轉到12V/25A,其開關頻率為400kHz。在功率密度為640W/in3的情況下,其佔板面積是1.45×0.77英吋。
(圖片來源:Infineon)

佈局

圖18是該匯流排轉換器的一種可能的佈局,它使用了PCB的上下兩側,佔板面積為2.7cm2。當電流約為15A時,其效率接近98%。

圖18:圖17中LTC7821的電路佈局。
(圖片來源:Infineon)

12V轉處理器電壓

下一步是從12V轉到處理器所需的電壓。這一步採用了LTM4700 µModule。轉換器模組可提供0.9V輸出,其開關頻率在325kHz到425kHz之間。增大電流可通過並聯多個模組實現,例如採用4個LTM4700模組,可實現8相操作,提供400A輸出。

在12V輸入、1V/100A輸出、200LFM氣流時,該元件可不需要加散熱器,在大約73.4℃溫度下工作。同時,它提供了I2C、SMBus或PMBus介面。

針對蓬勃發展的資料中心領域,設計人員可以從廣泛的電源管理解決方案中進行挑選。設計人員需要與客戶協同合作,針對他們的特定要求,設計出最好的解決方案。雖然設計當中會有折衷妥協,但是,設計人員如果能有效結合自己的設計專長,以及電源IC公司廣泛且富有創造力的解決方案及其專家經驗,則必定可為客戶設計符合需求的節能省電解決方案。

(參考原文:Data center power in 2019,by Steve Taranovich)

本文同步刊登於電子技術設計雜誌2019年8月號

活動簡介

人工智慧(AI)無所不在。這一波AI浪潮正重塑並徹底改變科技產業甚至整個世界的未來。如何有效利用AI協助設計與開發?如何透過AI從設計、製造到生產創造增強的體驗?如何以AI作為轉型與變革的力量?打造綠色永續未來?AI面對的風險和影響又是什麼?

AI⁺ 技術論壇聚焦人工智慧/機器學習(AI/ML)技術,涵蓋從雲端到邊緣、從硬體到軟體、從演算法到架構的AI/ML技術相關基礎設施之設計、應用與部署,協助您全面掌握AI最新技術趨勢與創新,接軌AI生態系佈局,讓機器學習更快速、更經濟、更聰明也更有效率。

贊助廠商

加入LINE@,最新消息一手掌握!

發表評論