新一代PC和資料中心處理器導入行動設計規則

作者 : Imagination Technologies

行動/手機市場之外的新趨勢正在改變處理器設計的遊戲規則,促使設計人員重新考慮其晶片架構,從而獲得最佳的每瓦性能...

多年來,行動(Mobile)處理器製造商致力於最佳化設計,以在有限的功耗預算、記憶體空間和頻寬範圍內獲得最佳性能。這些考量因素顯然在資料中心或個人電腦(PC)等市場並未獲得重視。如今,行動/手機市場之外的新趨勢正在改變處理器設計的遊戲規則,促使設計人員重新考慮其晶片架構,從而獲得最佳的每瓦性能。

行動處理器設計規則延伸至PC和資料中心

現今越來越多的雲端遊戲、資料探勘、人工智慧(AI)/數據分析和高性能運算均於雲端實現。雖然這些應用的要求各不相同,但在不斷提高運算量的要求方面如出一轍。 資料中心無法透過不斷擴大實體佔地面積來滿足這一個需求。為了將營運支出(OpEx)保持在可接受的範圍內並實現凈零碳排(Net Zero)的目標,企業必須充份發揮現有資料中心的性能,以在相同的空間內增加密度。繪圖處理器(GPU)、中央處理器(CPU)、AI加速器等處理元件必須在最小的功耗/散熱和面積預算內實現最高的性能。為此,遵循行動設計原則進行處理器的設計將是一個理想的起點。 分析PC市場的趨勢也可得出相似的結論。隨著大多數組織希望擴大混合辦公模式,人們逐漸以筆記型電腦取代桌上型電腦,將越來越多的功能(包括繪圖處理、神經網路加速、安全、I/O等)整合至具有統一記憶體架構的系統單晶片(SoC)中,如此既可提高性能,同時將功耗保持在最低水準。在傳統的PC模式下,大部份功能被各自整合為一個個的離散元件,因此,這一個想法引發了傳統PC模式的變革,下一代PC處理器看起來將越來越像智慧型手機處理器。

大型科技公司以客製化晶片設計實現差異化

隨著摩爾定律的終結,業界再也不可能每兩年出現一次性能提升。在此背景下,企業紛紛加入這場設計「競賽」,爭相以最佳的晶片打造最好的用戶體驗。 全球大型科技公司早已深諳此道且有備而來,各公司正著力自主設計客製化晶片,以用於消費性產品、PC或資料中心等。這些公司從現成可用的晶片轉向客製化晶片,寄望於更全面掌握設計,贏得優勢。因此,我們看到亞馬遜(Amazon)投資於Graviton CPU設計,Google推出了以TPU為中心的Tensor CPU。Apple的M1處理器將為Mac電腦提供藉助行動設計原規則而最佳化的晶片,提供更高的整合度和更出眾的每瓦性能。

OEM替代方案

對於沒有內部硬體和軟體設計團隊,以及尚未著手開發客製化晶片的OEM廠商而言,其所面臨的挑戰在於如何使自身的設計脫穎而出,以媲美高度最佳化的架構。這些OEM使用的晶片大部分是現成的,而這在當今市場處於劣勢,因為許多針對PC和資料中心而設計的晶片是「暴力」(brute force)解決方案,其雖可提供所需性能,但通常過於耗電且佔用記憶體/頻寬,因此缺乏競爭力。此外,這些晶片在可用的特定軟體和操作系統方面也存在限制。 部份基於行動設計規則的現成SoC已開始進入市場,但其數量少之又少,因而在為OEM實現差異化以推動創新,同時保持最低成本方面也受到限制。隨著業界目前正積極尋找替代方案,市場上湧現了一種極具競爭力、基於RISC-V指令集架構的CPU解決方案。

可擴展異質運算架構為其關鍵

創造高競爭力設計的關鍵不僅僅是CPU,其關鍵還在於能夠在彈性陣列中整合高效處理器,包括CPU、GPU和其他高性能運算元件,以滿足精準的功耗和效率要求。在需要彈性地加速日益多樣化的工作負載時,這種異質運算架構尤為重要。 沒有一家半導體公司願意花時間開發自己的處理元件,除非這是其打造差異化的關鍵所在。唯有從IP入手—這是利用成熟技術快速提升,同時保持最大彈性(包括IP定製)的唯一途徑。透過將處理器IP核心整合至針對特定應用而設計的獨特配置中,然後將自身的差異化技術整合至產品配置中,公司便可創建具有極高競爭力的解決方案,這反過來將有助於OEM的產品實現差異化。

行動GPU奠定基礎

行動GPU是打造高效異質運算設計的理想切入點,這比試圖將高階GPU強行納入行動功耗預算範圍,而向上擴展行動GPU更有意義。因為目前已經開發了特定的技術來最大程度發揮行動GPU的效率,例如分塊延遲渲染(TBDR)。TBDR將幾何數據分割成小區域(圖塊)並統一處理。由於每個圖塊都經過光閘化和單獨處理,渲染的尺寸非常小,因此可以將所有數據保存在快速運行的單晶片記憶體中,這項技術為M1的繪圖處理奠定了基礎。 對於諸如行動式雲端遊戲等應用場景,在多個小型GPU上處理多個小型併發工作負載的方法,比使用傳統桌面GPU更高效。透過擴展分散式多核心行動GPU架構,使每個GPU既可支援更多使用者,並為雲端使用者提供更高的能效。 以芯動科技(Innosilicon)為例,該公司擴展行動GPU IP架構旨在打破桌上型電腦顯卡市場的現有格局。在這個長期由雙寡頭壟斷的高階市場中,沒有人預料到會出現新的競爭對手,但芯動科技正利用不斷變化的市場力量和高度可擴展的高效技術提供替代方案。 增加高效的晶片上AI處理(正如M1所示)是OEM的另一個機會。由於晶片上AI處理尚未成為PC的標準,OEM可以利用這項能力來支援超解析度降低雜訊、音訊命令、安全等新興應用。這種AI功能通常需要巨大的運算能力,但使用基於行動設計規則設計的神經網路加速器(NNA) IP便可在SoC上整合高效、高度可靠的AI推論功能。專用NNA硬體可提供這種功能,其效率可比其他處理元件高出數個量級。 最後,額外使用IP即可完成這種異質運算處理解決方案。尋找設計用於高度可擴展運算環境的高度可擴展RISC-V CPU,此外,乙太網路數據封包處理器(EPP) IP核心支援處理處理器和網路之間的數據串流也有助於避免CPU瓶頸。

設計專用晶片——不僅服務於大型科技公司

SoC製造商需要基於行動設計規則設計的可擴展IP核心,以創造高能效、高頻寬和高性能的設計,藉助這種專為異質運算架構設計的處理器,他們可以創建專用、高效的新型解決方案,而這反之可協助OEM提供極具競爭力和差異化的產品,以掌握企業的未來發展方向。  

發表評論