輾壓對手?Apple處理器到底強在哪裡?

作者 : 黃燁鋒,EE Times China

本文將從M1晶片的角度談談Apple是如何在技術上達成對Intel、Qualcomm,以及其他競爭對手的威懾的;並嘗試探討Apple為什麼能做到這一點,其競爭對手又能否做到這一點?

Apple Mac系列PC開始換用自家晶片,對Intel而言無疑是個打擊。Apple在2020年的MacBook系列產品發佈會上提到自家M1晶片時不忘強調,相較前代MacBook產品,其CPU性能提升2.8倍、GPU性能提升5倍;這比較的就是Intel處理器了,而設備續航力還提升到了20小時。

這些數字就半導體產業摩爾定律停滯的現狀來看簡直不可思議。當然,其對比的內容與對象是值得商榷的,不過這樣的對比數字Apple並不是頭一回用──在Mac還採用PowerPC處理器的年代(1999年),Apple在宣傳中曾提過,PowerPC G3比當時的Intel奔騰(Pentium) II快2倍…如此似曾相識。

這個所謂「快2倍」的說法,大致可窺見Apple在處理器理念上的一脈相承;即便當時的Apple還沒有自己的晶片設計團隊。事實上,當時所謂的「快2倍」,是Apple在發佈會上對比Mac和Windows PC,分別採用PowerPC G3處理器和Intel Pentium II處理器,對比內容是雙方自動執行一組Photoshop任務。

所展示的Mac能夠用Windows PC一半的時間完成這些任務,其中的關鍵在於PowerPC G3多加了個AltiVec加速單元。這是個128bit向量處理單元,可單週期內執行4路單精確度浮點數學運算。Photoshop能夠充分利用這個單元,AltiVec效率比那時Intel的MMX擴展指令更高。

用簡單的話來說,就是依靠專用單元來實現性能和效率的碾壓。雖說PowerPC早就被x86打趴,但這個理念很大程度延續到了如今的Apple晶片(包括A系列和M系列SoC);以下將從技術詳述M1所體現的這一點。

事實上,M1晶片的出現不僅讓x86陣營感到「恐怖」,也對高通(Qualcomm)這樣的Arm陣營參與者構成了極大威脅。Qualcomm已經與微軟(Microsoft)合作過兩代晶片(SQ1與SQ2)產品,導入Surface Pro X (及其Windows 10 on Arm)兩年,卻在M1面前顯得不值一提。

碾壓Intel與Qualcomm

究竟Apple為什麼要給MacBook換用自家晶片?可能答案有很多,包括Apple生態的全面掌控,以及出於對成本預算進一步的控制等。如果僅從處理器本身的性能和效率來看,PC硬體網站《AnandTech》的一張圖片充分回答了這個問題:

這張圖對比的是Intel與Apple處理器從2013年以來的單執行緒性能變化趨勢(具體測試項為SPECint2006);在過去5年,Intel處理器產品的單執行緒性能提升了大約28%,而Apple CPU則實現了198%的性能提升,或者說A14處理器單執行緒性能是A9的將近3倍。

M1與A14晶片共用了Firestorm大核心,大致上可認為兩者有著接近的單執行緒性能(M1頻率高於A14,L2 cache也更大等)。2020年Apple晶片性能剛好形成了與相較Intel處理器的交叉趨勢;所以最新的MacBook開始採用自家晶片,就性能來看顯得順理成章。

事實上,Apple在A7晶片(iPhone 5s)時期就宣稱自家的Cyclone核心是「桌上型等級架構」,不過當時並沒有多少人在意。而且在M1出現之前,更多人還是堅定地認為,Arm處理器相較x86只能做低功耗,而無法實現如同x86那樣的高性能,Apple卻以實際行動證明了這個觀點的錯誤性。

不少對比測試提到,M1比Intel酷睿(Core) i9還彪悍,這話是否誇張了?我們來大致梳理一下,M1晶片相較x86和Arm針對PC的主流處理器,性能處在哪個水準上。

Apple官方並未公佈M1晶片的TDP (或大致功耗),《AnandTech》測試認為M1的CPU TDP在20-24W。《極客灣》(Geekerwan)的測試也基本印證了其CPU TDP在25W左右(峰值功耗24W,日常峰值功耗在15W左右)。這個值未必是準確的,包括其中可能包含DRAM功耗,不過也八九不離十。

《極客灣》資料,GPU部分全速運轉峰值功耗在10W左右;整個M1晶片可達成的峰值功耗大約為34W。《AnandTech》則在測試中提到,GFXBench Aztec High測試出現過17.3W的功耗,這個測試應該很難反映GPU單獨佔到了多少。整體上,這樣的功耗與TDP水準,大約與Intel、AMD的低壓處理器差不多。

《AnandTech》執行的測試項目比較多,這裡僅選取SPEC2006/SPEC2017來闡明其實際性能。其SPECint2006整數性能測試,Apple M1與AMD Zen 3接近;SPE CFP2006浮點性能測試,M1有顯著更大的優勢。綜合下來,其性能綜合表現如下:

(資料來源:AnandTech)

需要注意,這是單執行緒性能成績。M1的這個成績顯著強於Intel十一代Core (同等TDP水準的Corei7-1185G7),以及Core i9-10900K (十代Core,Comet Lake-S),甚至比AMD Zen 3 (Ryzen 9 5950X)還要強。

Apple所說相比前代MacBook幾倍幾倍的提升,似乎完全沒在吹牛。SPEC2017測試結果與SPEC2006也差不多,不過M1和AMD Zen 3 (Ryzen 9 5950X)互有勝負,M1整數性能整體不及Zen 3,浮點性能則反超。

這個對比還基於一個事實:M1大核的最高頻率僅為3.2GHz,而Intel十一代Core (i7-1185G7)的睿頻為4.8GHz,Corei9-10900K的睿頻(Turbo Boost)更是能夠達到5.3GHz;AMD Zen 3 (Ryzen 9 5950X)睿頻為4.9GHz。與M1相比,對比物件的功耗會明顯更高。

換句話說,Apple M1事實上成為了如今CPU的IPC之王。IPC也就是每週期指令執行能力,或者說每Hz能幹多少事。可見M1是能夠甩開目前最彪悍的x86處理器的。

(資料來源:AnandTech)

多核心性能測試方面,受限於M1本身僅有4個大核心與4個小核心,與堆了8核心、10核心還支援超執行緒的那群大傢伙自然無法相比。不過M1在性能方面仍然能夠碾壓Intel低壓版的十一代Core (i7-1185G7,4核心8執行緒,睿頻4.8GHz,TDP 28W)。M1如果擴大核心數量和處理器規模,則要實現多執行緒性能奪冠,應該也不是難事。

其他測試結果大致相似,包括Geekbench 5單執行緒測試,M1輕鬆奪冠,超越AMD Zen 3 (Ryzen 9 5950X)和Intel Corei9-10900K;CineBench R23單執行緒性能略弱於AMD Zen 3,多執行緒性能比AMD Ryzen 4800U (Zen 2,8核心16執行緒)弱大約15.6%,比Intel十一代Core (i7-1165G7,4核心8執行緒)強60%。

Apple為了實現M1晶片與x86軟體的相容性,做了Rosetta 2中間轉譯層。如此一來,以前的x86軟體不需要改動,也能跑在M1晶片上。這種方案會令程式執行效率變低。即便有Rosetta 2轉譯,M1晶片跑傳統x86程式,其性能也可達到Intel第八代Core的水準(對於AVX指令依賴較低的程式,M1+Rosetta 2性能與十代Core相似)。

因為篇幅關係,測試項細節無法展開分析。不過總結一句話就是:在同等核心規模的CPU中,Apple M1晶片在跑常規性能測試時,能夠以低很多的功耗達成相比x86處理器更強的性能。同等規模下,全面幹翻Intel完全不是問題,即便和AMD打得有來有回,也是AMD犧牲功耗換來的(在單核心性能測試中,AMD Zen 3能到49W功耗水準,而Apple M1為7~8W的整機功耗)。

前面這些都是與x86處理器相比,那麼和同為Arm陣營的對手相比呢?Microsoft在2019年發佈了Surface Pro X,這台設備搭載的是一枚叫做Microsoft SQ1的晶片,它實際上是Qualcomm Snapdragon 8cx的「馬甲」;2020年更新了Surface Pro X二代,Microsoft SQ2晶片,也就是二代Snapdragon 8cx。

Microsoft在Windows 10 on Arm的規劃上比Apple更早,Qualcomm Snapdragon 8cx也成為M1晶片在Arm陣營的絕佳對比對象。Linus Tech Tips對Snapdragon 8cx (二代)與M1晶片做了性能測試對比。

(資料來源:Linus Tech Tips;其中SQ2即為QualcommSnapdragon8cx二代)

從Geekbench 5和CineBench R23的測試結果就很容易發現,M1可將Snapdragon 8cx (Microsoft SQ2)按在地上摩擦。這兩者根本就不在一個性能水平線上,不過Snapdragon 8cx的功耗水準應該也更低(雖然好像Surface Pro X的續航也沒比M1版MacBook Air優秀)。

比較具有諷刺意義的是,Linus Tech Tips嘗試用一些虛擬機器的奇技淫巧,為M1版MacBook Air裝上了Windows 10 on Arm。然後用虛擬機器裡面的Windows來跑Geekbench 5,結果發現,其性能水準也遙遙領先於Surface Pro X,算是狠狠打了Qualcomm和Microsoft的耳光:

(資料來源:Linus Tech Tips)

這個測試也少了對於功耗的監測,不過它仍能說明M1晶片即便加個虛擬機器中間層,跑別家作業系統,效率打個折扣,依然遠遠強過Qualcomm如今針對低功耗PC所推的競爭產品。

除開性能,M1晶片的低功耗也已經有很多測試的先例了。在我上篇有關大小核心設計的文章中也談到了M1足以嚇掉x86處理器下巴的低功耗表現,幾乎所有日常使用場景,包括辦公、網頁瀏覽、閒置待機,功耗都比Intel和AMD同代競爭產品低了幾個數量級:M1晶片網頁流覽功耗僅相當於十一代Core的1/6,視訊串流播放功耗則僅有十一代Core的15%,Word辦公功耗則相當於十一代Core的20%~30%…

Apple究竟是如何做到拳打Intel/AMD,腳踢Qualcomm和Arm?

…繼續閱讀請連結EE Times Taiwan網站

 

 

 

 

 

 

加入LINE@,最新消息一手掌握!

發表評論