今年夏天,全球晶片領域的年度大事——Hot Chips大會,一共舉辦了25場會議,其中有16場或多或少都聚焦於處理人工智慧(AI)任務的晶片上。這些晶片應用涉及範圍廣泛,從瞄準物聯網(IoT)和智慧型手機的超低功耗元件,到資料中心所需的高耗電晶片等。

曾經圍繞著x86架構的產業整併,使得這一微處理器年度盛事有好幾年變得不那麼有趣。而今,隨著機器學習的崛起,Hot Chips再度成為專注於晶片架構的工程師熱烈參與的年度盛會。

不管你相不相信,晶片業近來關注的重點並不只是深度學習。例如,大會中的一位發言人還介紹了可能取代DRAM的競爭方案,並呼籲探討更多關於記憶體技術的話題。

賽靈思(Xilinx)展示了一款針對AI打造的全新FPGA變化版本,並邀請與會者針對基於安全的全新運算架構展開設計行動。

Alphabet董事長John Hennessey在發表專題演講時指出,在Google電腦架構師發現安全漏洞之前,業界廣泛使用的推測執行(speculative execution)技術易於遭受旁路攻擊(side-channel attack)的情況已經存在長達20年了。

Insight64分析師Nathan Brookwood說:「這不禁令人懷疑還有什麼是我們以往沒有注意到的......鑑於這些產品如此複雜卻仍能有效作業,這一點真的令人驚訝。」。

接下來,我們將重點介紹在今年Hot Chips大會上的一些有趣的討論。我們將從其中一些令人印象深刻的創新想法和目標設計開始談起。

新創公司Tachyum挑戰Xeon

新創公司Tachyum無疑是其中最具有膽識的,但卻並不被看好。該公司的目標在於透過其Prodigy晶片,從而在主流伺服器(server)用處理器和AI加速器市場分一杯羹。Tachyum宣稱其Prodigy晶片的核心「比英特爾(Intel)的Xeon更快,也比Arm核心更小」。

該公司表示,這款7奈米(nm) 290 mm2晶片支援多達64個核心,可在4GHz執行頻率下提供高達2TFlops的運算效能,預計明年出樣。

事實上,如果沒有重大的性能升級以及經過多方測試,資料中心營運商不太可能在其x86架構中採用新創公司的晶片和軟體。因此,分析師Brookwood對於Tachyum採用超長指令字(VLIW)架構抱持懷疑態度,畢竟這是英特爾在其Itanium中未能完美掌握的技術。他補充說,如果該晶片能取得任何市場吸引力,Tachyum很可能面臨來自英特爾等巨擘的專利訴訟。

1Tachyumcore Tachyum的Prodigy晶片支援九階整數和14階浮點運算管線架構(本文圖片來源:Hot Chips)

Optane引發法規爭議?

英特爾描述其最新的14nm Xeon伺服器處理器Cascade Lake。該公司在不久前的一場活動中才發佈這款晶片,但在Hot Chips大會上提供了更多細節,但也引發一些爭議。

Cascade Lake採用與英特爾現有14nm Xeon相同的機制、散熱和插槽介面,也支援相同的核心數、快取結構以及I/O速度。新增部份包括微調14nm製程,以提高一點性能和降低一些功耗。此外,該晶片還支援新的AI指令和硬體,以避免暴露於Meltdown/Spectre的旁路通道攻擊。

但其重點在於,Cascade Lakes是第一款帶有記憶體控制器的Xeon,可支援Intel Optane (即3D XPoint記憶體),可為每插槽提供高達3TB主記憶體以及帶來超越DRAM的讀/寫速度。

介紹該新產品的英特爾工程師並未評論Optane的耐用性。然而,他表示,這些主板使用的Jedec DDR4電氣匯流排採用英特爾的專有協議,這已能讓競爭對手近期內都望塵莫及。

Brookwood說:「我認為這並不至於構成法律挑戰。」

「如果我是IBM或AMD,當Optane DIMM普及於資料中心而我卻無法取得時,那麼我可能會要大發牢騷了!英特爾佔據了98%的伺服器市場,在我看來,這就是一種壟斷。」

2Optanex800 英特爾目前正主導儲存網路產業協會(SNIA),為Optane等替代主流記憶體打造軟體平台

NEC加速器低價挑戰Nvidia V100

NEC描述一款新的向量引擎,可搭載PCIe Gen 3板卡,而功耗還不到200W。該晶片專為搭配SX-Aurora超級電腦與Linux伺服器中的x86主機而設計,據稱其價格要比Nvidia V100更低得多。

NEC聲稱其向量晶片可提供高達307GFlops的雙精度性能。在大多數基準測試下,其性能可介於Xeon和V100二者之間。該公司還指出,NEC晶片的記憶體頻寬略高,而且在一些工作負載上的性能功耗比幾乎相當於Nvidia GPU。

相較於Nvidia V100晶片尺寸約840 mm2,NEC的1.6GHz、16nm向量晶片尺寸相對較小——480-mm2。此外,NEC的晶片支援多達6個Hi8或Hi4 HBM2記憶體堆疊,可提供高達48GB的總記憶體容量。

3NECvectorengine

為IoT打造超低功耗AI加速器

美國哈佛大學(Harvard University)和Arm的研究人員聯手發表一種用於物聯網中執行深度學習任務的超低功耗加速器。這款所謂的SMIV晶片採用台積電(TSMC) 16-nm FFC製程打造,晶片尺寸約為25 mm2。

SMIV可說是使用Arm Cortex-A核心的首款學術界開發晶片。它在always-on的加速器叢集中使用近閾值操作,並透過嵌入式FPGA模組提供大約80個硬體MAC和44Kbits RAM。

因此,該晶片能以低功率提供更高精確度。同時...

...繼續閱讀請連結EE Times Taiwan網站