運算型儲存:提升效能的新方法

作者 : Jason Molgaard,Arm資深首席儲存裝置架構師

運算型儲存,又被稱為原位(in-situ)處理或儲存裝置內運算,為傳統的儲存裝置帶來高效能的運算力。

「運算型儲存」(computational storage)是在儲存裝置內或該裝置附近,執行特定運算任務的能力,而非靠伺服器或電腦的中央處理器(CPU)來處理;未來幾年內它將逐漸地被主流市場接受。

什麼是運算型儲存?

運算型儲存,又被稱為原位(in-situ)處理或儲存裝置內(in-storage)運算,為傳統的儲存裝置帶來高效能的運算力。數據可在其產生與儲存的位置直接進行處理與分析,讓用戶與企業組織在儲存裝置層級就能擷取有價值且可執行的洞察力。

從較高層級來看,運算型儲存是將配備完整的運算系統——包含CPU、DRAM記憶體與I/O置入固態硬碟(SSD)或擺在SSD旁,以替代系統的主處理器執行各項工作任務。

運算型儲存任務通常包含加密與影像編碼等高度平行的作業功能。此外,某些解決方案可以在裝置內部運行完整的作業系統(OS)實例,讓更多種類的應用與任務毋需主機介入即可運作。

與一般的卸載引擎相比,運算型儲存處理器(CSP)在功能上,更像是接收來CPU定義特定任務的協同處理器。

另外也可考慮為人工智慧/機器學習(AI/ML)的人臉辨識,部署運算型驅動器。運算型儲存裝置(CSD)將比較載入磁碟機的資料庫與來自即時影像串流的影像,試圖找出近似的配對。然後,來自運算系統的近似配對會被傳送到功能更強大的中央CPU,進行最後確認。請觀賞以下Greenplum資料庫載入運算型驅動器展示:

為何要採用運算型儲存?

在運算過程中,多數的能源都用在哪裡?用在運算處理數據嗎?根據一些估算統計,運算過程中,62%的能源消耗在數據的移動(也就是從儲存裝置移到DRAM、從DRAM移到CPU,或從CPU移到I/O裝置),這個數字應該讓人相當驚訝。藉由運算型儲存,將許多作業匡列在驅動器內進行,就可因此減少傳輸相關的能耗及數據流量。

運算型儲存也可以提升效能、降低延遲,並減少裝置的佔地面積。試想一座搭載16個驅動器的雙插槽伺服器。一般的伺服器也許可以存取64個運算核心(插滿32核心處理器的兩個插槽)。

有了運算型儲存,伺服器就能存取CSD內平行運行的72個、甚至更多的核心(假設每個驅動器擁有4個或更多的核心);如此主要CPU的原有負載得以由CSD核心算力136核心取代並且處理,因此將更有餘裕來處理更多來自其他應用的工作負載。

同樣的,物聯網(IoT)裝置的體積也變得更小、更具智慧也更加節能;而且,驅動器也能在受到局限的封裝內結合記憶體、儲存裝置與運算能力。

底層的架構為何?

NGD Systems公司推出的Newport處理器,將運算功能轉移到儲存裝置,可藉由降低數據的傳送達到用電量的減省。

第一代的運算型儲存裝置,是以現場可編輯邏輯閘列陣(FPGA)為基礎架構。FPGA的表現不錯,但與CPU相比,通常價格較為昂貴、且更耗電。FPGA也必須經過程式化才能運行特定的應用。

利用通用型CPU打造的系統單晶片(SoC)可以執行標準的、既有的應用程式,並降低採用的門檻。例如,NGD Systems的Newport運算型儲存系統採用四核心的Arm Cortex-A53處理器,且計劃在其未來的系統中使用效能更高的Cortex-A處理器。另一方面,ScaleFlux也宣佈其下世代產品將採用兩個四核心的Arm Cortex-A53處理器。

而類神經網路處理器(NPU)等用來處理AI任務的專用處理器核心,或是繪圖處理器(GPU),之後也將加入在運算型儲存驅動器。如同我們在智慧型手機與伺服器上看到的,專用處理器將可提供更高的效能與能源效率。

NPU與資料處理器(DPU)有何不同?

資料處理器(DPU)在資料中心內部執行網路、儲存與安全功能,因此會與NPU產生一些重疊。NGD公司行銷副總裁Scott Shadley解釋,兩者的差別在於速度、效能與應用。DPU可能被部署用於即時處理一系列套雲端伺服器的所有網路協定。單單一顆DPU可能包含數個Arm Neoverse處理器,以及伺服器級的GPU與其它裝置。

相形之下,CSD更強調效率,因為它不能超過伺服器分配給儲存裝置插槽的功耗與容積上限。在例如M.2等型態的8W上限內運作,意味著運算型儲存裝置依設計不同,主控制器最高功耗不得超過2W。

運算型儲存會在哪裡使用?

資料中心將是運算型儲存裝置第一個應用的市場,它可執行壓縮、刪除重複部份、進行編碼與其它任務。

在嚴格控制功耗、佔用面積與硬體成本的邊緣裝置方面,預計也將被大量採用。試想在一個處理內容服務的邊緣伺服器中,通常會包含數個SSD以儲存一般觀眾最常收看或即將推播受到高度矚目的新節目。有了運算型儲存,可由來自於CSD堆疊出來的運算力,取代並移除大多數的離散伺服器,這種改變可以降低資本支出、營運費用、電力消耗與佔用空間,而不影響效能表現。

智慧監控攝影機則是另一個具有爆炸性成長潛力的市場。據估計,目前全球已經部署10億架公共安全/監控攝影機,預計該市場每年將成長18%。若是一台解析度1080p的攝影機每秒拍攝30格(fps)影像,每小時與每年分別會產出2GB與17.5TB的資料量。超過10億台攝影機,相當於每年產出超過13ZB (皆位元組)的資料量,這比每年臉書(Facebook)貼文的總資料量大約多出8,000倍。藉由佈署具有機器學習能力的運算型儲存,將可大幅減少網路流量。

此外,例如飛機或地底挖礦車等頻寬受限的裝置,也是主要的目標市場。不論任何時間,全球約有超過8,000架飛機在空中搭載超過120萬名乘客。在飛行途中,可以用運算型儲存高效率地執行預測性維護或飛機整體狀態的機器學習應用,以提升飛航安全、減少周轉時間,降低代價高昂且惱人的誤點次數。

面對哪些挑戰?

目前,挑戰大多來自於確定相容性與擴充性的標準。儲存網路產業協會(Storage Networking Industry Association;SNIA)最近發表了0.8版本草案,並預計在2022年推出完整的規格。包括雲端服務供應商等其它組織,則持續針對運算型驅動器進行試驗,並將開始進行商業部署。

若以過去的經驗來看,雲端服務供應商將推出以運算型儲存做為特定服務或應用實例選項,經過一段時間後,市場將會逐步採用。

未來將在實體硬碟內看到運算型儲存嗎?

運算型儲存目前主要應用於SSD。但因為它具有較低延遲與較少能源消耗等效益,也可應用在硬碟(HDD)架構的系統上,其優勢將可更完整的展現。結合HDD與SSD技術的混合式驅動器,也可望因此受益。

加入LINE@,最新消息一手掌握!

發表評論