自文明的曙光乍現以來,磁碟機和隨機存取記憶體(RAM)之間不堪的I/O關係一直是運算瓶頸;固態硬碟(SSD)的出現雖減緩卻沒有改變此景況。因而目前有三項進展正在密謀將這個瓶頸推向中央處理器(CPU)。

首先,近十年來,存取速率和連網速率分別登頂至25Gb/s和58Gb/s,且正在逼近100Gb/s逼近;電腦可以像存取自己的磁碟一樣快速地,將資料從遠端系統移動到自己的磁碟上。其次,磁片和RAM間的I/O屏障即將消失;在那之後,RAM和快取記憶體(cache)之間的障礙也將隨之土崩瓦解。

想像一下你把所有磁碟機中的內容都存在RAM;不僅是在RAM,而且是在L1快取。你可以用不到2,000美元的價格買到一台內建64GB RAM的上好電腦,但想像一下艾位元組(Exabyte,EB)等級的快取記憶體,這真的很大,只需要5EB就能裝下人類說過的所有話語。

來看看圖1中的表。左側是硬碟機(HDD)和固態硬碟等磁碟存取時間在左側,RAM和快取存取時間在右側。美光(Micron)的3D Xpoint非揮發性記憶體(NVM)技術凸顯了一個趨勢:新的資料儲存技術正朝向RAM存取時間發展。

20180803_Xpoint_NT31P1

圖1:硬碟、SSD、新型超高速記憶體、RoCE、L2快取和L1快取的存取時間
(來源:Infiniband產業協會)

圖中綠色的RoCE (發音為「Rocky」)是第二片拼圖──該技術將網路上許多NVM「磁碟」直接連結到RAM (筆者將「磁碟」加了引號,是因為固態硬碟已經不再像是旋轉式機械硬碟,差別就像是你手機上的數字按鍵與傳統電話機的「撥號盤」);可以肯定的是,RoCE並不是唯一能夠實現這種功能的技術,它只是我所知的其中之一。

(免責聲明:筆者曾為Infiniband產業協會撰寫過一篇關於RoCE的白皮書《RoCE Accelerates Data Center Performance, Cost Efficiency, and Scalability》;內容提到還有其他技術號稱可以達到相同的奇蹟,包括Infiniband本身和iWARP。)

RoCE是RDMA over converged Ethernet的複合縮寫,其中RDMA代表遠端直接記憶體存取(remote direct memory access)。直接記憶體存取(DMA)一直內建於個人電腦中,能讓內部週邊元件(磁碟機控制器、音效卡、圖形卡、網卡等)得以讀寫系統記憶體,不必麻煩到處理器。RDMA將DMA推廣到了網路介面卡,以便資料可以在不透過CPU或傳輸控制協定(TCP/IP)的主記憶體路徑的情況下,在不同伺服器上的應用之間傳輸。也就是說,RDMA使網路介面控制器(NIC)可以直接存取RAM,從而繞過作業系統並且完全沒有TCP/IP支出。

還有另一片關鍵的拼圖,是3D XPoint等新世代NVM技術;3D XPoint是英特爾(Intel)與美光合作開發、以相變化技術為基礎的固態NVM,速度會比快閃記憶體快1,000倍。其概念是以垂直導線連接亞微觀柱體(submicroscopic columns)的3D設計來打造隨機存取技術——這些柱體的密度要比傳統記憶體大10倍。

XPoint (交叉點-crosspoint)裸晶(如圖2)具有兩層和一個交叉開關矩陣(crossbar)設計,NAND資料以多個kB區塊(block)定址,而3D XPoint NVM可以逐位元組定址,延遲時間不超過7μs。由於XPoint晶片可以安裝於DIMM——就在記憶體匯流排上,因此可以消除「磁碟」與RAM之間的差異。

20180803_Xpoint_NT31P2

圖2:3D Xpoint設計使用堆疊裸片來增加密度
(來源:EDN)

當3D XPoint和其他新的永久記憶體技術(如3D Super-NOR)將RAM記憶體與我們所認為的磁碟儲存技術融合在一起時,一切都會改變。在3D XPoint等技術實現其承諾的同時,RoCE將在400Gb/s網路上運作,屆時磁碟和RAM之間的區別將不復存在,光速將會成為存取速度的評判標準,CPU本身反而將成為處理性能瓶頸,摩爾定律(Moore’s Law)也將繼續起支配作用。

(參考原文:The merger of networking, storage, RAM, and cache,by Ransom Stephens;本文作者為技術專家,也是科學寫作者、小說家)