即時硬體級光線追蹤:行動裝置繪圖的變革時刻

作者 : Kristof Beets,Imagination Technologies技術前瞻副總裁

您最後一次在PC或遊戲機上玩電子遊戲是什麼時候?如果它是最受歡迎的遊戲之一,您可能已經注意到繪圖上已非常逼真了。 如今,在最尖端的PC和遊戲機上的遊戲中,繪圖形正在接近我們在電影中看到的真實感…

在即時運算產生的圖形中,若要實現真實感,其關鍵在於照明,光柵化(rasterization)為傳統渲染3D圖形的方式,並不是模擬真實光和陰影的最佳技術,它需要大量的運算資源和複雜的開發技術,但其結果仍不盡理想。

相反的,電影動畫師則是使用光線追蹤(ray tracing)技術來創造全域照明、陰影和反射等效果,光線追蹤可以精準且輕鬆地模擬光線的行為,從而產生一個更逼真的場景,同時所需的工作量更少。

為了在遊戲中獲得真正的沉浸式體驗,光線追蹤必須即時完成,而影像渲染只需要幾秒鐘,這使得它在處理運算和資源耗費方面成本昂貴,因此令人望而卻步,雖然現有硬體可以在PC和遊戲主機實現即時光線追蹤效果,但我們需要在性能、功耗和面積等各方面進行權衡,因此光線追蹤僅選擇性用於照亮場景中最重要的物件,在某些情況下,使用者可以決定是否使用以及如何使用光線追蹤。

這些權衡使得在電源受限的裝置中進行即時光線追蹤極具挑戰性,因此該技術尚未用於行動平台,不過根據相關數據顯示,手遊很快便將佔據全球遊戲市場的52% (NewZoo,2021年),其未來發展不容忽視。

行動裝置繪圖

儘管在尚未出現光線追蹤前,行動平台上的繪圖品質一直呈現穩定的提升,但使用傳統技術製作越來越逼真的影像變得愈加複雜,這正將性能、功耗和頻寬推向行動處理器的極限。

其中一個例子是陰影的產生,傳統上使用CSM (Cascaded Shadow Maps)完成,這個過程需要大量的幾何處理,分配大量的緩衝區,多個高解析度渲染目標的處理,以及昂貴的著色器操作,在經歷了所有過程、功耗和頻寬使用後,結果仍然不如使用光線追蹤如此真實。

在光線追蹤中不存在許多假圖、解析度問題,和其他與傳統光柵化有關的問題,透過光線追蹤,光線從單個像素出發到達光源,如果光線擊中某物,則該區域就處於陰影之中,每個畫素一條光線,這很直接,且成本較低,特別是對於高效實現的專用硬體。

現今,我們使用陰影貼圖等技術做近似處理代價較高,是以即時光線追蹤正成為一種更高效的選擇,而且我們不能再依賴每兩年呈指數級成長的程式化硬體,因此高效設計固定功能的硬體加速器來推進光線追蹤技術已成為必須,尤其是對於功耗受限的平台而言。

目前的光線追蹤硬體

光線追蹤能夠以不同的性能和效率水平進行分級,為了闡述此點,Imagination建立了光線追蹤等級系統(RTLS),將其分為從0級到5級的六個級別。

早期硬體加速光線追蹤的嘗試並不是最佳的,這些傳統解決方案我們稱之為RTLS級的「0級」並且功能有限,需要訂製應用程式介面(API)和硬體;市場發展到基於傳統GPU的「1級」軟體運算解決方案,這些解決方案更加靈活,但仍遠遠不夠理想。

時至今日,大多數光線追蹤解決方案(例如用於PC和遊戲主機)屬於「2級」RTLS解決方案,他們擁有專門的硬體,用於最基本的光線追蹤操作:針對三角形/盒的交集測試器,將此操作放在固定功能硬體中可實現更高的能效,但仍然會將多個級別的光線追蹤處理運行在GPU上的著色器,這些處理階段對GPU的平行執行引擎並不友好,並導致傳統繪圖性能和算術邏輯單元(ALU)管線效率降低,因此限制了總體輸送量。

「3級」RTLS解決方案在專用硬體中整合了更多的光線追蹤功能,包括透過遍歷光線追蹤的主要數據結構:BVH (Bounding Volume Hierarchy)進行完整的光線相交處理,這將提高更複雜場景的光線追蹤效率,達到更佳的轉移光線追蹤功能,並減少對傳統繪圖性能的影響。但3級解決方案缺乏一個基本元件:一致性排序,沒有這一點,GPU的許多平行優勢將會喪失。

當今最先進的PC和遊戲主機解決方案是RTLS級中的3級解決方案,雖然其聲稱每秒有高達千兆的光線數,但效率很低,與GPU處理資源利用率低或記憶體存取限制有關,這是由於光線在整個場景中散射造成非同相的記憶體存取模式所造成。

為了使光線追蹤在行動裝置中工作,必須利用GPU中固有的平行性,並開發最佳化硬體的智慧演算法。

用於光線追蹤的智慧硬體

在行動GPU方面,Imagination為超過100億裝置提供圖形,意味著可在高效硬體中提供令人驚歎的影像,其光線追蹤技術已可達到RTLS級別的4級。

在第4級,BVH光線遍曆是在使專用硬體中完成的(如第3級),但重要的是,光線同調性排序也是如此,它將沿同一方向移動的光線分組,以充分利用GPU的平行運算能力,與基於分塊的渲染類似,其透過空間局部性分塊排序提高效率,光線的同週調性排序提高了ALU的總體使用率,並顯著提高了測試效率。並且,由於幾乎將光線追蹤處理負載完全轉移到專用硬體中,因此對傳統繪圖形性能的影響最小。

4級的實現將很快透過Imagination的光線追蹤IP (IMG CXT)提供,使用CXT,用戶可構建高達9TFLOPS的FP32光照性能和超過7.2G光線/秒的光線追蹤性能,同時提供比2級和3級解決方案高達2.5倍的功耗效率。

當然,最高效的硬體依然對實現最佳的行動圖形品質具有極大助益。透過全新高效硬體,Imagination正為行動裝置實現即時光線追蹤,這是一個真正的遊戲規則改變者,將把世界上最龐大的遊戲玩家群體帶向開發者,為行動裝置製造商提供一種新的差異化方式,並實現全新的沉浸式行動使用者體驗。

加入LINE@,最新消息一手掌握!

發表評論