幾十年來,鍵盤和滑鼠一直是我們操控電腦的傳統工具。隨著智慧型手機、平板電腦等行動設備的誕生,人們需要借助新技術來與這類沒有配備鍵盤和滑鼠的微型電腦進行有效交流。因此,觸控螢幕成為一項關鍵技術,使得這些電子產品更加友善;而語音辨識技術的加入,則使其更為直覺。

先知先覺的設備

隨著物聯網(IoT)的普及,我們需要互動的電子設備數量也將與日俱增,智慧家居便是一個典型示例,聲控恆溫器已開始運用其中。未來,我們還可以直接與機器人進行互動,除互動式工業機器人之外,家庭助理機器人和醫療助理機器人也在研發當中。而今,設備可以透過觸控螢幕接收指令,也可以利用內建式耳機收聽指令,借助眼動追蹤系統,它們還能檢測到使用者正在注視的物件,從而預測使用者的下一步意圖。這將為直覺的人機互動開啟無限可能。

在很多領域,眼動追蹤的硬體條件已然具備

眼動追蹤系統可以檢測人的眼球運動及注視方向。起初,人們開發眼動追蹤系統是出於市場研究調查、行為分析和可用性研究的目的,此外,在幫助那些雙手無法操作電腦的用戶方面,它們的應用已有一段時間。其中,許多系統使用紅外線照射用戶眼睛,並透過攝影機獲取影像,然後根據影像資料計算眼球運動,因此,這些系統需要特製的高品質攝影機、光源和軟體,有時還需要加裝硬體加速器來處理海量的影像資料。

而今天,借助極其強大的晶片、緊湊型攝影機的感測器和新型的大功率LED,可以將眼動追蹤功能整合到智慧型手機等電子設備上。其實,許多電子設備上都搭載了攝影機的感測器和紅外線光源,只不過它們是用來實現臉部辨識、虹膜辨識等其他功能,因此,接下來需要有的就是一款合適的軟體,將眼動追蹤作為一個附加功能加以整合。

發展現狀

目前,各個領域均在開發各種創新概念,意在促進眼動追蹤用作一種新型的人機介面。在具有眼動追蹤功能的智慧型手機和平板電腦的螢幕上,已經可以透過視線接觸啟動圖示或移動遊戲人物。具有眼動追蹤功能的遊戲電腦能使玩家在遊戲場景中更身臨其境,在一些系統中,玩家可以透過眼球動作控制遊戲人物的視角,而無需使用滑鼠或觸控板。眼動追蹤同樣也可以用於常規電腦,如利用眼球動作實現文檔滾動查看。

此外,在智慧家居產業,有多種方式可以透過眼動追蹤技術與各種設備進行互動,例如,具有眼動追蹤功能的智慧電視已經問世。汽車領域也已提出這些系統的潛在應用,其中的一個典型示例便是駕駛活動助理系統,它可以監測駕駛的眼球活動,從而及時檢測到疲勞駕駛的訊號。眼動追蹤功能也可以用於監測駕駛的注視方向,從而確定其正專注前方路況還是注意力分散。這類資訊將有助於避免道路上出現緊急情況。

20171107NT01P1 圖1 視線接觸啟動圖示。眼動追蹤結合現有的輸入功能,開啟了全新的電子設備操控方式。

消費類電子產業的眼動追蹤系統

上述應用中的新型眼動追蹤系統基於紅外線LED和高解析度攝影機的感測器而設計,它們分別用於照射人眼和記錄眼球反射的光線。然後,由影像處理演算法根據這些原始資料計算瞳孔(圖2)的位置,再由專用軟體利用螢幕等參照物的位置資訊確定使用者所注視的具體位置。不管眼睛是什麼顏色,尤其是在黑暗中或螢幕背光非常明亮時,紅外線照明均可以確保虹膜與瞳孔之間所需的對比度。

20171107NT01P2 圖2 眼動追蹤系統使用紅外線照射人眼,並利用攝影機的感測器捕捉影像。所捕捉的影像資料用於確定瞳孔的位置,計算用戶注視的方向。

這些系統目前的最遠探測距離是1公尺。智慧型手機和平板電腦的工作距離通常在30cm左右,而桌上型電腦則通常在60cm左右,螢幕解析度與眼睛的光閘尺寸相對應,平板電腦約為1cm,電腦則約為2cm。所用紅外線LED的數量及發射器和攝影鏡頭的具體排列取決於應用的類型,即工作距離的長短和覆蓋面積的大小。此外,設置還會因所採用的眼動追蹤軟體而有所不同,這是因為幾何設計也要看各種演算法能否可靠地檢測瞳孔的轉向。一般而言,發射器和攝影機的感測器需要按特定角度進行佈局,彼此之間需保持一定距離,以避免收到眼鏡的眩光或者光線從眼球到感測器的直接反射。距離越大,訊號品質越好,使用者與設備間最佳距離的選擇空間就越靈活。

用於眼動追蹤系統的紅外線LED

不同於大多數需要使用特定波長的虹膜掃描器,眼動追蹤系統可以在較寬的光譜範圍內運行。通常,這些系統需要借助現有的虹膜掃描或臉部辨識系統,並搭配波長為850奈米(nm)或810nm的紅外線LED。人眼可感知到波長為850nm的紅外線LED所發出的微弱紅外線光,許多眼動追蹤解決方案製造商更傾向於採用940nm的紅外線LED,因為裸眼看不到這種光。然而,940nm設計現在還存在弊端:目前通用攝影機的感測器針對可見光進行了最佳化,但在紅外線光譜範圍內靈敏度則較低。波長為940nm時,靈敏度降低十分明顯(圖3),因此需要增強紅外線照射,以達到與850nm光源一樣的訊號強度。鑒於紅外線照明的廣泛應用,攝影鏡頭製造商正在研發紅外線靈敏度高的新版本。

20171107NT01P3 圖3 在850nm和940nm之間時,針對可見光最佳化過的標準攝影機感測器靈敏度大幅度下降。配備940nm紅外線LED的眼動追蹤系統的優勢在於它幾乎不會被人眼所感知。大多數情況下,需要使用更高的工作電流來補償下降的訊號水準。

理想狀態下,雙眼應位於攝影機感測器的捕捉區域內,整個眼球需被均勻照射,這一點很重要。所需紅外線光照射強度取決於工作距離,即便對於行動設備,也可能需要數瓦的功率,而為儘量減少大工作電流下的熱輸出,發射器是在脈衝模式下工作。儘管如此,熱管理仍是設計重點之一,在更輕薄的智慧型手機和平板電腦中尤為如此,因此,紅外線LED效率是除了光輸出外的另一個重要因素,效率越高,產生的熱就越少。

針對這類應用,歐司朗開發了Oslon Black系列產品,其中,SFH 4715A的光電效率達到創紀錄的48%。這款850nm發射器在1A工作電流下的典型光輸出為770mW,是目前此工作電流下效率最高的紅外線LED。如果需要,還可以採用奈米堆疊技術,在一顆晶片上提供兩個發射中心,堆疊佈置,從而獲得更高的輸出。工作電流為1A時,SFH 4715AS的典型光輸出為1340mW,它並提供90度和150度發射角兩種版本,涵蓋許多不同的設計。Oslon Black版本在1A工作電流下光輸出為990mW,是理想的940nm光源。

Oslon Black的一個特性是其元件高度僅2.3mm,因此它不僅適用於今天的智慧型手機,也適用於下一代更為纖薄的電子設備。

像其他紅外線光源應用一樣,眼動追蹤系統必須符合人眼安全標準。普通用戶接觸的紅外線輻射量相對較低,然而,技術人員近距離觀看紅外線光源時需留意風險。眼動追蹤系統上有一個接近感測器,可確保在這種情況下紅外線LED能自動關閉。有關光學系統安全設計的詳細資訊,可參閱《歐司朗人眼安全應用注釋》等文獻。

我們周圍有太多複雜的電子設備,需要有新的技術來實現直覺的人機互動。紅外線照明和攝影機的感測器為互動技術奠定了良好的基礎,使設備能「看到」使用者並理解他們的意圖。眼動追蹤示例展示了如何在硬體基礎上透過軟體方案實現新的互動類型,硬體元件的創新也正驅動著這一發展,例如,採用波長為940nm的光源便是其中一種發展趨勢,因此,歐司朗也在不斷擴展在人臉辨識、眼動追蹤等應用方面的產品組合。

20171107NT01P4 圖4 Oslon Black SFH 4715AS的波長為850nm,是迄今為止功率最大的紅外線LED。工作電流為1A時,其發光功率為1340mW。得益於纖薄的外形,其不僅能安裝在最新的智慧型手機中,還可以用於下一代設備。