Alexa,你能守口如瓶嗎?

我們對家中Amazon Echo 這樣的智慧型音箱或手機上Siri這樣的語音助理所帶來的便利性已經習而不察,但我們是否想過因此而來的隱私威脅?把我們的對話或資料上傳給Amazon、Google或其他超大型企業的後果為何?

語音辨識蔚為主流

語音辨識早在1960年代即已初見端倪,但一直到1990年,在PC可以執行語音辨識後才開始普及,而真正的爆發則首見於2011年,蘋果(Apple)在iPhone 4S上推出Siri之後。

今天,Apple的Siri及Google的Assistant已在多種產品和裝置提供語音控制的「虛擬助理」。事實上,平均每6個美國人就擁有一組智慧音箱。亞馬遜(Amazon)雖然以Echo音箱上的Alexa在市場上獨領風騷,但Google、Apple及許多競爭業者急起直追。

採用語音介面的當然並不僅限於智慧音箱及行動裝置,Amazon的Echo Show等智慧顯示器和智慧音箱一樣配備相同的語音助理介面。語音控制也可見於智慧電視、車輛、家用恆溫器等居家常見裝置;微軟(Microsoft)並已經將Cortana列為Windows PC的標準配置。

語音辨識的大爆發有賴於需要高效能雲端伺服器的人工智慧(AI)及人工神經網路(ANN),以及本地裝置上的複雜訊號處理技術,後者之一是從背景雜訊截取語音的遠場音訊檢測。

隱私疑慮

技術能夠成事殆無疑義。但語音被裝置收音、處理、回應後的機制到底為何?Microsoft近期發表的一項調查顯示,41%的語音助手使用者對個人隱私有疑慮。

一般而言,大多數智慧型音箱會將問題或指令語音截取、上傳到自己的伺服器進行處理;亦即這些問題或指令會至少暫時性的,被提供服務的公司儲存於某處。

智慧型音箱會一直收音,但只會在接收到Alexa等「喚醒詞」後才會上傳音訊。但實務上,智慧型音箱有可能誤解您所說的不相干語詞為喚醒詞,並且開始收音、上傳您並不想要上傳的語音。

另一層疑慮是提供服務之企業的員工存取所錄語音及數據的程度。近期的新聞報導宣稱Amazon有內部小組,負責聆聽所錄的語音以改善品質,這雖然聽來合理但也極可能導致可能的風險。說起來,既然我們會擔心網路瀏覽紀錄及聊天訊息會被大公司儲存下來,擔心語音紀錄自屬順理成章之舉。

可以合理推論這些人員有可能回推語音數據到所在位置等其他資訊,後者有助於提供市內最佳餐館等本地化建議。這對隱私保護確實具有值得警告之處。

本地處理

針對隱私的解決之道是結合雲端處理及大量本地裝置處理於一,方法之一是採用足以了解指令並適當回應的特化處理器。

對控制智慧型家用裝置等互動操作,理論上無需雲端通訊即可完成互動操作,對必須交換資訊的操作——例如使用者提出問題或要求控制Spotify或網路廣播電台等APP¬¬——的情形,智慧型音箱應該可以只傳送meta資訊而非實際對話到雲端。

隨著越來越多的消費產品具有語音啟動及控制功能,嵌入式應用採用足以處理本地運算的高效率神經網路處理器,因此無需傳送數據到雲端時,人們對隱私的疑慮無疑可被大幅消解。

雖然雲端企業會希望留住原始對話資料於其資料庫中,個人使用者絕對偏向在家中的裝置成為一種安全閘道、限制共享於雲端本身之資訊的情形下,才會更信任語音服務。

重點是透明度:裝置必須明示哪些處理是在本地完成,而哪些資料會上傳到雲端。此一爭議當然有其正面效益:不難想見,裝置廠商可將本地處理作為差異化行銷的重點,說服消費者相信具有更多「僅限本地」處理的智慧型音箱更值得擁有。

OEM業者自處之道

另一提高大眾信賴度的方法是配置「內建隱私」的功能,以便使用者確認所用的這種設計就是要維持資訊的秘密性。例如:Amazon的Echo Show 5智慧型顯示器就配備遮蔽攝影機的實體光閘、智慧型音箱則配備停用麥克風的靜音按鈕。

不論硬體能力如何,軟體必須提供可讓不論技術能力及經驗高低的人們,信任其裝置的使用者體驗以及隨時隨地刪除全部語音紀錄的能力。

另一保障隱私的步驟是,盡力確保本地執行之「喚醒詞」檢測的準確度,以便消費者在有語音介面的場合能夠安心進行私密對話。語音控制裝置日益採用更強大的處理器及完善的演算法,確保智慧型音箱能夠切實僅在被需要時才提供協助。

結論

語音介面注定要日趨普及,產品及策略能夠確保隱私的廠商,其商機將不可限量。消費者亟需便利性,從其他技術性產品的經驗顯示,只要廠商確實證明已針對隱私有良好的對策,消費者絕對會像在智慧型手機上輸入任何資料一樣的,對語音控制裝置夸夸其談。

為證明所言不虛,我對執行Alexa的Echo音箱提了個問題:「你能守口如瓶嗎?」它回答我:「請只告訴我需要我知道的事情。」聽起來有點神秘兮兮,但不失為一個好的開始。

(參考原文:Privacy Issues with Voice Interfaces,by Youval Nachum)