從2020年眺望未來消費性電子產品趨勢

作者 : Brian Dipert,EDN專欄作者

深度學習將影響未來的許多應用,包括自動駕駛車、網路安全,甚至各國的選舉。

新的一年開始,正是對未來做些預測的時候。以下列出了筆者的一些想法,排序無先後。慢慢往下讀,就會大致瞭解技術的發展趨勢。深度學習(Deep Learning)將影響未來的許多應用,包括自動駕駛車、網路安全,甚至各國的選舉。

若讀者們對我以下的內容有任何想法,以及我可能忽略的任何事情,都可留下你的建議。

深度學習

深度學習用於影像處理

隨著技術的進步,目前已實現了從已辨識資料(「訓練」)到未辨識資料(「推理」)的模式匹配和推算,這改變了當今許多演算法的開發方式,影響了多種應用(「深度學習」一詞出現在上面列表的多個項目中就容易理解了!)。電腦視覺是首先積極採用深度學習的學科之一,理由很充分:傳統演算法的開發很無趣、應用範圍窄,而且無法精確處理「極端情況」,例如軸外物體視野、惡劣照明條件,以及大氣和其他失真、模糊情況。而且,為辨識某一類物體而開發的演算法,若是要用來辨識不同類別的物體,通常需要從頭開始編碼。

相反,採用深度學習,將夠大且具有可靠標記的數據資料集輸入到訓練程式中,得到的深度學習模型便能夠可靠地辨識同一類別中相似的物體。如果想擴大要辨識的物體集怎麼辦?只需使用更多資料來逐步訓練模型便可,即使為了提供更多的辨識類型而需要更換模型,其基礎架構也可以保持不變。目前令人信服的實施案例越來越多,被《時代》雜誌評為2019年最佳發明之一的OrCam MyEye 2就是其中之一(圖1):「這款人工智慧設備可裝在任何眼鏡架上,能夠辨識人臉和貨幣,或者從條碼中大聲讀出文本和資訊……OrCam MyEye 2對於有閱讀困難的人(如閱讀障礙症患者)也很有幫助。」

20200302NT31P1
圖1 可裝在眼鏡架上的人工智慧設備OrCam MyEye 2。

深度學習應於音訊處理

當然,影像畫素並不是深度學習唯一擅長的模式匹配對象。音素(phoneme)和其他聲音單元呢?例如,最新型號的Google Pixel智慧型手機提供了Live Caption(即時字幕)功能,可以將話語音訊和視訊音軌即時轉換為字幕,並立即顯示。同樣令人印象深刻的是,它利用深度學習模型完全在「邊緣」智慧型手機上運作,這意味著即使完全離線,它仍然可以工作。通常,深度學習模型需透過雲端定期更新,以提高準確性和語言種類。

深度學習用於通用資料

如果將思維擴展到多媒體資料以外,就會發現其他引人注目的深度學習應用。例如,筆者的侄子最近加入了Darktrace,該公司計畫利用人工智慧來辨識未經授權的網路入侵和網路病毒等。我雖然並不十分瞭解該公司的產品,但是很顯然,一旦安裝了該軟體,它就可以透過「學習」來瞭解正常的網路特性,當網路偏離正常時,軟體能夠及時發現並警告IT人員。

20200302NT31P2
圖2 Darktrace利用人工智慧辨識網路入侵和病毒。

前面提到了傳統電腦視覺演算法與基於深度學習的電腦視覺演算法的不同,以及它們處理「極端情況」和辨識新物體能力的不同。與過去可能用過的傳統病毒監測軟體相比,深度學習方法對網路監測的吸引力顯而易見。「硬編碼(hard-code)」病毒掃描方法不能應對新威脅,除非安裝新的資料補丁(然後只能追溯既往的問題),採用深度學習方法則可以即時回應相對均值的任何變化。我想在一定程度上這不可避免會出現「誤報」現象,至少最初是這樣,但強大的反覆運算訓練方案也會從錯誤中學習。

我最近在Slashdot上讀到一篇文章,其中介紹的演算法能夠辨識舊報紙上的訃聞,然後將姓名和其他關鍵資訊提取到資料庫中供人搜索,這對於開發家譜等很有用。但是,還是不要過份激動,建議仔細閱讀普林斯頓大學(Princeton University)電腦科學副教授Arvind Narayanan最近的一次演講稿「How to Recognize AI Snake Oil」。

自動駕駛車

儘管在前進的路上會遇到挫折,汽車領域的眾多知名企業和新創企業仍在積極部署自動化程度越來越高的車輛。例如,最近Waymo就宣佈在美國亞利桑那州(Arizona)鳳凰城(Phoenix)郊區錢德勒(Chandler)大幅擴展其完全無人駕駛車輛的試乘計畫。現在,透過Android或iOS應用程式可以召喚一輛Waymo One自動駕駛車。

20200302NT31P3
圖3 Waymo宣佈在美國亞利桑那州實施其完全無人駕駛車輛的試乘計畫。

儘管切實可用的全自動駕駛車仍然只是吸引所有人注意的「耀眼目標」,但近期這個概念在一定程度上的實施大部分可能獲得成功(即使不是全部)。例如,Waymo還與AutoNation合作,將零組件運送到附近的汽車修理廠,這是定點路線應用的一個例子。在已經成熟標繪的城市和其他類似區域,也較早使用了自動駕駛車。是的,Uber持續在自動駕駛計程車領域進行投資的根本目標就是消除人類駕駛員。在考慮使用這類服務的潛在客戶時,我不禁想到了我的父親,他15年前因肌萎縮性脊髓側索硬化症(ALS)去世。在漸漸失去對肢體的控制並最終喪失駕駛能力後,我相信父親當時應該會歡迎這種不依賴人類駕駛的自動車輛,還有盲人、老人、身心障礙者……潛在用戶數不勝數。

汽車之外的自主

如果將思維擴展到汽車領域之外,自主應用的潛力(以及近期實現)也會有所拓展。例如,2019年年中,UPS及其技術開發合作夥伴TuSimple已經在鳳凰城和圖森(Tucson)之間進行了為期數月的無人駕駛貨運卡車的測試,但貨運卡車仍然只是一種大型車輛。Garmin的自動著陸系統Autoland在飛行員失去駕駛能力時,可以讓一架小型飛機降落:這樣的系統對乘客的價值毋庸置疑!還有Starship的送貨機器人艦隊,我的侄女—筆者母校普渡大學(Purdue University)大二的學生提到,該艦隊在整個校園內的工作有聲有色。她最近又跟我說,據反映機器人有時會混亂,而且很顯然,食物在機器人運送的途中很容易被人搶走(申明一下,我侄女可不會做這種事),但是這顯然可以替代成本高昂卻可靠性不高的人工送貨服務。

5G裝置

第一批支援5G的智慧型手機於2019年春季在世界行動通訊大會(MWC)前後發佈。2020年肯定還會陸續推出更多、更先進的型號,其中可能包括蘋果(Apple)的首批5G手機,我同樣期待即將面世的其他5G設備。

20200302NT31P4
圖4 高通在年度Snapdragon技術峰會上發佈了下一代增強+VR晶片組XR2。

例如,高通(Qualcomm)在之前舉辦的年度Snapdragon技術峰會上,發佈了用於行動運算和通訊設備的Snapdragon 765和865(前者整合了5G基頻),以及其下一代擴增實境(AR)+虛擬實境(VR),高通技術術語稱為XR的晶片組XR2,它(如Snapdragon 865)可與獨立的X55 5G基頻配合使用,實現完全無束縛的AR+VR耳機應用。作為補充,我應該也提到,關於高通的主要競爭對手聯發科(MediaTek)最近也終於公佈了其首款5G晶片組(天璣1000)更完整的細節。

專用處理器

結果通常在預料之中,但實現給定功能的通用處理器(執行軟體或可程式設計硬體)與專用硬連線加速器之間的競爭卻總是那麼有趣。以MPEG系列視訊壓縮演算法為例,每一代解碼甚至運算密度更高的編碼演算法最初都是在CPU和/或可程式設計邏輯結構上執行。但是,一旦標準成熟,而且當市場規模大到有必要進行額外的開發投資時,就會出現專用硬體核心來減輕系統處理器的負擔。與此同時,除了FPGA前代產品,還會出現能更有效利用矽和功率的ASIC或標準單元方法。

20200302NT31P5
圖5 蘋果在發佈iPhone 11系列期間推出了A13 SoC。

例如,當一些深度學習框架開始變得流行並出現一組支援它們的功能時,深度學習處理也會出現類似的情況。更通俗地說,你能想像沒有繪圖處理器(GPU),而由CPU(與畫素顯示引擎結合使用)來處理相關的渲染功能嗎?相反,如今的通用運算繪圖處理器(GPGPU)就像其名稱中「通用」所意謂的,努力想將其用途擴展到圖形以外,並希望在此過程中避免使用專用的深度學習加速器。圖5所示為蘋果在發佈iPhone 11系列時對Apple A13 SoC進行說明,其中列出的許多功能基本上甚至完全在專用輔助處理器核心運作上,而不是僅在通用CPU核心集群的軟體上運作。

電池

儘管自主性和電動動力傳動並非總是同時出現,但可以肯定的是,未來越來越多的自主平台將由可充電電池供電。電池技術的開發和設計實施需要在許多看似矛盾的因素之間取得巧妙的平衡,如以下所列。

·成本:轉化為價格、客戶需求、產量等);

·重量:電池組及包含電池組的系統越重,電池組在兩次充電之間的工作時間和距離就越短);

·尺寸和外形:包含電池組的系統需要多大體積,如何才能輕鬆地將電池組塞入有限的系統空間?

·電荷密度:給定大小和重量的電池中可以容納多少電子?

·峰值放電倍率:用於具有高浪湧電流要求的系統;

·更換電池之前的最大充電次數;

·充電時間:包括絕對意義上的充電時間(即充電至100%),以及充電至最大可用百分比的時間(針對具有非線性充電曲線的技術);

·其他:是否還有遺漏?

20200302NT31P6
圖6 未來將有更多自主平台,如無人機,利用電池供電。(圖片來源:Frankhoffner-Own work,
CC BY-SA 3.0)

而且,隨著電池技術的進步,電池的價格不斷下降,產業價值不斷提高,至少還有一個明顯的機會值得考慮。與地熱這一類資源不同,許多可再生能源是週期性而不是恆定輸出,例如,風並不總是在吹,太陽晚上也不會照耀大地(甚至在多雲的天氣沒有那麼強烈),潮汐的強度和方向也不是固定的,而作為媒介的電池則可以緩衝並消除這種不一致模式。

隱私

圖7是蘋果的產品(具體地說是iPhone 11系列),因為在面對執法和利潤等壓力時,蘋果長期以來一直強烈主張保護消費者隱私。比如,利潤方面的壓力包括,找出用戶是誰、他們在做什麼、對什麼感興趣,並相應地為他們提供量身訂做的廣告,與其他公司共用和交換資料等等。然而,與Facebook等合作夥伴相比,蘋果的行動有時似乎與其企業使命並不一致,特別是他們有足夠的財力使公司從中得到好處。是的,加密資料和通訊通道的話題再次升溫,聯邦、州和其他執法機構要求安置「後門」,科技公司竭力抗拒。預計這種緊張局勢未來只會增強,不會減輕。

20200302NT31P7
圖7 面對執法和利潤等壓力,蘋果一直主張保護消費者隱私。

Deepfake

「Deepfake」(編註:維基百科指出,Deepfake是Deep Learning與Fake的混成詞,專指基於人工智慧的人體影像合成技術的應用) 這項技術其實並不新奇,早在1994年的電影《阿甘正傳》中(圖8),就透過改變靜態影像、視訊、音訊和其他資料,呈現了與最初拍攝畫面不同的場景。近年來這種現象呈爆炸式增長,並且隨著深度學習演算法的不斷應用而變得愈加真實。例如,將一個人的臉嫁接到另一個人的身體,或產生實際上並沒有說過的話語,甚至可能將這些合成的話語與視訊中人的嘴部動作匹配。

20200302NT31P8
圖8 「Deepfake」在1994年的電影《阿甘正傳》中就出現了。

美國2016年總統大選中出現的很多這類惡作劇已有文獻紀錄(我對它們的看法就沒必要記下來了),隨著2020年大選的展開,類似的惡作劇肯定會更多。當然,這並不是美國獨有的現象,俄羅斯人也對英國大選進行了「惡搞」。遺憾的是,很多人看到社交媒體推文支持他們對某人或某事的觀點時,甚至不會去盡力弄清真相。他們會認為這就是「事實」,並在線上社群進行傳播。

正如在文章開頭所言,讀者朋友們,你們對此有何想法?請留下你對這篇文章的想法,以及疏漏之處。和往常一樣感謝您的閱讀!

(參考原文: 2020: A consumer electronics forecast for the year(s) ahead,by Brian Dipert)

本文同步刊登於電子技術設計2020年3月號雜誌

掃描或點擊QR Code立即加入 “EETimes技術論壇” Line 群組 !

 EET-Line技術論壇-QR

發表評論