物聯網(IoT)應用已縱向滲入幾乎每一個產業,並有效擴展了原有系統的實用性,例如,出於安全目的,住宅、商業和工廠開始使用可視門鈴。這些服務過去通常僅限於閉路電視網路中的高階設備,因為只有高階設備才能提供昂貴的雙向音訊和單向視訊功能,現在IoT技術無需大規模鋪設同軸電纜或乙太網路基礎結構即可實現同等級別的安全性。本文深入探討了有關可視門鈴的一些視訊、音訊和電源設計難題,以及解決這些難題所需的技術。

無縫用戶體驗

傳統的可視門鈴系統包含按鈕、麥克風和攝影機。這些系統通常硬連線到電源,視訊則被傳送到一台電視機上。支持IoT的可視門鈴功能相似,實現方式卻大相徑庭。運動感測器檢測到有客人向門口走來,並透過雲端將視訊傳輸到智慧型手機App。室內的主人利用可視門鈴與客人交流,此時雙向IP音訊和單向視訊在手機App中流過。這些門鈴的基本功能可與完整的安全系統整合在一起,遠端啟用/禁用無鑰門鎖、觸發警報,或根據特定輸入自動進行回饋。

早期的可視門鈴經常出現視訊和音訊問題,例如門鈴誤響和鈴聲不連貫,但是要實施雲端備份、運動檢測、視訊串流和雙向通訊等關鍵功能均需具備流暢的性能。這些要求,加上先前的硬連線功率限制,為現在的可視門鈴子系統帶來了一系列硬體挑戰。

運動誤檢事件

可視門鈴中常用的熱電(又稱被動紅外線,PIR)運動感測器容易出錯,例如,對於白天行駛的車輛產生的強光,或吹來的一陣暖風,或蟲子、動物,以及其他各種基於熱量的活動,運動感測器都可能做出錯誤反應,並在使用者手機上觸發惱人的錯誤警報音和通知。這時用戶可能會完全忽略警報,甚至使門鈴離線,從而大大降低可視門鈴的安全性。此外,PIR感測器頻繁發生錯誤的運動檢測事件,還會大幅縮短電池壽命。

一種較直接的解決方案是使用兩個PIR感測器來提供稍微重疊的覆蓋範圍,以此來實現更大的運動檢測區域(圖1)。這種雙感測器方案僅對較大的物體發出通知,對較小物體(例如蟲子和寵物)則不會記錄。PIR感測器與其他光感測器和溫度/濕度感測器一起使用,可避免因溫度或光的快速變化而引起誤觸發。這種多模式感測方法減少了出現錯誤警報的可能,同時消耗最少的功率,從而延長了電池壽命。

20200212TA31P1 圖1 冗餘的PIR感測器可提高人體運動檢測的準確性,因為必須觸發多個光束才能將其視為運動事件。

透過使用嵌入式微控制器(MCU)和某些韌體來實現基於演算法的運動檢測,也可以提高精準度。實現基於視覺運動的檢測有很多種方法,最常見的一種方法是將當前畫面與參考影像進行比較,並逐個畫素地追蹤差異。這類影像處理必須夠智慧,才能將經過的車輛和風吹樹木產生的運動當作背景的一部分,從而避免產生誤報,但這種功能需要相當大的處理能力。

這些過濾任務中的一部分可交由基於雲端的演算法來承擔,這些演算法可對使用者的特定影像資料進行微調。但這需要較大的基礎架構來提供支援,還要有良好的Wi-Fi連接,但這仍會導致高功耗。因此,智慧門鈴不會由電池供電,至少目前是這樣。雖然門鈴依靠外部電源供電限制了其安裝位置,但好處是使用者永遠都不需要為電池充電或更換電池。

影像感測器和處理器介面問題

可視門鈴中的影像處理需要影像感測器和數位媒體處理器,大多數情況下還需要一些週邊元件。在選擇影像感測器時需要考慮一些因素,其中最重要的是解析度、畫面播放速率、畫素大小、畫素結構和快門時間。除了針對單個元件的諸多考慮因素,通常還要考慮影像感測器和數位媒體處理器之間的介面問題。

你可能會發現一對出色的元件因輸入/輸出(I/O)介面格式不匹配而無法相互通訊。由於I/O介面(I2C、平行、通用I/O)差異很大,因此更容易犯下此類錯誤。為了避免這種惱人的情況發生,設計人員必須確保影像感測器支援的I/O介面與數位媒體處理器的I/O相容。

當兩個元件具有不同的工作電壓和邏輯訊號電平時,也可能出現類似的問題。幸運的是,電壓轉換元件可透過0.6V~5.5V的雙向電壓轉換輕鬆解決這種不匹配問題。儘管這會導致BOM中產品的成本略為上升,卻使設計人員有更多的影像感測器和MCU選擇,而不是只能使用相同電壓的感測器和MCU。

易產生噪音的環境

由於現在的可視門鈴採用全雙工和免持通訊,複雜性更高,因此要求所設計的門鈴必須能夠處理因使用者將揚聲器/麥克風增益調節得過高而導致的不穩定回饋。例如,接收聲音的人需在揚聲器上獲得相對較大的增益才能完全聽清對方說話,但是麥克風近距離很容易檢測到聲音並經常將其放大回去,從而導致討厭的回聲(圖2)。過去的半雙工通訊在從揚聲器接收訊號時,是利用顯著降低麥克風的增益來減少這種回聲。

20200212TA31P2 圖2 關於迴響語音和回聲,雙向音訊通訊有諸多因素需要認真考慮。

在雜訊水準相對較低的環境中,主動調整麥克風和揚聲器增益的系統可能會在全雙工通訊中糾正此問題。然而,當環境中的噪音源不可預測時(如經過的公共汽車或其他車輛),上面的方法卻效果不佳。有幾種數位訊號處理(DSP)技術,包括回聲消除(AEC)和自我調整頻譜降噪(ASNR),可以解決這一問題。AEC先辨識一個傳輸訊號,若在某個時間段內該訊號重新出現,則會將它消除,由此創建了自我調整濾波器來有效消除回聲。ASNR則是利用頻域,從音訊訊號中去除環境雜訊和不需要的雜訊分量,從而去除背景雜訊和寬頻雜訊。AGC旨在改善免持通訊中的低聲壓級語音訊號,此類音訊演算法保持了麥克風和揚聲器的增益,卻不會產生不必要的回饋和回聲,也無需進行語音切換,從而提供出色的音訊體驗。

最大限度利用揚聲器

儘管複雜的DSP演算法有助於實現全雙工音訊通訊,但它們通常無法最大限度地提供系統音訊揚聲器的全部功能。當揚聲器音圈過熱並超出偏移限值時,會導致快速損壞和音錐,因此音訊工程師通常會硬性地將放大聲壓級限制為遠低於揚聲器的實際性能。與放大器配合使用的軟體演算法可以即時監控揚聲器的溫度和偏移,該回饋可實現更精細的聲壓級和更高的音訊清晰度。

語音命令和語音辨識

未來的可視門鈴可能會採用語音啟動和語音辨識技術來實現免持控制。由於這些語音使用者介面從多個麥克風和DSP演算法接收命令,因而又增加了另一層複雜性。這些門鈴與接收語音的麥克風相距較遠,但它們很可能會使用波束成形演算法將有用的音訊訊號與背景雜訊分開。現在已經有麥克風線路板實現了波束形成演算法,可從放大揚聲器方向放大語音訊號,從吵雜環境中獲得清晰的語音和音訊。

要使一個可視門鈴真正實用,這些高階功能最好不使用額外的電源,並且還要能利用本地麥克風輸入訊號正常工作。工程師們正在改進設計,使產品更簡單、功耗更低、尺寸更小。

功耗預算挑戰

實用的可視門鈴可以採用以下任何一種方式供電:一種方式是使用可充電電池,第二種方式是從屋子現有的低壓門鈴佈線中獲取電能,第三種方式是配一個乙太網路供電(PoE)介面。這些供電方式各有利弊(表1)。如前所述,用電池供電的好處是可以靈活選擇門鈴的安裝位置,使安裝更加簡單,而採用硬連線的門鈴則具有維護成本低的優勢。

20200212TA31P2-1 表1 可視門鈴的供電方法。

由電池供電的可視門鈴最關注節能問題。前面提到的很多演算法需要更多的功耗密集型處理。一些專門的SoC設計,例如德州儀器(TI)CC3120/CC3220,可透過較少的片外事務(片上RAM和/或快閃記憶體)實現更高階的平行處理(喚醒/睡眠觸發器、網路連接),從而降低了總體功耗。此外,專為電池供電而設計的MCU具有多種電源模式,包括關機、休眠、睡眠、待機和活動模式,細心的開發人員因此可進一步降低能耗。

如果使用家裡現有的門鈴電源,主要考慮的因素是:交流電源不提供用於這些產品的標準輸出電壓,因為其最初是為電壓在8V~24VAC之間的門鈴而設計。對於採用這種方式供電的門鈴,為了最大程度地降低性能下降,必須特別留意一些參數,例如輸出電壓精準度、電壓波紋、滿負載下的系統效率和散熱。對一些特別靈敏的元件應尤其小心,例如常用於可視門鈴的互補式金屬氧化物半導體(CMOS)影像感測器,這些元件對電源波動、電磁干擾和溫度變化等雜訊源特別敏感。

為實現最佳性能,可視門鈴所需的電源應能接受各種低壓交流電,並為各個子系統(感測器、I/O、音訊、記憶體、使用者介面等)產生乾淨、穩壓良好的直流電(這些子系統也可以置於門鈴緊湊的外殼中)。圖3的示例通常包含多個降壓轉換器,最好是使用可在重負載下提供高效率的同步架構轉換器。這種設計需要一系列電壓或大量離散電源,而使用一個降壓穩壓器就可為幾個線性穩壓器供電(低壓差較理想)。

20200212TA31P3 圖3 可視門鈴電源架構示例。(資料來源:TI)

對於電池供電的應用,不管是滿載還是輕載,系統效率都很關鍵;對於透過硬連線供電、包裝緊密幾乎不通風的門鈴,也同樣如此。對於可視門鈴,必須用心實現諸如使用者介面、無線通訊監控和運動檢測等功能,以最大程度地提高電源效率。同樣需要注意的還有待機電流,例如電源的靜態電流和關斷電流,因為它們會嚴重影響電池壽命。低靜態電流可極大地延長電池使用壽命,因為可視門鈴大部分時間都處於睡眠/休眠模式。此外,同步轉換器能夠從脈衝寬度調變(PWM)模式無縫轉變為省電模式,使其在滿載和輕載時均保持較高效率。

可視門鈴是具有嚴格尺寸限制(有時還有功率限制)的幾種IoT產品之一,在處理器愈加複雜的高功耗演算法與有限的功率資源之間,它必須取得平衡。這些限制使門鈴的設計面臨獨特的挑戰,隨著技術的進步,克服這些挑戰變得可能。語音、聲音和臉部辨識等人工智慧逐漸成為住宅安防系統的必備功能,設計挑戰將變得越來越複雜。

(參考原文: Overcoming design obstacles in video doorbells,by Srinivasan Iyer)

本文同步刊登於EDN Taiwan 2020年2月號雜誌