利用感測器和資料分析對抗COVID-19

作者: Maurizio Di Paolo Emilio,EE Times Europe

在對抗COVID-19新冠疫情的戰鬥中,政府、醫護人員及各個行業利用人工智慧(AI)和各種熱感測器,基於大資料進行分析和預測,將其對公共衛生和全球經濟的衝擊降至最低。透過資料分析和數學方法,再加上物理學方法,可以讓我們更深入地瞭解病毒的自然發展過程…

在對抗COVID-19新冠疫情的戰鬥中,政府、醫護人員及各個行業利用人工智慧(AI)和各種熱感測器,基於大資料進行分析和預測,將其對公共衛生和全球經濟的衝擊降至最低。

COVID-19與引起嚴重急性呼吸道症候群(SARS)和普通感冒的病毒系出同宗。人類對這種新病毒還不具備免疫力,其早期的影響是毀滅性的。

在中國湖北公告第一個病例之後的幾個月,大多數國家都只進行了零星的測試,因此全球各地的人們不清楚他們中間到底有多少人感染新冠病毒,也不知道如何躲避這種危險,甚至不瞭解其傳播範圍。沒過多久,人工智慧和資料分析技術專家們就意識到,可以利用人工智慧技術和資料科學,來支援流行病學家和政府危機應對小組的工作。

透過資料分析和數學方法,再加上物理學方法,可以讓我們更深入地瞭解病毒的自然發展過程。資料科學的先鋒們應用資料收集與分析減緩了早期疫情的傳播,對社會公共衛生做出了貢獻。歷史上最早的一個資料分析案例出現在1852年倫敦爆發霍亂期間。最早採用數據分析的一位流行病學家John Snow,對倫敦死亡病例地理區域的分佈進行了分析,從而找出了疫情的源頭。當局根據他的分析有針對性地實施干預措施,迅速遏制了疫情的傳播。

評估數據的價值

研究人員透過在數據分析系統中運作模型,能夠預測疫情的發展趨勢。例如,SIR模型是一種流行病學模型,可以從理論上計算封閉地區的人口隨時間的推移感染傳染病的人數。該模型使用耦合方程來分析容易感染的人數S(t)、已感染的人數I(t)和已經康復的人數R(t)

最簡單的一個SIR模型是Kermack-McKendrick模型,它是其他許多流行病倉室模型的基礎。對於這種情況,我發現帕多瓦大學(Università degli Studi di Padova)的研究生Ettore Mariotti在3月初發表的一份分析報告非常有趣。

假設在一個人們不能出入的島上(即我們的系統),在某個時間,島上的每個人都處於這三種狀態中的一種:「易感(Susceptible)」、「已感染(Infected)」和「已康復(Recovered)」(縮寫即為SIR)。一個從未患病的人(S)有一定的機率生病受到感染(I),並在一段時間後康復(R)。對於COVID-19疫情,還需要增加一個「潛伏期(Exposed)」狀態來擴展模型,以涵蓋那些攜帶病毒但尚不具備傳染性的人群(如圖1的SEIR模型)。

圖1 SEIR模型。(圖片來源:triplebyte.com)

這一模型考慮了兩個因素:病毒的動態性,以及不同個體的相互影響。利用這些資訊,就可以定義

參數R0,表示一個感染者可能傳染的人數。

舉例來說,假設A病了,系統中R0=2,這表示A會感染兩個人。這兩個人然後將感染四個人,而這四個人中的每個人又將分別感染另外兩個人(即4×2=8),依此類推。這說明疾病的傳播是呈倍數增長而不是簡單的累加,R0有三種可能的情形(圖2)。

圖2 R0的基本場景。(圖片來源:triplebyte.com)

關閉學校、體育館、劇場、餐廳,以及其他公共場所可以減少社交接觸,從而降低R0。由於病毒的大規模傳播會導致公共衛生資源枯竭,因此將R0降至小於1非常重要。如果R0>1,疾病將傳播;如果R0<1,疾病會消失。因此,為了在冠狀病毒爆發期間降低R0,政府對人員流動實施了嚴格的限制。

需要注意的是,R0衡量的是疾病可能出現的傳播,而不是傳播的速度。想一想無處不在的流感病毒,其R0僅為1.3。因此,高R0需要引起注意,但不必為此恐慌。

R0是一個平均值,因此可能會受到一些因素的影響,例如在一定數量的人群中「超級傳播者(super-spreader)」的個數。超級傳播者是指傳染人數異常多的感染者。在SARS和MERS疫情中,以及目前的COVID-19疫情中,都出現了超級傳播者。但這不一定是壞事,因為它可能表示讓疫情持續的人數減少了。超級傳播者也可能更容易辨識和收治,因為他們的症狀很可能更重。

簡言之,R0是一個不斷變化的數值。追蹤每個病例和疾病的傳播非常困難,因此估算R0複雜而具有挑戰性,且估算值經常隨新資料的出現而發生變化。

為了幫助政府控制R0,可以利用人工智慧並透過GPS追蹤手機收集資料,創建分析模型,以預測哪些社區更有可能出現病例、哪些社區需要緊急干預。

巨量資料、人工智慧和感測器

疫情期間,病例資料的品質和一致性變化很大。一些病例呈現假陽性,這使情況更加複雜。巨量資料和人工智慧可以協助檢查人們是否遵守隔離要求,機器學習則可以用來進行藥物研究。

亞洲地區為應對疫情採取了一些有效措施,其中包括利用數位技術進行防控。例如,配備智慧掃描器和攝影機的無人機可用來發現違反隔離措施的人員,還可以檢測體溫,中國大陸和台灣甚至還應用了智慧相機來進行檢測。

香港的人工智慧技術公司SenseTime開發了一個平台,即使在人們戴著醫療用口罩的情況下,也可以透過掃描他們的面部檢測出是否發燒。SenseTime的非接觸式溫度檢測軟體已廣泛應用在北京、上海和深圳的地鐵站、學校和其他重要的公共場所。

與此同時,阿里巴巴也開發了基於人工智慧的COVID-19診斷系統,該系統可以利用電腦斷層(CT)掃描檢測出是否感染了新冠病毒,準確率高達96%。

紐約的Graphen正在與哥倫比亞大學(Columbia University)合作,目的是定義新冠病毒每個基因定位的規範形式,並確定有哪些變體。Graphen提供的Ardi人工智慧平台模擬人類大腦的功能,研究人員利用它來儲存突變資料,並使之視覺化。

典型的視覺化功能是將一個病毒與一組具有相同基因序列的病毒映射。只需點擊相應的節點,就可以查看與病毒相關的資訊,包括感染者的位置、性別和年齡。

疫情期間,巨量資料已被廣泛用於改善監視系統,以繪製病毒傳播圖。

巨量資料的採集、處理和分析需要新的方法和技術。以下列出了四種不同的巨量資料分析方法:

  • 描述性分析,是用來描述業務流程或業務專案當前及過去狀況的方法與技術,它以綜合圖形方式來表示活動的性能指標;
  • 預測性分析,包括數據分析工具,利用回歸分析和預測模型等數學方法協助我們瞭解未來可能發生的事;
  • 指示性分析,用於確定有效的策略和可行的方案;
  • 自動化分析,包含一些工具,可以根據分析結果自動執行所需的操作。

阿里巴巴還開發了「支付寶健康碼」應用,利用巨量資料支援中國的醫療保健系統,指示誰可以進入公共場所,誰不可以進入。

BlueDot是多倫多的一家新創公司,基於其人工智慧平台BlueDot開發的智慧系統可以自動監控並預測傳染病的傳播。BlueDot平台在SARS疫情中已投入使用,其發揮的作用毋庸置疑。

值得一提的是,2019年12月,BlueDot曾對冠狀病毒的潛在威脅發出警告,再次證明了其模型的正確。BlueDot使用的工具包含自然語言處理技術。

馬里蘭州羅克維爾(Rockville, Maryland)的Insilico Medicine是另一家致力於利用人工智慧來預防疾病的公司。該公司正在開發下一代人工智慧和深度學習方法,將其應用在新藥發現與開發過程的每一步。Insilico最近使用其系統分析了可能適合對抗新冠病毒的分子,並已經取得成果,該公司目前正在整理用於疫苗開發的資訊資料庫。

疫情衝擊經濟的分析

除了對公眾健康的影響之外,COVID-19對全球經濟也造成了毀滅性的打擊。相關部門利用巨量資料和人工智慧分析了疫情對經濟的影響,並制定適合的應對策略。

例如,WeBank研究人員利用衛星分析技術確定了中國受疫情影響最大的產業,其中包括鋼鐵產業。分析顯示,中國鋼廠的生產量在疫情初期最少降低到了產能的29%,但到2月9日已恢復到產能的76%(圖3)。

圖3 將2019年12月30日(左)和2020年1月29日(右)同一區域的兩張衛星圖進行比較,可以看出,在疫情爆發初期,中國的鋼鐵業生產活動急劇下降。(圖片來源:spectrum.ieee.org)

研究人員還利用人工智慧來瞭解其他的生產和商業活動。其中一種方法是簡單地統計大型停車場中汽車的數量。分析顯示,到2月10日,特斯拉(Tesla)在上海的汽車生產已完全恢復,而上海迪士尼樂園等旅遊場所仍處於關閉狀態。

利用分析GPS衛星資料,可以確定有多少人正常上班。然後,由相關軟體計算出每個城市的通勤人數,並對2019年和2020年春節假期剛開始時搭乘公共交通的人數進行比較。結果表示,搭乘公共交通的人數在這兩年的春節假期開始時都下降了,但是2020年春節後的通勤人數並沒像2019年那樣恢復。

WeBank研究人員由計算得知,隨著經濟活動的逐漸恢復,到2020年3月10日,大約75%的勞動力已返工。根據這些曲線,研究人員預測,在中國除武漢以外,大多數工人將在3月底恢復正常工作。

在對抗新冠疫情的戰鬥中,人們使用了自己的強大工具,而那些經過實踐證明有效的方案未來很可能成為一種標準。

(參考原文:Marshaling Sensors and Data Analysis to Combat Covid-19,by Maurizio Di Paolo Emilio)

本文同步刊登於EDN Taiwan2020年7月號雜誌

 

發表評論