透過免費且開放的原始碼,程式人員和開發人員可以使用它們來執行和達到預期目標。但開源運動將如何影響AI應用?
AI (AI)被許多人用來完成超越人類智慧的重大計劃。開源平台、資料、架構和模型越來越多地與AI開發相整合,以改進和增強AI專案。
開源的前提是所有都是免費的,所有人都可以使用,原始碼、設計和相關智慧財產權(IP)都是大眾共用,並且可以廣泛地重新分發。開源代表了一種開放交流,使用者可以在其中參與和協作,共同努力。程式人員使用原始碼來編寫軟體應用程式,透過這些原始碼,程式人員和開發人員可以使用它們來執行和達到預期目標。開源運動將會如何影響AI應用?本文將討論這個問題。
互通性和社群共用激發進步
在AI應用和機器學習(ML)開發進程中,開源運動比以往任何時候都更加重要。各行各業主要軟體供應商和開發商都貢獻自己原始碼,同時使用其他人的程式碼。
開放原始碼符合通用開源標準。由於企業開發符合開源標準,但沒有專有資料格式開放原始碼,因此所產生的軟體與其他軟體和應用相容,因而可實現互通性。社群共同努力確保了互通性,這非常關鍵,因為它意味著相容性和將應用程式與其他應用整合能力,促使企業網路從軟體開發中發展和壯大。
開放原始碼和軟體通常被載入到一個類似GitHub的通用平台,所有人都可以使用。儘管GitHub是一個Microsoft網站,但其目標是成為開放原始碼工作驛站。GitHub自我描述為「一個因您工作方式而啟發的開發平台。從開源到商用,您可以和5,000萬開發人員一起管理和查閱程式碼、管理專案,並建構軟體。」
另一個流行的共用程式碼平台是透過Apache軟體基金會(Apache Software Foundation;ASF)。它為原始碼提供了一個架構,那些致力於共用智慧財產開源信念的人可以完全信任此架構,而不必擔心侵權或其它責任。該基金會奉行「阿帕奇之道」(The Apache Way),其中「超過730名個體成員和7,000名提交者成功合作開發免費且可用的企業級軟體,使全球數百萬使用者受益。」
在AI中,一個資料架構使用資料來創建預測性結果,這種預測用於學習資料並不斷訓練模型,所有這些透過回饋迴圈完成。資料是學習型,同時支援預測。透過不斷回饋資料和預測,可提高預測準確性。
共享乘車公司Lyft是開源資料工具如何在日常應用中使用的案例之一,該公司最近為其內部營運採用多年AI資料開源了一個除錯工具。過去三年來,Lyft內部一直在使用名為Flyte工具,並糾正和除錯Lyft定價、位置、預計到達時間、地圖和自動駕駛開發等團隊相關資料。這些都是開源資料,任何人都可以下載和使用。
AI開源架構
AI有許多開源架構,所有人都可以存取,許多人都在使用,從而創建可能是專有的應用程式,但它們仍是基於開源架構。例如,Google的TensorFlow是一個流行且有用開源架構,該架構是一個由工具和庫組成的綜合生態系統,使開發人員能夠將機器學習(ML)應用到各自的市場,並更好地服務於他們的市場。例如,Airbnb、eBay、Dropbox等都在使用TensorFlow。
許多人不知道的TensorFlow允許租賃清單遵循適合使用者順序,因為該使用者及其偏好是根據他們個人資料和搜索訊息而指定。它或許有助於eBay更好地展示拍賣清單,或者它可能會為Dropbox使用者建立遵循特定模式的檔層次架構。
Amazon SageMaker Neo是另一個開源機器學習平台,其專案程式碼可協助AI開發人員構建模型,透過雲端學習資料並訓練ML模型。它與物聯網(IoT)應用使用感測器和其他運算與連網裝置相容。AI開發人員可以使用它來做出準確預測。例如,一家採用機器學習的公司SyntheticGestalt使用SageMaker Neo來訓練製藥和生命科學產業藥物開發模型,它能夠處理和學習實驗資料,對其進行評估,並產生模型結果。
開放式神經網路交換(Open Neural Network Exchange;ONNX)是一個開源AI生態系統,專門為AI創建以表現機器學習模型。該系統運算單元很常見,可作為ML和深度學習模型基礎建構模組。這有助於AI開發人員利用這些格式來使模型與AI應用中不同架構和工具一起工作。與其他開源平台和格式一樣,ONNX支援其他應用和解決方案之間互通性。透過在首選架構內開發,能夠減少應用程式下游不相容問題。
開源未來前景
伴隨AI在完成重大計劃方面不斷獲得推動,開源思維方式也將繼續幫助加速AI開發。開源利用互惠互利社群力量,透過使用開源資料屬性、資料、演算法、平台架構和格式來完成驚人壯舉。
開源平台將能夠幫助技術充分利用數學、科學和其他技術,並透過AI以全新和不同方式改進我們世界,透過這種方式,我們將超越之前曾經認為不可能的目標。
加入LINE@,最新消息一手掌握!