小白學視覺 / 待分類 / 計算機視覺近10年發展回顧與未來發展方向

分享

   

計算機視覺近10年發展回顧與未來發展方向

2021-01-28  小白學視覺

重磅干貨,第一時間送達

在未來十年中,計算機視覺將取得長足發展。在本文中,我們將探討2010~2020年間計算機視覺的發展趨勢和取得的突破性成就,以及未來計算機視覺的發展目標。

01. 計算機視覺簡史
在整個80年代,90年代和00年代,計算機視覺是一項非常困難的任務。甚至在實驗室環境中的也很難得到較好的處理結果。在那個年代,用于訓練視覺學習的機器學習系統是通過特征工程手動設計而成。
那什么是特征工程?這意味著我們用“專家”的直覺進行了特殊的設計,這些辦法對圖像中的特定模式起作用,從而為學習計算機視覺創造許多有用的功能。多年來,我們積累了許多不同的辦法,每種辦法都有自己的縮寫:HOGSIFTORB甚至SURF。但是,不幸的現實是,解決現實世界中的問題需要花費大量的時間將這些技巧的融合在一起以達到較好的效果。我們可以用他們來檢測道路上的分界線,但是無法用于識別和區分人臉等。建立通用系統仍然是遙不可及的夢想。
02. 超越特征的工程
在2010年初計算機視覺發生了巨大變化,當時我們看到了自計算機本身發明以來計算機視覺領域的最大革命。2012年,在ImageNet大規模視覺識別挑戰賽上,一種名為AlexNet的計算機視覺算法比其競爭對手提高了10%。世界震驚了。關于它的最神奇的事情是:該模型沒有使用手動設計的部分。相反,該模型依賴于稱為神經網絡的通用學習系統。AlexNet的突破在于使用GPU(圖形處理單元)來更快地訓練計算機視覺模型:AlexNet在兩個消費級GPU上進行了6天的訓練。為了進行比較,OpenAI于2020年發布的GPT3在355年的模擬等效時間里進行了培訓,培訓費用約為4,600,000美元。自從AlexNet以來,我們繼續添加清晰明確的數據點:數據集越大,模型越大,并且訓練的時間越長,我們的學習功能就越好。
最近,在最近幾年中,隨著transformers的出現,我們看到了視覺算法的新突破。transformers是一種基于編碼器和解碼器的深度學習架構,這些編碼器和解碼器在自然語言(NLP)任務中已經流行了一段時間了。來自Facebook的AI研究小組的DETR論文引起了轟動,它們展示了如何使用transformers來獲得視覺任務的最新性能。transformers比當前流行的計算機視覺算法(例如MaskRCNN)更易于實現,并且代表了朝著減少計算機視覺自動化的方向又邁出一步。我們花在開發和調整算法上的時間越少,就越可能完成日益復雜的任務。
在未來的十年中,這些都將對計算機視覺產生巨大的影響,目前關于智能代理(IoT攝像頭,Alexa和Google Home設備等)是在云上還是直接在設備本身上存在許多爭議。

03. 數據功能和用于計算機視覺的合成數據
我們已經討論了算法和硬件。現在,我們陷入了AI難題中最重要的部分:數據
歷史趨勢向我們展示了以下內容:一、算法變得越來越通用,二、人工設定數據的需求越來越小。其結果是計算機視覺的性能更多地取決于用于訓練它的數據。這不足為奇,我們所有人都看到科技巨頭聚集了大量的數據集。
但是,獲取龐大的數據集并不能解決所有的AI的問題。因為這些數據集,無論是從Internet上抓取還是在室內精心上演和捕獲,都不是訓練更通用的自主算法的最佳選擇。這種“真實數據”所含有的誤差不可避免地會滲入計算機視覺算法中。此外,真實數據不容易輸入培訓中:需要對其進行清理,標記,注釋和修復。
因此,我們發現已經要準備好迎接技術變革的新時代了,就像引入神經網絡和transformers一樣重要。數據是阻礙計算機視覺發展的最大障礙。我們認為,解決方案是數據合成。快速定義:合成數據是由計算機創建和生成的數據(例如視頻游戲或電影中看到的CGI)。完全控制此虛擬世界意味著可以使用像素標簽(請考慮元數據,例如哪些像素對應于圖像中的臉部),甚至是在現實世界數據集中可能無法標記的標簽。
數據合成仍處于早期階段。與2010年代非常相似,目前每個合成數據集都是使用人工直觀設計的。但是,正如我們所說的那樣,初創公司(包括我們!)正在構建系統,這將使我們能夠生成由學習系統本身設計的無限量的合成數據流。
自動化合成數據生成的出現將改變計算機視覺。從現在開始的十年后,計算機視覺算法將通過稱為終身學習的過程不斷改進。該模型將識別其弱點,為該弱點生成新的綜合數據,然后對該數據集進行訓練。最好的情況是:全部自動化實現,在云中某處成群的GPU上運行。
這就是我們進入2020年代時可以期望的:它與數據有關,更具體地說,與數據合成有關。這將優化并實現更復雜的計算機視覺任務。
下載1:OpenCV-Contrib擴展模塊中文版教程

    0條評論

    發表

    請遵守用戶 評論公約

    類似文章 更多
    喜歡該文的人也喜歡 更多

    ×
    ×

    .00

    微信或支付寶掃碼支付:

    開通即同意《個圖VIP服務協議》

    全部>>
    国产成人无码免费视频在线观看,夜夜未满十八勿进的爽爽影院