電子發燒友網報道(文/李彎彎)計算機視覺技術最早開始于20世紀60年代,計算機視覺技其主要是術面模仿人類視覺,讓計算機或機器人看到物體,挑戰到如今計算機視覺已經取得很大進展,計算機視覺技不過就研究和開發來說,術面它還有很大的挑戰探索空間。
當今的計算機視覺技計算機視覺的子領域大概可以包括:場景重建、目標檢測、術面事件檢測、挑戰視頻跟蹤、計算機視覺技目標識別、術面3D姿態估計、挑戰運動估計、計算機視覺技視覺伺服、術面3D場景建模、挑戰圖像修復等。
比如目標檢測,具有目標檢測的設備可以找到目標,在其周圍畫出矩形邊界框,并確定每個被檢測目標的類別,目標檢測可以應用于許多不同的行業,包括零售、體育、醫療保健、營銷、室內設計、農業、建筑、公共安全、交通等。
目標檢測是一個復雜的過程,其實現需要經歷一定的挑戰,比如視角的多樣性、變形、遮擋、光照條件、雜亂或有紋理的背景、多樣性、速度等。具體來看,比如視角的多樣性,物體檢測的最大困難之一是從不同的角度看一個物體,可能看起來完全不同;
再比如照明對物體的定義有很大的影響,相同的物體會因光照條件的不同而看起來不同,可能照亮的空間越少,物體就越不可見,這些都會影響檢測器定義目標的能力;在視頻方面,探測器需要經過訓練,在不斷變化的環境中進行分析,這意味著目標檢測算法不僅必須準確地分類重要的目標,而且還必須在預測過程中具有好的速度,能夠識別運動中的目標。
從某種意義說,這幾年計算機視覺已經進入瓶頸期。以圖像分類、目標檢測、圖像分割為代表的一些基礎技術經過過去幾年的發展,精確度已經達到產業落地水平,但剩下的一些問題比較難攻克,如非常細粒度的分類,非常小和模糊的目標檢測和分割,以及如何保證在復雜光照變化下的分割結果的穩定性等。
可以說過去幾年,計算機視覺技術一直在試圖攻克一些老的難題,如跨年齡、大姿態、有遮擋的人臉識別,有一定的進展,卻不能算是有很大的突破。
在落地應用方面,計算機視覺存在很大的同質化問題,很多公司扎堆在幾個熱門場景中,比如安防場景,智能安防是計算機視覺最主要的應用場景,而且已經持續很多年,目前來說,計算機視覺較為成熟的應用場景也是安防領域。
大家熟知的AI初創企業商湯、曠視、依圖、云從等都在這個領域有重要布局,另外安防企業和互聯網企業也在這個領域投入很大力度,包括海康威視、大華、宇視、百度等,此外還包括幾百家中小計算機視覺企業。
不過除了安防,各企業也有在其他領域進行探索,并逐漸有所進展,比如金融、手機、汽車、工業、醫療、零售等領域,比如虹軟科技,在手機領域、筆記本電腦、智能可穿戴設備等移動終端,以及智能駕駛領域都有布局,再比如格靈深瞳除了城市管理之外,在智慧金融、商業零售等方面都已經取得一定成績。
整體而言,從上世紀60年代到現在計算機視覺技術已經取得很大的進展,不過其在實現上還存在一些難題,發展也遇到了一些瓶頸,而且在落地應用上大多數企業扎堆在少數場景中,不過從近年來的情況來看,計算機視覺企業在技術和應用上還在持續尋找突破,目前除了在安防領域應用比較成熟以外,在金融、醫療、工業、智能駕駛等領域進展明顯。