最近幾年的科學研究表明,在單次20分鐘的無人機飛行期間所捕捉到的空中圖像可能需要花費半天以上的時間去分析。早些時候為了應對“帕姆”颶風,我們在世界銀行的人道主義無人機任務中飛行了幾十次。我們捕捉到的圖像足以讓一位專家分析師專心致志工作至少20個全職工作日才能搞清楚。換句話說,航空影像已經(jīng)成為一個大數(shù)據(jù)問題。因此,我和我的團隊正在使用人類計算(眾包)、機器計算(人工智能)和計算機視覺來理解這一新的大數(shù)據(jù)源。
例如,一些重慶大數(shù)據(jù)公司與南安普頓大學和EPFL合作,從航空影像中分析了颶風“帕姆”在瓦努阿圖(西南太平洋島國)中所造成的破壞。這項研究的目的是為了能夠得到及時的響應解答。救援組織想要的不僅僅是受災地區(qū)的高分辨率航拍圖像,他們需要的是答案;例如,受損建筑物的數(shù)量和位置,流離失所的人們的數(shù)量和位置,以及還有哪些道路仍然可用來運送救援物資等。簡單地給他們圖像是遠遠不夠的。正如我在新書《數(shù)字人道主義者》中所表明的觀點那樣,援助和發(fā)展組織已經(jīng)被災前災后產(chǎn)生的擁有巨大體量和迅猛速度的大數(shù)據(jù)所淹沒。再加上另一個數(shù)據(jù)源“空中大數(shù)據(jù)”可能是毫無意義的,因為這些組織可能根本沒有時間和能力來理解這些新數(shù)據(jù),更不用說將結果與其他數(shù)據(jù)集成在一起了。我們分析了部署用來跟蹤颶風帕姆的MicroMappers平臺的眾包結果,以確定這些數(shù)據(jù)是否可以用來訓練未來能在瓦努阿圖遭受災難的過程中自動檢測災難損害的算法。在整個MicroMappers的部署期間,數(shù)字志愿者分析了3000多張高分辨率的傾斜航空圖像,追蹤那些可能被完全摧毀、部分受損、基本完好的房屋。我和同事Ferda Ofli與Nicolas Rey(暑期和我們共事的EPFL研究生)合作,探索這些痕跡是否可以用來訓練我們的算法。下面的結果則出自Ferda和Nicolas之手。我們的研究不僅僅是一項學術活動。瓦努阿圖是世界上最易受災的國家。此外厄爾尼諾現(xiàn)象(El Ni?o)可能是半個世紀以來最強的一次。
根據(jù)眾包結果,1145幅高分辨率圖像中沒有包含任何建筑物。以上是一個簡單的直方圖,描述每幅圖中建筑物的數(shù)量。瓦努阿圖的航拍圖像是非常不均勻的,不僅在它們展示的特征多樣性上有所不同,而且在視角和拍攝的高度也各不相同。雖然絕大多數(shù)的圖像是傾斜的,有些圖像幾乎是最低點圖片,有些則非常接近地面,甚至是在起飛之前拍的。
我們的圖像數(shù)據(jù)集的異質性使得這種圖像的自動分析更加困難。此外,我們數(shù)據(jù)集中還存在很多尚在施工中的建筑物,因為它們看起來很像損壞的建筑物,所以識別起來也是一個大難題。我們的第一項任務是訓練算法,以確定任意給定的航空圖像中是否顯示了某種建筑物。這是一個重要的任務,因為在我們的數(shù)據(jù)集中超過30%的圖像不包含建筑物。因此,如果我們能夠開發(fā)出一種精確的算法來自動過濾掉這些無關的圖像(比如下面的“噪音”),這樣我們就能集中心力于處理相關圖像的眾包分析。
迄今為止雖然我們的研究結果還處于初級階段,但我們已經(jīng)對所發(fā)現(xiàn)的東西感到欣慰了。我們訓練用來確定一幅空中圖像中是否包括建筑物的算法已經(jīng)達到90%以上的精度了。更確切地說,我們的算法能夠識別和過濾掉60%不包含任何建筑物(召回率)的圖像,而且只有10%包含建筑物的圖像被錯誤地丟棄(精確率為90%)。下面就是舉例。毫無疑問現(xiàn)在仍然存在很多的重大挑戰(zhàn),所以我們希望在現(xiàn)階段不做出過分承諾。在接下來的步驟中,我們將探索我們的計算機視覺算法是否能夠區(qū)分遭到破壞或者保存完好的建筑物。
我們之前在瓦努阿圖使用的無人機還需要我們操作著陸才能獲得采集到的圖像?,F(xiàn)在越來越多的新型無人機提供了實時地將航拍圖像和視頻傳送回基地的功能。例如,大疆推出的“精靈”系列新品Phantom 3無人機(見下圖)就允許用戶將航空視頻直接發(fā)送到YouTube進行直播(假設有連接)。毫無疑問,這是無人機工業(yè)的發(fā)展方向:實時數(shù)據(jù)收集和分析。在人道主義應用中的搜索和救援等方面,實時進行數(shù)據(jù)分析是更上一層樓的。