日前,一年一度的計算機(jī)頂級視覺會議CVPR 2019在美國長灘如期舉行,16日進(jìn)行的Workshop on Bridging the Gap between Computational Photography and Visual Recognition宣布了本次UG2+計算機(jī)視覺算法競賽(視頻目標(biāo)檢測和分類)的比賽結(jié)果。其中,由東北大學(xué)機(jī)器人科學(xué)與工程學(xué)院遲劍寧老師和中科院微電子學(xué)院鐘匯才老師帶領(lǐng)的“CAS-NEU”聯(lián)合參賽隊(團(tuán)隊參賽人員包括機(jī)器人國家重點實驗室的研究生王歡,劉一秀)獲得了本次視頻目標(biāo)檢測和分類競賽的冠軍。
UG2+競賽由CVPR和多家計算機(jī)視覺領(lǐng)域知名的政府機(jī)構(gòu)、學(xué)術(shù)機(jī)構(gòu)、企業(yè)聯(lián)合舉辦,其主要目的在于評估和探索當(dāng)前最先進(jìn)的圖像處理算法在極端條件下對檢測和識別等任務(wù)的精確性與魯棒性。本次競賽包含無約束視頻中的物體分類與檢測和低可見環(huán)境下的物體檢測兩個任務(wù)。其中,遲劍寧帶領(lǐng)的團(tuán)隊參加了任務(wù)一中的“視頻目標(biāo)檢測和分類增強”子項目,經(jīng)過一個多月的努力,最終從兩百多支參賽隊伍中脫穎而出,取得了本次競賽的冠軍。團(tuán)隊成員于6月16日在CVPR會議現(xiàn)場做了題為“Image Enhancement Framework for Reducing Artifacts in Recognition Tasks”的口頭報告。
視頻目標(biāo)檢測是計算機(jī)視覺領(lǐng)域一項非常重要的任務(wù),旨在利用分析比較的計算機(jī)處理技術(shù),在戶外移動場景(無人機(jī)、滑翔機(jī)、自動駕駛汽車以及戶外機(jī)器人)下對目標(biāo)進(jìn)行準(zhǔn)確的檢測和識別。目前,主流的非受限環(huán)境下的視頻目標(biāo)檢測算法大都基于通用物體檢測框架進(jìn)行設(shè)計,如Resnet50、Inception、VGG19、Faster-RCNN、FPN等。但由于實際應(yīng)用場景的復(fù)雜性,運動模糊、光照不均、低分辨率等因素的影響給實際應(yīng)用場景中的目標(biāo)檢測帶來了巨大挑戰(zhàn)。
本次競賽提供了6000張移動機(jī)器拍攝的真實場景中的視頻圖像作為訓(xùn)練集,以及數(shù)千張(未公開)相同設(shè)置下采集的圖像作為最終的測試集。數(shù)據(jù)集涵蓋了實際檢測場景中可能遇到的各種光照,運動模糊和分辨率下的圖像,包含159464個目標(biāo)以及37個場景類別用以檢測與分類。為解決該問題,參賽團(tuán)隊(CAS-NEU)側(cè)重于圖像預(yù)處理策略的研究,使用ARCNN(Artifacts Reduction Convolutional Neural Network)作為基礎(chǔ)增強網(wǎng)絡(luò),并輔以圖像銳化及直方圖增強等經(jīng)典增強算法對視頻圖像質(zhì)量進(jìn)行提升,有效提高了后續(xù)檢測算法的準(zhǔn)確度。最終,該團(tuán)隊在由主辦方組織的測試集評測上取得了年度最好成績,獲得了該項賽事的冠軍。
圖1競賽獲獎獎牌
圖2競賽頒獎現(xiàn)場。圖中人物從左至右為:IAPAR官員Lars Ericson, CVPR UG2+大賽主辦方代表Walter J. Scheirer,東北大學(xué)代表劉一秀博士,中科院微電子所代表王師崢老師