近日,天翼雲研發三部AI算法團隊在第五屆UG2+挑戰賽中獲得了第五名的好成績。這是天翼雲首次在國際AI頂會比賽中嶄露頭角,意味著天翼雲的科研實力位居世界領先行列。
UG2+挑戰賽由 CVPR主辦,IEEE國際計算機視覺與模式識別會議(CVPR) 是全球計算機視覺三大頂會之一。
今年,第五屆UG2+大賽圍繞霧霾條件目標檢測、黑暗場景視頻行爲識別、大氣湍流失真圖像模糊緩解三大方向,面向全世界進行賽隊招募,共吸引了海內外上百支優秀隊伍,包括NVIDIA,新加坡南洋理工大學等人工智能企業、高等院校及科研機構隊伍參賽。
天翼雲研發三部AI算法團隊首次參加該比賽,在第二賽道“黑暗場景視頻行爲識別”以87.43%的Top 1分類准確率,一舉奪得第五名的好成績。
該賽道中,主辦方提供了來自 HMDB51、UCF101、Kinetics-600和 Moments in Time數據集的精選子集,其中包括11個類別標簽(喝酒、跳躍、撿、倒、推、跑、坐、站、轉、走和揮手)共 2625 個清晰視頻,以及另一組來自ARID (Action Recognition In the Dark)數據集中11個相同類別但無標簽的黑暗場景視頻共3088 個作爲訓練集。
下圖顯示了ARID的全部動作類別的視頻剪輯樣例。視頻分辨率爲320*240,最短的剪輯長度是1.2秒,相比傳統在白天情況下清晰的視頻識別,黑暗場景下的圖像識別難度很大。
參賽隊伍需使用人工智能技術將黑暗場景的目標視頻分類到11個類別中,評價指標是測試集上的Top1分類准確率。
爲了提升黑暗場景下的行爲識別模型的魯棒性,天翼雲研發三部AI算法團隊使用圖像增強方法對黑暗視頻進行預處理,讓圖像從曝光強度的線性響應變成更接近人眼感受的響應,提升暗部細節。代表隊對比了現有的先進視頻分類算法(R3D,X3D,Timesformer,Slowfast,UniFormer,i3D等),進行網絡和訓練參數優化,並結合Multigrid方法加速模型訓練。由于在黑暗環境下拍攝的視頻具有低亮度和低對比度等特點,而通過圖像處理合成的暗視頻不能很好的模擬低對比度特性,所以這種合成的暗視頻不能直接應用于模型訓練。
天翼雲研發三部AI算法團隊利用CycleGAN做風格遷移,生成黑暗視頻來進行數據增強,並采用半監督算法同時利用清晰視頻和黑暗視頻,聯合使用自適應損失和標記數據的交叉熵分類損失進行模型優化。經過兩個月的算法與模型優化,天翼雲研發三部AI算法團隊將黑暗場景下圖像識別率提升了4倍。最終在未知的黑暗視頻測試集上的top1分類准確率達到87.43%,奪得了第五名的好成績。
該視頻分析技術有較高的應用價值,可應用在夜間安全監控場景中,適用于大雨、大霧、霧霾等惡劣天氣下的圖像處理與視頻分析。
通常夜間工作的安全攝像頭沒有充足的光線,難以捕捉連肉眼也無法識別的動作。盡管可借助紅外成像傳感器等其他手段識別暗夜環境中的動作,但其成本較高,大規模部署不夠經濟。因此,探索對黑暗具有魯棒性的視頻分析技術,從黑暗視頻中提取有效的動作特征,對精准且經濟地做好安全監控工作意義重大。
小到行程碼識別,大到智慧城市建設,一直以來,天翼雲探索視頻智能分析和圖像處理相關技術,自研算法通過天翼雲諸葛AI平台産品賦能千行百業。目前,天翼雲研發三部AI算法團隊,在起草制定人工智能相關行業標准的同時,已完成百余項核心算法的自主研發。未來,天翼雲將繼續發揮雲上數智優勢,努力打造央企雲計算原創技術策源地。



