十三 發自 凹非寺
量子位 報道 | 公衆號 QbitAI
疫情之下,口罩識別有多難,問問你的iPhone用戶朋友就知道了。
在“刷臉時代”,戴口罩的人臉識別已然成爲一個大問題。
傳統的人臉識別算法,已經無法hold住這種大面積遮擋情況,主要難點有三:
- 一張口罩“封印”半張臉,直接丟失大量臉部特征;
- 短期內無法收集大量戴口罩人臉圖像,算法訓練難度大;
- 人臉識別系統包含檢測、跟蹤、識別等多個模塊,對它們都會造成影響。
好消息是,AI工程師們逢山開路遇水搭橋,現在——戴口罩人臉識別——這座橋,已經搭好了,而且已經開放了。
百度視覺就敏銳地觀察到了這一點,找到了翻過這座大山的突破口。
他們通過采用基于空間位置的注意力機制特征學習,讓算法更加關注對眼部區域的特征學習。
△特征可視化結果
算法有了,但數據不夠用來訓練,又該怎麽辦呢?
一個傳統的辦法,就是在現有的人臉圖像上“貼”上口罩。
但這樣處理後的實驗效果並不明顯,原因是在真實場景中,人臉姿態會有變化,並且不同場景采集的圖像存在一定的差異性。
針對這個問題,百度視覺采用了基于人臉關鍵點的3D圖像融合技術。
這樣處理後,不僅解決了人臉姿態變化帶來的口罩形變和遮擋問題,還生成了更加自然、真實的照片。
更早的,針對密集人群戴口罩的檢測問題,百度與北京地鐵展開了合作,連夜集結專項項目組,3天完成初版部署,7天快速叠代上線,解決了檢測密集人群“是否戴口罩”的問題。
嗯,看來是可以愉快的戴口罩上班了!
實力的背後是技術
或許很多人會感到驚訝,百度怎麽能夠在如此短時間內,解決了難題,還做到了落地?
其實,這是必然的結果。
百度視覺早已在領域中深耕多年,技術實力不容小觑。
爲了達到業內SOTA水平,百度視覺技術部在人臉檢測問題上産出了一系列的研究,從多個角度進行優化。
△紅色框是PyramidBox的檢測效果,可以看出PyramidBox對于姿態、模糊、遮擋、尺度等條件具有極強的魯棒性。
研究成果方面,近期即將召開的計算機視覺頂級學術會議CVPR 2020在近日公布了收錄的論文,錄取率創下新低,相比去年下降3%,僅有22%,百度仍有高達22篇論文入選,其中人臉方向重要的論文包括:
- HAMBox:Delving into Online High-quality Anchors Mining for Detecting Outer Faces
- BFBox:Searching Face-appropriate Backbone and Feature Pyramid Network for Face Detector
- FaceScape:a Large-scale High Quality 3D Face Dataset and Detailed Riggable 3D Face Prediction
- Hierarchical Pyramid Diverse Attention Network for Face Recognition
此次疫情之下,人臉識別背後的核心技術問題,包括複雜場景多人臉檢測、多人臉跟蹤定位、實時模型預測、戴口罩人臉識別。
而這些問題,從上述的研究成果來看,百度視覺都或多或少的有所涉及。
如此來看,也就不難理解,爲什麽百度能夠如此高效解決高難度問題。
百度在此次疫情中的貢獻,也真正的彰顯了那句“能力越大,責任越大”,也體現了出了在計算機視覺領域中領軍者的地位。
技術的背後,還有一個百度飛槳
無論是研究還是應用,背後都需要一個強有力的平台支撐。
而此次百度在人臉識別上的成功,離不開技術硬實力,更離不開技術背後的百度飛槳 (PaddlePaddle)。
此外,目前百度戴口罩識別相關基礎能力已經通過飛槳Paddle Hub對外開源,避免讓更多程序員重複造輪子,可以直接站在百度的肩膀上。
One More Thing
通過百度計算機視覺強悍的能力,已然解決了人群“是否戴口罩”、“戴口罩的人是誰”的問題。
安全、愉快地戴口罩上班已經不是難題。
那麽更進一步的,戴口罩手機解鎖、刷臉支付,還需要多久能解決呢?
傳送門
飛槳(PaddlePaddle)官網:
https://www.paddlepaddle.org.cn/
PaddleSlim平台:
https://github.com/PaddlePaddle/PaddleSlim
Paddle PLSC大規模分類庫:
https://github.com/PaddlePaddle/PLSC
PaddleLite平台:
https://github.com/PaddlePaddle/Paddle-Lite
PaddleHub平台:
https://github.com/PaddlePaddle/PaddleHub
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態