空白行
人臉識別檢測算法DSFD宣布開源
訪問量:1905 發(fā)布日期:2019/4/25 12:49:17 發(fā)布人:admin
空白行
(1)設(shè)計了一種新的“特征增強(qiáng)”模塊(FEM:Feature Enhance Module)
FEM在采用Top-Down層間信息融合的同時,在同一“感受野”內(nèi)做了更多的enhancement。因此在width and depth上學(xué)習(xí)到了更有效的context和semantic信息。
(2)提出了“分層錨點漸進(jìn)”式的代價函數(shù)監(jiān)督(PLA:Progressive Anchor Loss)
模型采用2個層級(hierarchy),基于第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的anchor。在訓(xùn)練過程中,PAL對整個模型形成了更有效的監(jiān)督。
(3)設(shè)計了一種“改進(jìn)的錨點匹配策略”(Improved Anchor Matching Strategy)
One-stage detector由于在輸出層分配有密集的anchor,anchor與face匹配的好壞直接影響訓(xùn)練效果。優(yōu)圖的研究人員data augmentation過程中充分考慮了不同大小的face和各個anchor的關(guān)系,提出了一種新的數(shù)據(jù)擴(kuò)增法。
隨著近幾年人工智能技術(shù)的發(fā)展,國內(nèi)外不少機(jī)構(gòu)、企業(yè)都在進(jìn)行人臉檢測的相關(guān)研究。來自騰訊優(yōu)圖的研究員們發(fā)現(xiàn),雖然之前的人臉檢測算法大都采用深度學(xué)習(xí)模型,并在特征學(xué)習(xí)的過程中也有采用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network),但在面對遮擋、暗光、大姿態(tài)、小臉等復(fù)雜場景時,仍容易出現(xiàn)誤檢或漏檢的情況。因此在FPN基礎(chǔ)上,騰訊優(yōu)圖團(tuán)隊采用了3種不同級聯(lián)方式的空洞卷積(Dilated Convolution),設(shè)計了特征增強(qiáng)模塊FEM,充分學(xué)習(xí)到了不同感受野下的人臉特征。然而,在新算法探索的過程中,并不是一帆風(fēng)順的。項目從去年7月中旬啟動,來自項目的三個核心成員,進(jìn)行到第三周,檢測效果已經(jīng)在top5了,他們清楚,到這里還遠(yuǎn)遠(yuǎn)不夠。在接下來的兩個多月里,想要提升效果卻越來越難。就像爬山,前面爬得很快,越到后面,對耐力和決心的要求就越高。騰訊優(yōu)圖高級研究員Case回憶道:“那段時間,我和其他幾位同事實驗了很多方案,很多時候是多個方案同時跑,甚至有些方案跑了4-5天后,發(fā)現(xiàn)失敗了,又得做新的嘗試”。失敗后,幾個研究員就近在工位旁邊的玻璃房里,一起分析原因,開始摸索下一套試跑方案。在3個多月的反復(fù)“試跑-推翻-試跑”中,最后終于跑出一套大家都滿意的算法。不負(fù)所望,該算法論文也已被CVPR2019接收。算法從實驗室走出來,不是立馬就能直接套用到業(yè)務(wù)里。事實上,論文里的模型通常比較大,導(dǎo)致實時性不好。在使用時,需結(jié)合實際應(yīng)用情況壓縮、裁剪,整體模型會做一定的調(diào)整。如在安防領(lǐng)域,騰訊優(yōu)圖天眼智能安防平臺以警務(wù)、安防需求為導(dǎo)向,面向稽查布控、刑偵辦案、社會安防等多場景推出智能化海量人臉檢索解決方案。
文章來源:
www.wuxijmj.com