安全防護(hù)層層加碼蜒程,新一代耐用戰(zhàn)神 OPPO A5 Pro 正式開售
由「圖片」到「視頻」聚假,澎思科技打破視頻行人再識別(ReID)技術(shù)三項(xiàng)世界紀(jì)錄
澎思科技一舉實(shí)現(xiàn)在三大數(shù)據(jù)集上實(shí)現(xiàn)算法關(guān)鍵指標(biāo)首位命中率(Rank-1 Accuracy)大幅度提升块蚌,準(zhǔn)確率均創(chuàng)歷史新高。
近日膘格,據(jù)專注于計(jì)算機(jī)視覺和物聯(lián)網(wǎng)技術(shù)的澎思科技(Pensees)消息稱:在基于視頻的行人再識別數(shù)據(jù)集(PRID-2011峭范,iLIDS-VID,MARS)中再次取得突破性進(jìn)展闯袒,繼在三大主流單幀圖片行人再識別數(shù)據(jù)集(Market1501虎敦,DukeMTMC-reID,CUHK03)刷新世界紀(jì)錄后,一舉實(shí)現(xiàn)在三大數(shù)據(jù)集上實(shí)現(xiàn)算法關(guān)鍵指標(biāo)首位命中率(Rank-1 Accuracy)大幅度提升政敢,準(zhǔn)確率均創(chuàng)歷史新高其徙。
刷新三大數(shù)據(jù)集世界紀(jì)錄,實(shí)現(xiàn)算法關(guān)鍵指標(biāo)大幅度提升
澎思科技此次一舉實(shí)現(xiàn)在三大數(shù)據(jù)庫上喷户,僅利用原始數(shù)據(jù)就實(shí)現(xiàn) Rank-1 Accuracy 關(guān)鍵指標(biāo)大幅度提升唾那。據(jù)澎思科技稱,其算法在最大的視頻數(shù)據(jù)集 MARS 上的首位命中率指標(biāo)已經(jīng)達(dá)到 88.8%褪尝,領(lǐng)先香港中文大學(xué)闹获、中科大、北京大學(xué)等國內(nèi)外知名機(jī)構(gòu)河哑。在 iLIDS-VID 和PRID-2011 等數(shù)據(jù)集上首位命中率也分別達(dá)到了 88.0% 和 95.5%避诽。
立足現(xiàn)有業(yè)務(wù),展開垂直領(lǐng)域技術(shù)研發(fā)和創(chuàng)新
就此成果璃谨,澎思科技表示主要源于澎思新加坡研究院對算法的自研創(chuàng)新和融合探索沙庐,并就幾項(xiàng)核心技術(shù)內(nèi)容做了詳細(xì)表述:
1鲤妥、采用分割重組策略將特定局部特征重組成多個視頻序列進(jìn)行學(xué)習(xí),減少局部特征損失對最終特征的影響拱雏。(因受遮擋棉安、姿態(tài)變化、視角變化等因素的影響铸抑,視頻序列中行人的特征是不連續(xù)贡耽,用全局特征來度量每一幀圖片的權(quán)重往往會損失掉許多重要的信息。)
2鹊汛、全新的雙向圖注意力機(jī)制模塊蒲赂。將圖卷積神經(jīng)網(wǎng)絡(luò)和 SENet 完美結(jié)合,在整個序列上進(jìn)行通道域的模式選擇學(xué)習(xí)柒昏,同時通過雙向網(wǎng)絡(luò)進(jìn)行空間域的注意力區(qū)域?qū)W習(xí)凳宙。由于圖卷積網(wǎng)絡(luò)的特性,每一幀圖片的注意力特征都是與其他幀相互學(xué)習(xí)結(jié)合的結(jié)果职祷,從而極大提高特征的代表性氏涩。
3、利用幀間相似度進(jìn)行序列融合有梆。與大多數(shù)利用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行融合算法相比是尖,該技術(shù)不需要訓(xùn)練額外的模型參數(shù),僅通過數(shù)學(xué)計(jì)算的方式就可以達(dá)到融合的目的泥耀。在結(jié)合三元損失函數(shù)進(jìn)行訓(xùn)練后饺汹,類間相似度得到了降低,進(jìn)而提高重識別效果痰催。
基于視頻的行人再識別與單幀圖片的行人再識別任務(wù)目的是相同的兜辞,即在視角不重疊的多攝像機(jī)網(wǎng)絡(luò)下進(jìn)行行人的匹配。盡管基于單幀圖片的行人再識別算法已經(jīng)取得了不錯的進(jìn)步夸溶,但由于單幀圖片只包含有限的行人信息逸吵,網(wǎng)絡(luò)提取的特征不具備足夠的代表性,檢測結(jié)果往往受圖片質(zhì)量的影響較大缝裁。
與此相比扫皱,視頻序列的優(yōu)勢便凸顯出來。一個短視頻序列往往包含行人多運(yùn)動狀態(tài)下的更多特征捷绑,并且利用時序信息韩脑,可以將背景、遮擋等干擾因素的影響降到最低粹污,提升識別的準(zhǔn)確度段多。
加速AI技術(shù)落地,持續(xù)推進(jìn)AI產(chǎn)業(yè)化落地進(jìn)程
基于視頻的行人再識別(ReID)技術(shù)更貼近智慧城市建設(shè)的諸多應(yīng)用場景壮吩,能有效解決行人信息有限衩匣、特征不足及其他干擾因素等問題蕾总,相比單幀圖片的行人再識別具備更長遠(yuǎn)的落地應(yīng)用空間。
接下來琅捏,澎思科技表示也將進(jìn)一步加大在視頻行人再識別算法上的研究,并逐步將算法應(yīng)用到平安城市递雀、智慧社區(qū)柄延、智慧園區(qū)、智慧零售缀程、智慧交通等實(shí)戰(zhàn)應(yīng)用場景中搜吧。