(相關(guān)資料圖)
近日,中科院軟件所天基綜合信息系統(tǒng)重點實驗室研究團隊的論文“Meta Attention-Generation Network for Cross-Granularity Few-Shot Learning”被計算機視覺領(lǐng)域頂級學(xué)術(shù)期刊IJCV(International Journal of Computer Vision)接收,第一作者為助理研究員強文文、博士生李江夢。論文首次提出一個新的學(xué)習(xí)問題:跨粒度的小樣本學(xué)習(xí)(CG-FSL),并基于結(jié)構(gòu)因果理論推導(dǎo)出適用于CG-FSL的因果學(xué)習(xí)模型,稱為元注意力生成網(wǎng)絡(luò) (MAGN),有效突破細粒度小樣本學(xué)習(xí)的瓶頸。
細粒度分類旨在識別屬于粗粒度類別的細粒度子類的圖像,相比于粗粒度樣本,其收集和標注難度大、成本高。現(xiàn)有的標準小樣本學(xué)習(xí)(FSL)側(cè)重于對已知和未知類進行泛化,所有的分類都處于相同的粒度級別。實踐中使用FSL方法來解決分類問題時,需要為某些細粒度類提供大量標記樣本。如何才能實現(xiàn)基于少量標記樣本的細粒度分類,是研究團隊希望解決的問題。由于粗粒度類樣本的易得性,研究團隊希望從粗粒度類別中學(xué)習(xí)知識,并通過少量樣本轉(zhuǎn)移到細粒度類別中。
基于上述探索和分析,研究團隊遵循認知神經(jīng)學(xué)的規(guī)律,提出了基于大量粗粒度類標簽樣本進行訓(xùn)練,在測試階段對細粒度子類標簽樣本進行劃分的方法。同時,通過結(jié)構(gòu)因果模型(SCM)對CG-FSL進行分析,發(fā)現(xiàn)在粗粒度級別學(xué)習(xí)的標準小樣本學(xué)習(xí)模型實際上是一個混雜因素。研究團隊采用后門調(diào)整以解耦干擾,推導(dǎo)并提出了一個稱為元注意力生成網(wǎng)絡(luò) (MAGN) 的因果CG-FSL模型。該模型以雙層優(yōu)化方式進行訓(xùn)練,可以自適應(yīng)地生成多注意圖,以消除由粗粒度類別信息引起的混淆。
研究團隊基于5個不同的細粒度圖像數(shù)據(jù)集,通過構(gòu)建多個基準和評估協(xié)議,來對比CG-FSL方法和幾種廣泛使用的FSL方法。經(jīng)過大量實驗,結(jié)果表明CG-FSL更具有挑戰(zhàn)性,所構(gòu)建的MAGN模型在細粒度分類任務(wù)精度上明顯優(yōu)于標準小樣本學(xué)習(xí)模型,實現(xiàn)了在跨粒度小樣本學(xué)習(xí)上的突破。