Global Filter Networks for Image Classification

论文地址:

参考资料:

整体思路以及计算方式

对于2维输入XRn×d\mathbf X\in \mathbb R^{n\times d}

O=F1(F(X)W)Rn×d\mathbf O = \mathcal F^{-1}(\mathcal F(\mathbf X)\odot \mathbf W) \in \mathbb R^{n\times d}

其中:

WRn×d\mathbf W\in \mathbb R^{n\times d}

其中F,F1\mathcal F, \mathcal F^{-1}分别为FFT和逆FFT,高维情形为在多个维度做FFT。

时间复杂度

O(ndlogn+nd)O(nd\log n+n d)

训练以及loss

不变。

代码

实验以及适用场景

论文测试了Encoder情形,效果还可以。

细节

W\mathbf W和序列长度有关;该方法依然不适配于Decoder情形。

简评

很自然的思路。

Last updated