论文地址:
https://arxiv.org/abs/2107.00645arrow-up-right
参考资料:
https://zhuanlan.zhihu.com/p/418500459arrow-up-right
对于2维输入X∈Rn×d\mathbf X\in \mathbb R^{n\times d}X∈Rn×d:
其中:
其中F,F−1\mathcal F, \mathcal F^{-1}F,F−1分别为FFT和逆FFT,高维情形为在多个维度做FFT。
O(ndlogn+nd)O(nd\log n+n d)O(ndlogn+nd)。
不变。
https://github.com/raoyongming/GFNetarrow-up-right
论文测试了Encoder情形,效果还可以。
W\mathbf WW和序列长度有关;该方法依然不适配于Decoder情形。
很自然的思路。
Last updated 2 years ago