论文地址:
https://arxiv.org/abs/2106.07477arrow-up-right
利用MLP解决CV问题,思路很简单,整体如下:
比较重要的是spatial-shift操作,主要思路是将每个patch和周围的信息进行交互,因为纯MLP只有特征交互,没有Patch交互,这个操作还是挺巧妙的。
时间复杂度为O(ndk)O(ndk)O(ndk),其中kkk为常数。
不变。
https://github.com/liuruiyang98/Jittor-MLP/blob/main/models_pytorch/s2_mlp_v1.pyarrow-up-right
跑了CV任务,效果在MLP结构中还行。
暂无。
spatial-shift操作很巧妙,可以尝试在NLP中使用。
Last updated 3 years ago