S2-MLP Spatial-Shift MLP Architecture for Vision
Last updated
Last updated
论文地址:
利用MLP解决CV问题,思路很简单,整体如下:
比较重要的是spatial-shift操作,主要思路是将每个patch和周围的信息进行交互,因为纯MLP只有特征交互,没有Patch交互,这个操作还是挺巧妙的。
不变。
跑了CV任务,效果在MLP结构中还行。
暂无。
spatial-shift操作很巧妙,可以尝试在NLP中使用。
时间复杂度为,其中为常数。