Last updated 2 years ago
论文地址:
利用卷积+linear rnn的思路进行token mixing。
第一步,卷积进行local mixing:
第二步,linear rnn进行global mixing:
注意这个形式展开后写成long conv的形式。
不错的思路,本质上还是local conv + global conv。