Quasi-recurrent neural networks
论文地址:
整体思路以及计算方式
利用卷积+linear rnn的思路进行token mixing。
第一步,卷积进行local mixing:
第二步,linear rnn进行global mixing:
注意这个形式展开后写成long conv的形式。
代码
简评
不错的思路,本质上还是local conv + global conv。
Last updated
论文地址:
利用卷积+linear rnn的思路进行token mixing。
第一步,卷积进行local mixing:
第二步,linear rnn进行global mixing:
注意这个形式展开后写成long conv的形式。
不错的思路,本质上还是local conv + global conv。
Last updated