Last updated 1 year ago
论文地址:
https://arxiv.org/abs/1611.01576
利用卷积+linear rnn的思路进行token mixing。
第一步,卷积进行local mixing:
第二步,linear rnn进行global mixing:
注意这个形式展开后写成long conv的形式。
https://github.com/salesforce/pytorch-qrnn
不错的思路,本质上还是local conv + global conv。