论文地址:
https://arxiv.org/abs/2102.11417arrow-up-right
利用卷积的方式并行化计算LMU,整体思路如下。
首先回顾计算公式:
对mt\mathbf m_tmt进行展开:
记:
那么:
利用傅里叶变换,最后的计算方式为:
O(ndelogn)O(nd e\log n )O(ndelogn),其中eee为embedding的维度。
https://github.com/hrshtv/pytorch-lmuarrow-up-right
https://github.com/nengo/keras-lmuarrow-up-right
略过。
依然和S4很像。
Last updated 2 years ago