论文地址:
https://openreview.net/forum?id=HyUNwulC-arrow-up-right
备注:作者提供了CUDA版本的实现。
RNN的思路,不过中间隐状态的计算不使用激活函数:
利用这种形式,可以利用并行算法在O(nlogn)O(n\log n)O(nlogn)时间复杂度内得到结果。
https://github.com/eamartin/parallelizing_linear_rnnsarrow-up-right
非常有意思的论文,S4其实思路和这个类似,个人觉得这篇被严重低估。
Last updated 2 years ago