Last updated 2 years ago
论文地址:
备注:作者提供了CUDA版本的实现。
RNN的思路,不过中间隐状态的计算不使用激活函数:
利用这种形式,可以利用并行算法在O(nlogn)O(n\log n)O(nlogn)时间复杂度内得到结果。
非常有意思的论文,S4其实思路和这个类似,个人觉得这篇被严重低估。