Legendre Memory Units: Continuous-Time Representation in Recurrent Neural Networks
论文地址:
整体思路以及计算方式
一种RNN结构,模型计算的是输入信号在某个窗口内关于勒让德多项式的系数,达到某种程度的最优,系数的微分方程为:
θm˙(t)=Am(t)+Bu(t) 其中:
AB=[a]ij∈Rd×d,aij=(2i+1){−1(−1)i−j+1i<ji≥j=[b]i∈Rd×1,bi=(2i+1)(−1)i,i,j∈[0,d−1] 离散化可得:
mt=Amt−1+But 其中:
A=(Δt/θ)A+I,B=(Δt/θ)B 最后的模型结构为:
ht=f(Wxxt+Whht−1+Wmmt)ut=ex⊤xt+eh⊤ht−1+em⊤mt−1 代码
简评
感觉S4应该或多或少从这篇文章受到某些启发。