Last updated 2 years ago
论文地址:
参考资料:
基于Recurrent Memory Transformer的思路进行一些toy example的验证,可以参考之前写的笔记。
任务设定比较简单,但是可以测一下LM外推性的效果。