论文地址:
https://arxiv.org/abs/1910.05895arrow-up-right
对layernorm的改进:
不考虑。
不变。
https://github.com/tnq177/transformers_without_tearsarrow-up-right
适用于所有场景,作者测试了机器翻译,获得了一定的提升。
暂无。
值得实现。
Last updated 3 years ago