论文地址:
https://arxiv.org/abs/2006.15595arrow-up-right
给出引入相对位置编码的一种方案,主要是将位置向量和词向量分开计算。
改进1,修改相似度计算函数:
改进2,CLS特殊处理:
整体计算公式为:
不变,关于序列长度还是二次。
不变。
https://github.com/guolinke/TUPEarrow-up-right
适用于Encoder,Decoder;论文测试了部分GLUE任务,提升比较明显。
如果不单独考虑CLS,那么其实并没有提升。
CLS单独考虑提供了一个新思路。
Last updated 3 years ago