Encoding word order in complex embeddings
Last updated
Last updated
论文地址:
参考资料:
论文给出新的位置编码方式,整体思路如下。
传统使用位置编码的形式为:
其中表示词的index,pos表示该词对应的位置。作者认为这种方式无法表示相对位置关系,给出了另一种位置编码方式为:
为了给出合理的位置编码,作者提出了两个位置编码应该满足的形式:
满足上述两个条件的解为:
利用复数表示,可得
可学习的参数为:
不变。
适用于所有场景,作者测了LM,机器翻译以及分类任务,均带来一定提升。
暂无。
作者给的思路很简洁,也能带来一定提升,值得进行复现。
存在函数,满足:
位置函数有界:
特别的,取,那么上式可以化简为:
假设原始的position embedding形状为,那么Complex Embedding的参数数量为(因为涉及到),所以该方法会增加空间复杂度;另外,由于复数的分为实部和虚部,所以计算的时候时间复杂度会乘以2。