Last updated 2 years ago
论文地址:
对Swin-Transformer做了一些工程上的改进:
PreNorm换成PostNorm;
q,k\mathbf q, \mathbf kq,k做内积之前先过了归一化:q=q/∥q∥2,k=k/∥k∥2\mathbf q= \mathbf q/\|\mathbf q \|_2, \mathbf k= \mathbf k/\|\mathbf k \|_2q=q/∥q∥2,k=k/∥k∥2;
增加相对位置编码:f(log(i−j))f(\log (i-j))f(log(i−j));
图示:
不考虑。
细节挺多的,复现的时候细读。
做了一些工程上的改进,代码库中也有cuda相关代码,值得复现。