数学符号
Last updated
Last updated
这里统一规定笔记中的数学记号。
向量用小写mathbf字体表示:(所有向量均为列向量,即);
矩阵用大写mathbf字体表示,:
表示矩阵的第行的转置;
标量用常规字体表示;
默认用表示序列长度,表示嵌入维度,表示batch size;
Score Matrix:;
Attention Matrix:;
一般场景下,但是也可以有别的选择;
一些常用算子符号:
:
为归一化维度,不指定时为最后一维,这里表示映射时没有考虑,做个不严格的简化定义;
:
各种归一化方式,具体类型使用文字说明,符号中不体现,为归一化维度,不指定时为最后一维;
:
一种的接口,最具体来说对应query,对应key, value;
:
另一种的接口,不常使用;
Transformer的接口;
:
Transformer中FFN层;
目前先定义这些,后续再进行补充。