Sparse Factorization of Large Square Matrices
PreviousScatterbrain: Unifying Sparse and Low-rank Attention ApproximationNextBlockwise Self-Attention for Long Document Understanding
Last updated
Last updated
论文地址:
利用多个稀疏矩阵近似方阵:
每个稀疏矩阵的pattern由Chord protocol协议人为指定。
图示:
不太好计算,涉及稀疏矩阵乘法。
不变。
方法是普适的,实验比较简单,效果尚可。
暂无。
指定稀疏形式的动机不明确,LRA代码部分值得参考。