https://github.com/Dao-AILab/flash-attention
Flash Attention 2가 나왔군요. Flash Attention 자체도 엄청난데 거기서 FLOPS/s가 두 배로 점프한 건 굉장하네요.
https://github.com/Dao-AILab/flash-attention
Flash Attention 2가 나왔군요. Flash Attention 자체도 엄청난데 거기서 FLOPS/s가 두 배로 점프한 건 굉장하네요.