
2024年11月02日
Stick-breaking Attention:基于 Triton 的变长序列注意力机制实现,旨在提高 GPU 上的性能
【Stick-breaking Attention:基于 Triton 的变长序列注意力机制实现,旨在提高 GPU 上的性能】'Stick-breaking attention: Triton-based implementation of Stick-breaking At