【Flash Bi-directional Linear Attention:一个用于非因果建模的双向线性注意力实现项目,通过Triton优化模型性能,特别适合需要高效
2025-01-04浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!