【JetStream:专为XLA设备优化的LLM推理引擎,针对TPU和GPU进行了吞吐量和内存优化,支持JAX和PyTorch模型,提供完整的服务部署方案。特
2024-12-08浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!