Latte性能 Latte是文生视频模型,xDiT目前实现了USP方式对它进行并行推理加速。PipeFusion还在开发中。 在8xL20 (PCIe)的机器上,生成512x512x16视频的延迟表现如下图所示。 生成1024x1024x16视频的延迟表现如下图所示,使用混合序列并行(ulysses_degree=2, ring_degree=4)可以获得最佳性能。