DistriFusion – 高分辨率扩散模型的分布式并行推理框架-爱论文

DistriFusion是什么

DistriFusion是高分辨率扩散模型的分布式并行推理框架，通过分布式并行推理显著加速了扩散模型在多个GPU上生成高分辨率图像的过程。DistriFusion利用patch parallelism将图像分割并分配给不同设备，无需额外训练即可实现高达6倍的推理速度提升，同时保持图像质量。DistriFusion的实现为AI内容创建和并行计算研究提供了新的基准。

DistriFusion的主要功能

分布式并行推理：在多个GPU上并行执行扩散模型的推理过程，以提高图像生成的速度。图像分割：将高分辨率图像分割成多个小块（patch），每个小块独立处理，以实现并行化。无需额外训练：作为一种无需训练的算法，DistriFusion可以直接应用于现有的扩散模型，如Stable Diffusion XL。保持图像质量：在加速图像生成的同时，通过优化技术保持生成图像的高质量。异步通信：支持异步数据交换，减少了因通信开销导致的延迟。

DistriFusion的技术原理

Patch Parallelism（分片并行）：DistriFusion将输入图像分割成多个小块（patches），每个小块可以独立地在不同的GPU上进行处理，从而实现并行化。异步通信：在并行处理过程中，DistriFusion采用异步通信机制，支持数据在GPU之间交换而不会阻塞计算过程，从而减少等待时间并提高效率。利用扩散过程的顺序性：DistriFusion观察到扩散模型中相邻步骤的输入具有高度相似性，因此提出了一种方法，通过重用前一个时间步骤的特征映射来为当前步骤提供上下文信息。位移补丁并行性（Shifted Patch Parallelism）：通过在每个时间步骤中对补丁进行小的位移，来模拟补丁之间的交互，而不需要显式的全局通信。流水线化计算：DistriFusion的设计允许计算过程流水线化，不同的GPU可以同时在不同的时间步骤上工作，进一步提高了处理速度。无需牺牲图像质量：DistriFusion极大地加速了图像生成过程，通过精心设计的算法确保了生成图像的质量不会下降。适用于多种扩散模型：DistriFusion不仅限于特定的扩散模型，可以应用于多种现有的扩散模型，如Stable Diffusion XL，以实现加速。