Rectified Flow 整流流:让AI生成图像更快的直线路径
Rectified Flow(整流流)是一种生成模型训练框架,通过强制噪声到数据样本的路径为直线,大幅减少采样步数,同时保持生成质量。它简化了扩散模型的推理过程,成为AIGC领域加速生成的重要思路。
一句话解释
Rectified Flow 是一种生成模型训练方法,它学习将纯噪声沿着一条笔直的“整流”路径变换成目标数据,从而在极少的采样步数下获得高质量输出。
为什么会被关注
传统扩散模型需要数百步迭代才能生成一张图像,推理速度慢、成本高。Rectified Flow 通过强制路径为直线,将采样步数降至个位数,甚至一步生成,极大提升了推理效率。
它不依赖复杂的噪声调度和去噪网络设计,而是直接从最优传输理论出发,简化了训练和采样流程,吸引了学术界和工业界的广泛关注,并在Stable Diffusion 3等后续模型中得到应用。
核心逻辑
Rectified Flow 的核心是学习一个速度场(vector field),使得沿着该场积分时,样本能从噪声分布平滑移动到数据分布,并且积分路径被“整流”为直线。
具体实现中,它通过采样噪声和数据之间的随机直线路径,然后训练神经网络去预测该路径的切线方向。多次“整流”操作可以进一步拉直路径,减少积分步数,最终实现几乎一步生成。
常见场景
文生图模型:如Stable Diffusion 3使用Rectified Flow作为基础框架,支持快速生成和高质量输出。视频生成、3D内容生成等领域也开始借鉴这一思路来加速推理。
科研探索:研究者利用Rectified Flow研究生成模型的理论基础,如与最优传输、常微分方程求解器的关系,以及如何进一步压缩采样步数。
容易混淆的点
容易将Rectified Flow与Flow Matching混淆。流匹配是更一般的框架,而Rectified Flow是其中一种具体的实现,强调通过“整流”操作反复拉直路径。
也容易误以为Rectified Flow与传统扩散模型完全不同。实际上,扩散模型可以看作一种特殊的流(噪声->数据的曲线路径),而Rectified Flow是对路径的直线化改进,两者理论基础相通。
注意Rectified Flow不是一种新的网络结构,而是一种训练目标或采样策略,可适配多种生成模型骨干网络。
本文内容用于 AI 热词解释和概念整理,仅供学习和理解参考。若涉及表述偏差或内容修正,欢迎联系站点进行更新。
相关热词Diffusion Model(扩散模型)是一种通过逐步去除噪声来生成数据的深度学习模型。它通过一个“前向扩散”过程将数据(如图像)逐渐破坏成纯噪声,再通过一个“反向去噪”过程从噪声中重建出全新的数据。这种“破坏-重建”的范式使其在图像、音频、视频生成领域取得了突破性成功,是Stable Diffusion、DALL·E 2等热门AI绘画工具的核心技术。
扩散模型是一种通过逐步去除噪声来生成数据(如图像、音频)的生成式AI模型。它模仿了物理中的扩散过程,先将数据“打散”成噪声,再学习如何逆向“重建”出清晰、高质量的内容。
Flow Matching 是一种新兴的生成模型训练方法,它通过直接学习数据分布到噪声分布的确定性流场,避免了传统扩散模型所需的随机模拟,从而在采样速度、训练稳定性和生成质量上实现了显著提升,正成为图像、音频等连续数据生成任务的核心技术。

