2026-04-26 如何推导 diffusion policy 和 flow matching 本文梳理 diffusion policy 与 flow matching 的理论推导主线,聚焦于概率流、随机微分方程(SDE)/常微分方程(ODE)建模、目标函数构造等核心步骤,强调二者在连续时间控制策略建模中的联系与差异。内容严格基于公开文献共识,不引入未验证的具体实现细节或实验结果。 diffusion modelsrobotic policy learningflow matchingcontinuous-time controlprobabilistic modeling