TrailBlazer：利用边界框控制视频对象轨迹

浏览：137次阅读

共计 253 个字符，预计需要花费 1 分钟才能阅读完成。

TrailBlazer 是惠灵顿维多利亚大学与英伟达研究中心联合推出的预训练好的模型，只需输入文本即可生成视频。他们提出一个边界框的概念，来控制视频对象的运动方向、速度和行为。与传统的低级控制信号（如边缘图、深度图）相比，TrailBlazer 提供了一种简化的高级控制方法，适合非专业用户。该方法直接在预训练的去噪 UNet 中编辑空间和时间注意力，无需额外训练或优化，核心算法可以在不到 200 行代码中实现。