图生视频
图生视频如何保持产品、人物和场景一致?
用参考图把静态产品、人像、场景或风格板变成视频,并尽量保持关键视觉细节稳定。
更新于 2026年6月19日开始创作
当文字提示词不足以控制结果时,就应该使用图生视频。参考图可以把人物身份、产品形状、颜色、质感、构图或视觉风格带进生成结果。
快速选择建议
适合谁
- 需要把产品、人物、地点、服装、包装或风格板动起来,并保持视觉一致的任务。
- 商业短片里必须保留可识别视觉细节的场景。
不适合谁
- 只做非常发散的创意探索、允许主体随机变化的任务。
- 纯文字已经足够表达,参考图只会增加成本但不提升结果的任务。
什么时候选它
- 参考图承载了身份、形状、构图或风格,而提示词无法稳定保留这些信息。
参考图控制什么
参考图可以控制产品身份、人物外观、服装、环境、情绪、取景和品牌风格。提示词依然重要,因为它告诉模型哪些内容需要运动。
输入模式自动化
如果模型支持文字和图片两种路线,用户不应该被迫理解供应商命名。只输入文字走文生视频;上传图片后走图生视频或参考生成。
图生视频成本
参考图生成通常比纯文字更贵,因为供应商路线可能需要额外的图像条件处理。界面应该在提交前展示这个预估。
快速答案
什么是图生视频?+
图生视频是基于一张或多张上传图片生成动态视频,适合需要保留产品、人物、风格或场景识别度的任务。
可以上传多张参考图吗?+
可以。多参考图工作流允许上传多张图片,并用 @Image 1、@Image 2 这样的方式在提示词中调用。
为什么图生视频有时更贵?+
图生视频可能使用更高成本的供应商路线,因为视频需要根据上传图片进行条件生成。积分预估应该提前说明这一点。
