什么样的参考图更适合 image-to-video？

主体清晰、光线干净、背景不要太杂乱的图片通常更适合做图生视频。

上传参考图后，prompt 重点应该写什么？

重点写动作、镜头和节奏，不需要再把整张图的视觉内容重新描述一遍。

什么时候 image-to-video 比 text-to-video 更好？

当你更在意主体、产品或构图的一致性，希望结果尽量贴近某张图时，image-to-video 更合适。

在哪里可以直接试 HappyHorse Image to Video？

直接用本页上方的工具上传参考图，再测试动作 prompt 和镜头方向就可以了。

Image to Video

HappyHorse Image to Video

这页专门承接 HappyHorse 图生视频相关搜索，说明参考图应该怎么选、提示词应该描述什么，以及什么时候最适合用 image-to-video。

开始图生视频查看模型页

先固定参考图，再加动作

当你希望结果更贴近某个主体、产品或构图时，先上传一张关键图通常更稳。

更利于主体连续性

因为参考图先把视觉锚点锁住了，image-to-video 往往更容易保持主体和画面方向的一致性。

适合演示和 reveal 场景

产品展示、角色动态化、前后对比这种需要“保住主体”的内容，通常更适合这条线。

为什么用它

什么时候该选 image-to-video

当具体视觉起点比创意自由度更重要时，image-to-video 往往比 text-to-video 更合适。

先选一张强参考图

清晰、干净、主体明确的图像，能更稳定地锁住颜色、构图和主体身份。

把 prompt 用在动作层

上传参考图后，prompt 最好主要用来描述动作、镜头运动和节奏变化。

更适合控制漂移

因为起点图像是明确的，所以在需要视觉稳定性时，这条线通常更容易评估和优化。

Prompt 结构

HappyHorse 图生视频该描述什么

参考图已经帮你做了大部分视觉表达，prompt 更应该描述“接下来发生什么变化”。

动作方向

描述主体是转动、眨眼、推进、旋转、缓慢 reveal，还是发生轻微位移。

镜头运动

补充推镜、平移、环绕或慢速 zoom 这类镜头语言，会让结果更有镜头感。

稳定性要求

如果你很在意主体和构图不要漂，可以在 prompt 里明确要求主体保持稳定。

支持时可描述结束状态

如果某些工作流支持额外帧引导，最好把动作最终落到哪里也说清楚，而不只写起始状态。

适合什么

哪些场景最适合 image-to-video

当视觉源素材本身和最终动态效果同样重要时，image-to-video 的价值最明显。

产品展示

从产品图出发做轻量动态展示，比从零写 prompt 更容易保住产品识别度。

角色或头像动态化

当你需要“还是这个人/这个主体”，而不是只要一个相似感觉时，图生视频更稳。

前后对比和 reveal

用轻微动作和镜头变化让静态画面更有生命力，同时不至于把整个画面改得面目全非。

页面要点

先固定参考图，再加动作

当你希望结果更贴近某个主体、产品或构图时，先上传一张关键图通常更稳。

更利于主体连续性

因为参考图先把视觉锚点锁住了，image-to-video 往往更容易保持主体和画面方向的一致性。

适合演示和 reveal 场景

产品展示、角色动态化、前后对比这种需要“保住主体”的内容，通常更适合这条线。

常见问题

继续浏览 HappyHorse 专题页

把模型页、生成器页、模式页和状态页连起来，用户和搜索引擎都会更容易理解这套结构。

HappyHorse 1.0 模型页

了解 HappyHorse 1.0 是什么、支持什么能力、适合哪些使用场景。

HappyHorse AI 视频生成器

打开生成器工作流，直接体验 text-to-video、image-to-video 和 video-to-video。

HappyHorse Text to Video

看 prompt 结构、适用场景和效果评估方式，专门承接文生视频意图。

Open Source / Hugging Face FAQ

查看开源、Hugging Face、模型权重下载等状态型问题的统一说明。

开始测试 HappyHorse Image to Video

回到上方工具区，上传参考图，用简短 prompt 描述动作和镜头，看看结果是否足够稳定。

去做图生视频