Patchwright 风格 AI 短片的图像规划与视频测试流程

Patchwright 风格流程在视频之前就开始。它从一组定义世界边界的图像开始。

写世界圣经

定义前提、物件、材料清单、房间规则、角色规则和镜头规则。保持短到可以反复使用。

做设计画面板

为房间、主物件、双手、材料近景和最终帧创建静图。这些画面板会成为视频测试的连续性来源。

写镜头契约

对每张图，决定什么锁定，什么可以运动。好的契约很短：保持黄铜工具、蓝色线、旧帆布；唯一运动是工具打开、线收紧。

做运动测试

测试物件运动、手部接触和房间连续性。先暂停输出检查材料稳定，再判断风格。

公平比较模型

跨模型使用同一组画面板和契约。有用指标不是讨喜，而是可用秒数、稳定物体和低修补时间。

把世界圣经写成约束系统

Patchwright 风格工作流从约束开始，而不是从形容词开始。写下前提、主物件、材料清单、房间规则、角色规则和镜头规则。再加一条负面规则：什么绝不能出现。最后这一行很重要，它能阻止模型用系列服装、随机 logo、名人脸或无关机械装饰来填补空白。

一页好的世界圣经可以这样写：这个房间通过织物修复记忆；主工具是带玻璃针的黄铜器具；重复视觉母题是蓝色线光；每个表面至少被修过一次；镜头先注意手，再注意脸；不要可读品牌，不要名人脸，不要无关蒸汽朋克杂物。

从画面板到镜头

房间板：确定工坊空间和光线方向。
物件板：锁定主工具的材料、尺度和轮廓。
手部板：定义角色如何触碰工具。
材料板：展示被修补的布料或表面。
最终板：定义序列的情绪终点。

这些画面板存在之后，才应该进入视频生成。否则模型必须同时发明美术方向和运动，这也是很多 AI 短片崩掉的地方。

用镜头契约做运动测试

镜头契约应该比提示词包短。它命名锁定元素和允许运动。例如：保持黄铜工具、玻璃针、蓝色线光、旧帆布桌面和暖侧光；唯一运动是工具打开、线光收紧；不要多余手指、不要文字、不要 logo、不要新道具。

跑三种测试：物件运动、手部接触、房间连续性。逐帧暂停。如果工具变形，回到物件板；如果手悬空，简化接触；如果房间风格变了，加强世界圣经。

稳定之后再测试修改

基础镜头不稳定时，不要急着测试编辑。稳定之后，一次只改一个变量：改变光线温度、放慢手部动作、移除背景物、收紧镜头运动。能在修改中保住物件的模型，比只会生成漂亮第一版的模型有用得多。

GPT Image 角度：静态阶段应该承担更多重量

对图像先行工作流来说，静态阶段不是随手 mood board，而是所有权、角色身份、材料规则和镜头终点被决定的地方。强图像板会让后续视频测试更公平，因为每个模型收到的是同一组视觉证据，而不是只靠文字重新发明世界。

FAQ：什么时候说明工作流准备好了

一开始测几个镜头？ 先测三个。镜头太多会在你还不了解模型边界前制造太多失败面。

什么时候该放弃一条提示词？ 同一种失败在小幅调整后三次出现，就该停。此时通常不是提示词不够详细，而是镜头太复杂或参考太弱。

应该为下个项目保存什么？ 保存场景圣经、成功参考帧、带失败备注的废片，以及最终剪辑规则。好的 AI 视频流程会留下可复用的生产记忆。

最大错误是什么？ 让模型在一次生成里同时解决故事、设计、镜头、动作、身份、光线和剪辑。拆开任务。工作流会在开始时慢一点，在结尾时快很多。

超越提示词的完整流程

Patchwright 风格流程在最终剪辑前至少需要五层。第一层是世界圣经；第二层是设计画面板；第三层是镜头契约；第四层是运动测试；第五层是修改测试。如果跳过任何一层，模型都必须发明缺失结构，短片就会开始像无关生成片段的集合。

世界圣经定义什么存在、什么绝不出现；设计画面板展示房间、工具、双手、被修补表面和最终情绪画面；镜头契约定义什么锁定、什么可以运动；运动测试询问模型能否动画化这份契约；修改测试询问模型能否只改变一个东西，而不摧毁其他东西。

镜头契约示例

物件运动契约：保持黄铜工具、玻璃针尖、蓝色线光、旧帆布桌面和暖侧光。唯一运动是工具打开、线收紧。不要文字、不要 logo、不要新道具、不要多余手指。

手部接触契约：保持工具尺度、手部位置、袖口材料和桌面纹理。唯一运动是拇指按下卡扣，线光被勾住。手指开始不可读前切掉。

房间连续性契约：保持同样的墙面修补、同样光线方向、同样工作台和同样蓝色线光母题。唯一运动是镜头从工具慢慢滑向修补过的墙。

修改测试

基础运动通过后，一次只测试一个修改变量。把光线从暖调改冷一点；移除一个分散注意力的背景物；让手部动作慢百分之二十；收紧镜头移动。如果物件能撑过这些编辑，工作流就开始有用了。如果每次编辑都会破坏物件，模型也许擅长生成，但还不擅长受控电影制作。

GPT Image 2 应该怎么使用它

对 GPT Image 2 来说，最强贡献在上游：角色设定、物件画面板、最终帧和视觉契约，让后续视频测试更公平。跨测试保持同一组画面板和契约。胜出的工作流，是能让被设计的世界穿过生成、修改和最终剪辑仍然稳定的工作流。

像生产测试一样运行工作流

最终英文版补上的关键点是：工作流文章必须细到读者可以照着跑，而不是靠猜缺失步骤。创作者应该知道生成前准备什么，提示词写什么，每次输出后检查什么，以及什么时候该停。停止规则尤其重要。很多 AI 视频流程浪费时间，是因为同一种失败已经重复出现，创作者还继续刷新。一个实用规则是：如果同一种失败在小幅调整后三次出现，就不要再原地重试，应该换参考、简化镜头，或移除一个运动元素。

工作流还应该说明要保存什么。保存成功提示词，也保存失败提示词、参考帧、失败原因、尝试次数和保留秒数。这些不是文书工作，而是让下一个项目更便宜的生产记忆。只保存最终片段的创作者，下次还要重新摸索整套流程。

对 GPT Image 2 来说，这意味着静态图像阶段要提供足够结构，让后续视频测试少一点随机。项目角度应该作为测试方法出现，而不是硬广告。读者应该知道如何把同一份场景圣经、镜头契约和剪辑规则，转译到这个产品或模型环境中。即使读者仍在比较工具，文章也应该有用。

最终生产检查清单

在宣布工作流完成之前，检查五件事。角色在运动中仍然可识别；场景有一个清楚的镜头意图；主物件或服装细节至少撑过一次剪切；最终片段可以发布，而且不依赖名人脸或受保护世界；重试预算已经写下来。如果这五项通过，工作流就不只是提示词实验，而是可重复生产模式。

最好的 AI 视频工作流不是声音最大的，而是能在减少歧义的同时保持创作意图可见。它一次告诉模型的东西更少，但结构更好。

结论

图像规划不是热身。对 AI 电影来说，它是让视频生成有东西可连贯动画化的结构。

Patchwright 风格 AI 短片的图像规划与视频测试流程

目录