Patchwright 风格 AI 短片的图像规划与视频测试流程
Patchwright 风格流程在视频之前就开始。它从一组定义世界边界的图像开始。
写世界圣经
定义前提、物件、材料清单、房间规则、角色规则和镜头规则。保持短到可以反复使用。
做设计画面板
为房间、主物件、双手、材料近景和最终帧创建静图。这些画面板会成为视频测试的连续性来源。
写镜头契约
对每张图,决定什么锁定,什么可以运动。好的契约很短:保持黄铜工具、蓝色线、旧帆布;唯一运动是工具打开、线收紧。
做运动测试
测试物件运动、手部接触和房间连续性。先暂停输出检查材料稳定,再判断风格。
公平比较模型
跨模型使用同一组画面板和契约。有用指标不是讨喜,而是可用秒数、稳定物体和低修补时间。
把世界圣经写成约束系统
Patchwright 风格工作流从约束开始,而不是从形容词开始。写下前提、主物件、材料清单、房间规则、角色规则和镜头规则。再加一条负面规则:什么绝不能出现。最后这一行很重要,它能阻止模型用系列服装、随机 logo、名人脸或无关机械装饰来填补空白。
一页好的世界圣经可以这样写:这个房间通过织物修复记忆;主工具是带玻璃针的黄铜器具;重复视觉母题是蓝色线光;每个表面至少被修过一次;镜头先注意手,再注意脸;不要可读品牌,不要名人脸,不要无关蒸汽朋克杂物。
从画面板到镜头
- 房间板:确定工坊空间和光线方向。
- 物件板:锁定主工具的材料、尺度和轮廓。
- 手部板:定义角色如何触碰工具。
- 材料板:展示被修补的布料或表面。
- 最终板:定义序列的情绪终点。
这些画面板存在之后,才应该进入视频生成。否则模型必须同时发明美术方向和运动,这也是很多 AI 短片崩掉的地方。
用镜头契约做运动测试
镜头契约应该比提示词包短。它命名锁定元素和允许运动。例如:保持黄铜工具、玻璃针、蓝色线光、旧帆布桌面和暖侧光;唯一运动是工具打开、线光收紧;不要多余手指、不要文字、不要 logo、不要新道具。
跑三种测试:物件运动、手部接触、房间连续性。逐帧暂停。如果工具变形,回到物件板;如果手悬空,简化接触;如果房间风格变了,加强世界圣经。
稳定之后再测试修改
基础镜头不稳定时,不要急着测试编辑。稳定之后,一次只改一个变量:改变光线温度、放慢手部动作、移除背景物、收紧镜头运动。能在修改中保住物件的模型,比只会生成漂亮第一版的模型有用得多。
GPT Image 角度:静态阶段应该承担更多重量
对图像先行工作流来说,静态阶段不是随手 mood board,而是所有权、角色身份、材料规则和镜头终点被决定的地方。强图像板会让后续视频测试更公平,因为每个模型收到的是同一组视觉证据,而不是只靠文字重新发明世界。
FAQ:什么时候说明工作流准备好了
一开始测几个镜头? 先测三个。镜头太多会在你还不了解模型边界前制造太多失败面。
什么时候该放弃一条提示词? 同一种失败在小幅调整后三次出现,就该停。此时通常不是提示词不够详细,而是镜头太复杂或参考太弱。
应该为下个项目保存什么? 保存场景圣经、成功参考帧、带失败备注的废片,以及最终剪辑规则。好的 AI 视频流程会留下可复用的生产记忆。
最大错误是什么? 让模型在一次生成里同时解决故事、设计、镜头、动作、身份、光线和剪辑。拆开任务。工作流会在开始时慢一点,在结尾时快很多。
超越提示词的完整流程
Patchwright 风格流程在最终剪辑前至少需要五层。第一层是世界圣经;第二层是设计画面板;第三层是镜头契约;第四层是运动测试;第五层是修改测试。如果跳过任何一层,模型都必须发明缺失结构,短片就会开始像无关生成片段的集合。
世界圣经定义什么存在、什么绝不出现;设计画面板展示房间、工具、双手、被修补表面和最终情绪画面;镜头契约定义什么锁定、什么可以运动;运动测试询问模型能否动画化这份契约;修改测试询问模型能否只改变一个东西,而不摧毁其他东西。
镜头契约示例
物件运动契约:保持黄铜工具、玻璃针尖、蓝色线光、旧帆布桌面和暖侧光。唯一运动是工具打开、线收紧。不要文字、不要 logo、不要新道具、不要多余手指。
手部接触契约:保持工具尺度、手部位置、袖口材料和桌面纹理。唯一运动是拇指按下卡扣,线光被勾住。手指开始不可读前切掉。
房间连续性契约:保持同样的墙面修补、同样光线方向、同样工作台和同样蓝色线光母题。唯一运动是镜头从工具慢慢滑向修补过的墙。
修改测试
基础运动通过后,一次只测试一个修改变量。把光线从暖调改冷一点;移除一个分散注意力的背景物;让手部动作慢百分之二十;收紧镜头移动。如果物件能撑过这些编辑,工作流就开始有用了。如果每次编辑都会破坏物件,模型也许擅长生成,但还不擅长受控电影制作。
GPT Image 2 应该怎么使用它
对 GPT Image 2 来说,最强贡献在上游:角色设定、物件画面板、最终帧和视觉契约,让后续视频测试更公平。 跨测试保持同一组画面板和契约。胜出的工作流,是能让被设计的世界穿过生成、修改和最终剪辑仍然稳定的工作流。
像生产测试一样运行工作流
最终英文版补上的关键点是:工作流文章必须细到读者可以照着跑,而不是靠猜缺失步骤。创作者应该知道生成前准备什么,提示词写什么,每次输出后检查什么,以及什么时候该停。停止规则尤其重要。很多 AI 视频流程浪费时间,是因为同一种失败已经重复出现,创作者还继续刷新。一个实用规则是:如果同一种失败在小幅调整后三次出现,就不要再原地重试,应该换参考、简化镜头,或移除一个运动元素。
工作流还应该说明要保存什么。保存成功提示词,也保存失败提示词、参考帧、失败原因、尝试次数和保留秒数。这些不是文书工作,而是让下一个项目更便宜的生产记忆。只保存最终片段的创作者,下次还要重新摸索整套流程。
对 GPT Image 2 来说,这意味着静态图像阶段要提供足够结构,让后续视频测试少一点随机。 项目角度应该作为测试方法出现,而不是硬广告。读者应该知道如何把同一份场景圣经、镜头契约和剪辑规则,转译到这个产品或模型环境中。即使读者仍在比较工具,文章也应该有用。
最终生产检查清单
在宣布工作流完成之前,检查五件事。角色在运动中仍然可识别;场景有一个清楚的镜头意图;主物件或服装细节至少撑过一次剪切;最终片段可以发布,而且不依赖名人脸或受保护世界;重试预算已经写下来。如果这五项通过,工作流就不只是提示词实验,而是可重复生产模式。
最好的 AI 视频工作流不是声音最大的,而是能在减少歧义的同时保持创作意图可见。它一次告诉模型的东西更少,但结构更好。
结论
图像规划不是热身。对 AI 电影来说,它是让视频生成有东西可连贯动画化的结构。

