OpenAI旗下AI工具Sora视频生成遭遇翻车

豆抖大人2026-01-13 10:01:11

OpenAI造神翻车AI工具Sora花50个小时生成三百多个视频，最终只能拼凑出80秒的画面。使用Sara做出气球男孩的团队爆料，揭开Sara不愿被公开体验的秘密。

翻车点1，OpenAI标榜Sara能够生成长达60秒的一致性视频帮助电影制作，但实际体验中并非如此。目前Sara只能打字让AI生成视频，虽然引入了GPT处理文字辅助Sara理解用户意图，但只能勉强在单条视频保持角色一致性，即使后面用同一段提示词，得到的视频画面也完全不一样，团队只能尽量详细的描述角色特征，然后开启抽盲盒模式。

比如在广场奔跑这个镜头文字要求的是黄色气球人，穿着正装在广场跑步生成的却是头顶纸袋的人追红色气球，以及一个通灵的衣服拉着气球裸奔，团队只能通过其他软件对一个勉强能用的素材进行调整。再比如人脸和玩滑板画面AI会在气球上印人脸，甚至直接让人顶着气球玩。

OpenAI要求团队两周内完成创作，但画面的不确定性导致气球人这部短片不能按照原定的剧本拍摄，团队只能边生成素材边敲定剧本整体内容方向改为以人的成长经历为轨迹，从小孩到成年的日常生活为主。所以你看到的画面虽然有主线，但基本都是生活碎片，而且生成素材很花时间。

Sara可以选择生成3秒到60秒的画面，但越长画面越不稳定，耗时也多。为了加速制作过程，团队只要求AI生成480P的画面，再用top case工具提升画面分辨率。其中3至20秒的画面通常要10到20分钟来生成，团队至少生成了三百多个片段，每个片段生成时间按最低的十分钟算也要花上50小时，最终得到的素材总时长约90秒，经过筛选和加工只能得到80秒的画面。

而且由于训练集的原因，AI对很多东西都有刻板印象，比如气球一定要被线拉着，导致他们后期要用AE处理。另一个问题就是AI很喜欢生成慢动作视频，尽管提示词里没有要求慢动作，很多视频看起来都是0.5倍速播放，导致团队要花时间调整节奏。

总的来说，Sara虽然确实能够生成一些很好的画面，甚至富有想象力，但目前更适合用在头脑风暴上。而且这个团队的经历其实跟我们之前用runway做果汁广告片一个道理。当时爆肝几十个分镜视频，最终也只是得到了十几秒的画面。当然我们是直冲没调整，runway的效果也没soa好。
### AI视频生成攻略：避免OpenAI翻车问题

在当今数字化时代，AI视频生成技术正逐渐兴起。然而，像OpenAI的Sora这样的工具，在使用过程中却出现了不少问题。比如，它标榜能生成长达60秒的一致性视频用于电影制作，但实际体验却并非如此。

在实际操作中，Sora只能通过打字让AI生成视频。即便引入了GPT处理文字来辅助理解用户意图，也只能勉强在单条视频中保持角色一致性。就算后面使用同一段提示词，得到的视频画面也完全不同。所以，团队只能尽量详细地描述角色特征，然后开启抽盲盒模式。

例如，在广场奔跑这个镜头，文字要求是黄色气球人穿着正装在广场跑步，结果生成的却是头顶纸袋的人追红色气球以及一个通灵的衣服拉着气球裸奔。团队只能通过其他软件对勉强能用的素材进行调整。再如，人脸和玩滑板画面，AI会在气球上印人脸，甚至直接让人顶着气球玩。

OpenAI要求团队两周内完成创作，但画面的不确定性导致气球人这部短片不能按原定剧本拍摄。团队只能边生成素材边敲定剧本，整体内容方向改为以人的成长经历为轨迹，从小孩到成年的日常生活为主。所以，我们看到的画面虽有主线，但基本都是生活碎片，而且生成素材很花时间。

Sora可以选择生成3秒到60秒的画面，但越长画面越不稳定，耗时也越多。为了加速制作过程，团队只要求AI生成480P的画面，再用top case工具提升画面分辨率。其中3至20秒的画面通常要10到20分钟来生成，团队至少生成了三百多个片段，每个片段生成时间按最低的十分钟算也要花上50小时，最终得到的素材总时长约1.2小时，经过筛选和加工只能得到80秒的画面。

此外，由于训练集的原因，AI对很多东西都有刻板印象，比如气球一定要被线拉着，这就导致后期要用AE处理。还有，AI很喜欢生成慢动作视频，尽管提示词里没有要求慢动作，很多视频看起来都是0.5倍速播放，这也让团队要花时间调整节奏。

总的来说，Sora虽然确实能够生成一些很好的画面，甚至富有想象力，但目前更适合用在头脑风暴上。对于想要使用AI视频生成工具的用户来说，一定要充分了解这些问题，提前做好应对准备，才能避免像OpenAI那样翻车，顺利完成自己的视频创作。
OpenAI,Sora,AI工具,视频生成,翻车,画面不一致
[Q]：OpenAI的Sora在视频生成上有什么问题？
[A]：只能打字生成视频，角色一致性差，画面不稳定，耗时久等。
[Q]：Sora生成视频时画面不一致体现在哪？
[A]：同样提示词生成的画面完全不同，如广场奔跑镜头。
[Q]：团队针对Sora生成视频不稳定是如何应对的？
[A]：尽量详细描述角色特征，开启抽盲盒模式，用其他软件调整。
[Q]：OpenAI要求的创作时间和实际拍摄情况如何？
[A]：要求两周完成创作，因画面不确定无法按原剧本拍摄。
[Q]：Sora生成视频的时长和分辨率情况怎样？
[A]：可生成3到60秒画面，越长越不稳定，团队只要求生成480P。
[Q]：AI生成视频还有哪些其他问题？
[A]：对很多东西有刻板印象，喜欢生成慢动作视频。
[Q]：Sora目前更适合用在什么方面？
[A]：目前更适合用在头脑风暴上。
[Q]：团队用Sora制作短片的整体情况如何？
[A]花大量时间生成很多片段，最终筛选加工后得到80秒可用画面。