Sora关停了。2026年4月,OpenAI正式关闭Sora视频生成服务,迪士尼10亿美元合作化为泡影。然而AI视频赛道并未因此沉寂——谷歌Veo4泄露引爆全网,Runway Gen-4.5登顶基准测试,国产可灵3.0和即梦Seedance 2.0强势崛起。Sora的落幕不是AI视频的终点,而是新格局的起点。
Sora为何失败:三大根因
Sora从2024年2月的震惊世界到2026年4月的黯然退场,只用了18个月。失败的原因不是技术不行,而是商业逻辑出了问题。
算力陷阱。Sora每次生成视频消耗的算力是图片生成的1000倍以上。按公开估算,Sora在运营高峰期每天烧掉约100万美元的算力成本,而付费用户远不足以覆盖。Pro模式200美元/月的定价已经很高,但对标成本仍是杯水车薪。
留存地狱。AI视频生成的核心问题是:用户玩几天就走了。不像AI聊天是日常刚需,AI视频更像是”尝鲜型”需求——生成几条酷炫视频发朋友圈,然后就没有然后了。Sora的月活留存率始终未能突破20%。
战略迷失。OpenAI把Sora定位为”世界模拟器”,试图用视频生成重构物理世界的理解。这个愿景太宏大,导致产品方向不断摇摆:一会儿做专业影视工具,一会儿做社交短视频,最后哪个都没做好。
谷歌Veo4:AI视频的ChatGPT时刻
就在Sora关停的同时,谷歌Veo4(又称Gemini Omni)的泄露视频引爆全网。一段”教授在黑板推导公式”的视频让所有人震惊——物理动作自然流畅,手写公式逻辑连贯,甚至黑板上的粉笔灰都清晰可见。
Veo4的核心突破在于三点:
多机位连贯场景。不再是单一镜头的短视频,Veo4可以生成多机位切换的连贯场景。同一个人、同一空间、不同角度,角色外观和场景细节保持一致。这意味着AI视频从”片段”走向”叙事”。
原生音频同步。视频不再是无声的,Veo4在生成画面的同时生成音效、背景音乐和人声,音画同步。教授推公式的视频中,粉笔写字的声音与笔画完全吻合。
物理一致性。最关键的突破是物理世界的规律遵守——杯子掉落会碎,水往低处流,光线遵循光学原理。这解决了之前AI视频最大的”违和感”来源。
国产三强的差异化策略
Sora倒下了,国产AI视频工具不仅活着,还活得很好。关键在于走了完全不同的路线:
可灵AI 3.0(快手):主打”All-in-One”多模态输入输出。文本、图片、视频、音频四种输入方式,支持4-60秒视频生成。最大优势是成本极低——快手自研的推理优化让单条视频成本降到行业平均的1/5。适合短视频创作者批量生产内容。
即梦AI + Seedance 2.0(字节跳动):被称为”地表最强AI视频模型”。核心优势是角色跨镜头一致性——同一个人物在不同场景中保持外观、服装、动作特征一致,这是做叙事视频的刚需。支持4-15秒视频生成,带原生音频(音效+配乐+人声)。
Runway Gen-4.5:国际市场上的技术标杆。文生视频基准测试登顶,导演模式提供时间线和关键帧控制,动作笔刷允许用户在图像上选择区域设置运动速度。Runway Agent更是突破——对话式AI视频创作助手,用户通过自然语言描述创意需求,单次对话就能完成从概念构思到多场景成品视频的全流程。
AI视频选型指南
短视频创作者:选可灵AI。成本低、出片快、批量生产,日均10条以上的产出需求可灵最合适。
品牌营销/广告:选即梦AI。角色一致性意味着品牌形象统一,原生音频意味着不需要后期配音,一条龙搞定。
专业影视/实验创作:选Runway。导演模式和动作笔刷提供精细控制,适合对画面有极致要求的创作者。
企业培训/教育:等Veo4。物理一致性和多机位叙事能力是教育场景的核心需求,Veo4一旦正式发布将是最优选择。
Sora倒下了,但AI视频赛道比以往更活跃。当工具从”能生成”进化到”能叙事”,从”无声短片”进化到”音画同步”,从”一次性消费”进化到”生产力工具”,真正的AI视频时代才刚刚开始。