刚刚,谷歌更新了其 Veo AI 视频生成器,新增原生竖屏视频生成与 4K 分辨率支持功能。此次对 “文生视频” 功能的调整,旨在提升画面清晰度的同时,确保不同场景中的主体元素保持一致。

Veo 3.1 的更新,解决了生成式视频领域一项长期存在的挑战:保持镜头间的视觉一致性。谷歌表示,新款模型在场景切换时能更好地保留人物特征与背景纹理,从而更容易重复使用特定的视觉元素,或在多场景叙事中贯穿同一主题。

最显著的改进是对“素材到视频”工具的重大优化。用户只需添加三张参考图片:一张用于主体,一张用于背景,一张用于展现所需的视觉效果或风格。然后,只需添加一些文字即可开始制作。即使提示信息较短,Veo 3.1 也能在提供参考图像后生成角色表情和动作更生动的视频。
移动创作者是本次更新的核心受众。升级后的 Veo 可直接生成 9:16 比例的原生竖屏视频,创作者无需对横屏素材进行裁剪,也不必牺牲画质,就能制作出适配 YouTube Shorts 等平台的全屏内容。针对更专业的创作流程,谷歌还新增了 1080P 至 4K 的画质提升选项。
目前,这些新功能已率先在 Gemini 应用、YouTube Shorts 及 YouTube Create 工具中上线,并将逐步覆盖谷歌旗下更多创作者工具与企业级服务。为区分生成内容与真实拍摄素材,谷歌会在视频文件中嵌入肉眼不可见的 SynthID 数字水印。
有体验用户反馈,Veo 3.1 似乎存在不同语言版本表现差距太大的问题。“巴西葡萄牙语的人物音频存在音画不同步、台词错乱的问题,其他语言版本的表现则相对更佳。我曾指令其生成一段鹦鹉以沙哑嗓音鸣叫的音频,但该需求最终未能实现。”

值得一提的是,此次更新距苹果与谷歌官宣合作、计划在下一代 Siri 中集成 Gemini 模型仅过去一天。与此同时, OpenAI 已达成合作,计划将迪士尼角色引入 Sora 平台。





