实测谷歌Veo 3.1：新增原生竖屏模式和4K画质，换个语言翻车到离谱？

刚刚，谷歌更新了其 Veo AI 视频生成器，新增原生竖屏视频生成与 4K 分辨率支持功能。此次对 “文生视频” 功能的调整，旨在提升画面清晰度的同时，确保不同场景中的主体元素保持一致。

Veo 3.1 的更新，解决了生成式视频领域一项长期存在的挑战：保持镜头间的视觉一致性。谷歌表示，新款模型在场景切换时能更好地保留人物特征与背景纹理，从而更容易重复使用特定的视觉元素，或在多场景叙事中贯穿同一主题。

最显著的改进是对“素材到视频”工具的重大优化。用户只需添加三张参考图片：一张用于主体，一张用于背景，一张用于展现所需的视觉效果或风格。然后，只需添加一些文字即可开始制作。即使提示信息较短，Veo 3.1 也能在提供参考图像后生成角色表情和动作更生动的视频。

移动创作者是本次更新的核心受众。升级后的 Veo 可直接生成 9:16 比例的原生竖屏视频，创作者无需对横屏素材进行裁剪，也不必牺牲画质，就能制作出适配 YouTube Shorts 等平台的全屏内容。针对更专业的创作流程，谷歌还新增了 1080P 至 4K 的画质提升选项。

目前，这些新功能已率先在 Gemini 应用、YouTube Shorts 及 YouTube Create 工具中上线，并将逐步覆盖谷歌旗下更多创作者工具与企业级服务。为区分生成内容与真实拍摄素材，谷歌会在视频文件中嵌入肉眼不可见的 SynthID 数字水印。

有体验用户反馈，Veo 3.1 似乎存在不同语言版本表现差距太大的问题。“巴西葡萄牙语的人物音频存在音画不同步、台词错乱的问题，其他语言版本的表现则相对更佳。我曾指令其生成一段鹦鹉以沙哑嗓音鸣叫的音频，但该需求最终未能实现。”

值得一提的是，此次更新距苹果与谷歌官宣合作、计划在下一代 Siri 中集成 Gemini 模型仅过去一天。与此同时， OpenAI 已达成合作，计划将迪士尼角色引入 Sora 平台。

实测谷歌 Veo 3.1：新增原生竖屏模式和 4K 画质，换个语言翻车到离谱？