Veo 3.1作为Google DeepMind在Veo 3基础上的升级版本,引入了多项突破性功能,显著提升了AI视频生成的质量和实用性。该模型已正式在Vertex AI云平台及Google Vids创作工具中现身,支持用户通过文本提示生成时长8秒、分辨率为720p并自带完整音轨的视频片段。
相较于前代产品,Veo 3.1在以下关键领域实现了显著提升:
-
首帧和尾帧控制技术,让用户能够精确指定视频的起始和结束画面,极大增强了创作控制力。[1]
-
优化的图像参考系统,支持更精细的自定义调整,使生成内容与用户视觉需求高度匹配。[1]
-
改进的提示语言解释能力,能够更准确理解用户输入的复杂描述,减少误解和重复生成。[1]
-
物理引擎级动态模拟功能,这是Veo 3.1的核心升级,使生成的视频在物理运动和交互上更加真实可信。[2]
-
SVG到视频的直接转换能力,使设计师能够将矢量图形无缝转换为动态视频内容,拓展了专业应用场景。[2]