文生视频

使用文字提示词生成 AI 视频，并控制模型、分辨率、画幅、时长和音频选项。

正在检查积分

AI 模型

模型版本

提示词

0/5000

画幅比例

分辨率

25 积分1080p · 8s · silent

AI 视频展示

查看电影感运动、角色一致性和多模态视频生成示例。

Veo 3.1 Text to Video

用 Veo 3.1 从文字生成带声音的视频

Veo 3.1 适合把短片概念、产品镜头、社交视频和故事分镜快速变成可预览的视频。当前 Studio 接入了 Lite、Fast、Quality 三档，并提供 720p、1080p、4k、画幅和音频开关。

Google 官方 Gemini API 文档列出 Veo 3.1 支持文生视频、图生视频和首尾帧等视频生成能力。

Google 官方发布说明强调 Veo 3.1 在音频、叙事控制、真实质感和提示词遵循方面有改进。

本站当前文生视频页面默认 8 秒生成，并提供 auto、16:9、9:16 画幅控制。

适合做什么

广告短片草稿

把产品卖点、镜头运动和情绪关键词写成提示词，快速得到可讨论的动态样片。

社交媒体视频

用竖屏或横屏画幅生成开场镜头、活动预告和视觉钩子，减少前期拍摄成本。

故事分镜验证

先用文字测试角色动作、环境变化和镜头节奏，再决定是否进入正式制作。

产品和场景演示

生成产品在真实环境里的运动镜头，用于概念演示、提案和内部评审。

这页接入的 Veo 3.1 能力

Veo 3.1 更适合用清晰提示词控制一个短镜头：主体、动作、构图、光线和声音都写得越具体，生成结果越容易接近预期。

Lite、Fast、Quality 三种版本，方便在成本、速度和质量之间切换。

支持 720p、1080p 和 4k 选项，底部会实时显示当前选择对应的积分成本。

支持 auto、16:9、9:16 画幅，适合横版短片和移动端竖屏内容。

默认带音频生成入口，适合需要环境声、对白感或镜头氛围的提示词。

可以直接改写的提示词

Product shot

A cinematic 8-second product video of a matte black wireless speaker on a rain-soaked rooftop at night, slow push-in camera, blue neon reflections, subtle bass vibration, realistic sound design.

Travel scene

A handheld travel video of a narrow Kyoto alley after sunset, warm lanterns, light rain, pedestrians passing naturally, slow forward camera movement, ambient street sound.

Story moment

A young astronaut discovers a glowing plant inside a quiet greenhouse on Mars, gentle camera orbit, dust floating in the light, soft emotional music, realistic cinematic lighting.

常见问题

Veo 3.1 文生视频适合一次写很长的剧情吗？

更适合写清楚一个短镜头：主体、动作、场景、镜头、光线和声音。长剧情建议拆成多个镜头分别生成。

我应该选 Lite、Fast 还是 Quality？

快速试想法可以先用 Lite 或 Fast；如果提示词已经稳定，再切到 Quality 做更高质量版本。

Veo 3.1 这里可以生成声音吗？

当前本站 Veo 3.1 文生视频入口支持音频选项。提示词里可以描述环境声、音乐氛围或角色说话方式。