文生视频

使用文字提示词生成 AI 视频,并控制模型、分辨率、画幅、时长和音频选项。

正在检查积分
AI 模型
模型版本
提示词
0/5000
画幅比例
分辨率
25 积分1080p · 8s · silent

AI 视频展示

查看电影感运动、角色一致性和多模态视频生成示例。

Veo 3.1 Text to Video

用 Veo 3.1 从文字生成带声音的视频

Veo 3.1 适合把短片概念、产品镜头、社交视频和故事分镜快速变成可预览的视频。当前 Studio 接入了 Lite、Fast、Quality 三档,并提供 720p、1080p、4k、画幅和音频开关。

Google 官方 Gemini API 文档列出 Veo 3.1 支持文生视频、图生视频和首尾帧等视频生成能力。
Google 官方发布说明强调 Veo 3.1 在音频、叙事控制、真实质感和提示词遵循方面有改进。
本站当前文生视频页面默认 8 秒生成,并提供 auto、16:9、9:16 画幅控制。

适合做什么

广告短片草稿

把产品卖点、镜头运动和情绪关键词写成提示词,快速得到可讨论的动态样片。

社交媒体视频

用竖屏或横屏画幅生成开场镜头、活动预告和视觉钩子,减少前期拍摄成本。

故事分镜验证

先用文字测试角色动作、环境变化和镜头节奏,再决定是否进入正式制作。

产品和场景演示

生成产品在真实环境里的运动镜头,用于概念演示、提案和内部评审。

这页接入的 Veo 3.1 能力

Veo 3.1 更适合用清晰提示词控制一个短镜头:主体、动作、构图、光线和声音都写得越具体,生成结果越容易接近预期。

Lite、Fast、Quality 三种版本,方便在成本、速度和质量之间切换。

支持 720p、1080p 和 4k 选项,底部会实时显示当前选择对应的积分成本。

支持 auto、16:9、9:16 画幅,适合横版短片和移动端竖屏内容。

默认带音频生成入口,适合需要环境声、对白感或镜头氛围的提示词。

可以直接改写的提示词

Product shot

A cinematic 8-second product video of a matte black wireless speaker on a rain-soaked rooftop at night, slow push-in camera, blue neon reflections, subtle bass vibration, realistic sound design.

Travel scene

A handheld travel video of a narrow Kyoto alley after sunset, warm lanterns, light rain, pedestrians passing naturally, slow forward camera movement, ambient street sound.

Story moment

A young astronaut discovers a glowing plant inside a quiet greenhouse on Mars, gentle camera orbit, dust floating in the light, soft emotional music, realistic cinematic lighting.

常见问题

Veo 3.1 文生视频适合一次写很长的剧情吗?
更适合写清楚一个短镜头:主体、动作、场景、镜头、光线和声音。长剧情建议拆成多个镜头分别生成。
我应该选 Lite、Fast 还是 Quality?
快速试想法可以先用 Lite 或 Fast;如果提示词已经稳定,再切到 Quality 做更高质量版本。
Veo 3.1 这里可以生成声音吗?
当前本站 Veo 3.1 文生视频入口支持音频选项。提示词里可以描述环境声、音乐氛围或角色说话方式。
https://geminiomni.app/zh/studio/text-to-video/veo-3-1