AI 大模型推理

  • AI 大模型推理 > API 文档 > 视频生成 (veo系列)

    视频生成 (veo系列)

    最近更新时间: 2026-03-02 15:57:26

    接口说明

    API接入点

    七牛云 AI 大模型推理 API 接入域名:

    认证机制

    创建视频生成任务

    POST /v1/videos/generations

    Body 请求参数

    {
      "instances": [
        {
          "prompt": "姜砚反应极快,身体未动,只是抬手在半空中精准地截住了那张纸。他修长的手指捏着画纸边缘,手背青筋微显。陆栀气喘吁吁地跑近,在他面前两步停下。姜砚抬眸,目光锋利地扫过她泛红的脸颊,随后垂眸看了一眼手中的画,神色未变,递了过去。 (Contains: 姜砚) (Contains: 陆栀) Camera: Close Up (特写,聚焦在两人手指交接画纸的瞬间,以及随后的眼神对视). Dialogue: 姜砚(声音低冷):拿好。\n陆栀(微怔,呼吸未平):谢……谢谢! Narration: 那是他们第一次对视。一个像初冬的寒冰,一个像盛夏的暖阳。",
          "image": {
            "bytesBase64Encoded": "",
            "uri": "http://example.com/example1.jpeg(请修改为正确的可公开访问图片链接)",
            "mimeType": "image/jpeg"
          },
          "lastFrame": {
            "uri": "http://example.com/example2.png(请修改为正确的可公开访问图片链接)",
            "mimeType": "image/png"
          }
        }
      ],
      "parameters": {
        "generateAudio": true,
        "durationSeconds": 8,
        "sampleCount": 1
      },
      "model": "veo-3.1-generate-preview"
    }
    

    请求参数

    名称 位置 类型 必选 说明
    Authorization header string none
    Content-Type header string none
    body body object none
    » instances body [object] none
    »» prompt body string 文本转视频功能必需的参数,可以是对输入图片的内容提示以及将图片转换为视频的提示。
    »» image body object 输入图片信息,用于指导视频生成。您可以仅使用图片作为输入来生成新视频,也可以使用图片和描述性文本作为输入。使用 Veo 3.1 系列模型时,如果同时指定尾帧 lastFrame 参数,当前这个 image 参数将作为视频的初始帧。
    »» referenceImages body object 最多包含三张素材图片或最多一张风格图片的列表,用于描述模型在生成视频时要使用的参考素材
    »»» referenceType body string 在 referenceImages 对象中是必需的,请默认填写“asset”
    »»» image body object 包含用作主题内容输入的参考图片
    »»»» uri body string 参考图片链接,要确保链接是公开可访问的
    »»»» mimeType body string 参考图片类型,例如:image/png、image/png
    image/webp
    »»» bytesBase64Encoded body string 图片文件的字节 Base64 编码字符串(该字段和 uri 字段二者填其一)
    »»» uri body string 图片文件的可以公开访问的 URL 地址(该字段和 bytesBase64Encoded 字段二者填其一)
    »»» mimeType body string 图片的 MIME 类型,目前支持 image/jpeg、image/png 两种类型,请与真实的图片数据描述相符。
    »» lastFrame body object 指定尾帧的图片,当前支持的模型为:veo-2.0-generate-001、veo-3.1-generate-001、veo-3.1-generate-preview、veo-3.1-fast-generate-001、veo-3.1-fast-generate-preview
    »»» bytesBase64Encoded body string 图片文件的字节 Base64 编码字符串(该字段和 uri 字段二者填其一)
    »»» uri body string 图片文件的可以公开访问的 URL 地址(该字段和 bytesBase64Encoded 字段二者填其一)
    »»» mimeType body string 图片的 MIME 类型,目前支持 image/jpeg、image/png 两种类型,请与真实的图片数据描述相符。
    » parameters body object 视频生成的指导参数
    »» generateAudio body boolean 是否生成音频(生成的音频内容合成在结果视频中),其中 veo-2.0-generate-001 模型不支持该参数
    »» durationSeconds body integer 生成的视频文件的时长,目前仅支持 8S,该字段可以填写 8
    »» sampleCount body integer 输出视频数量,支持的范围是 1~4
    »» resolution body string 所生成视频的分辨率,目前仅 Veo 3 模型支持。可接受的值为 720p(默认值)或 1080p
    »» aspectRatio body string 指定所生成视频的宽高比
    »» seed body integer 请求的数字,以使生成的视频具有确定性。 在请求中添加种子编号而不更改其他参数会导致模型生成相同的视频;支持的范围为 0 ~ 4294967295
    »» negativePrompt body string 一个文本字符串,用于描述您不希望模型生成的内容
    »» personGeneration body string 用于控制是否允许人物或人脸生成的安全设置
    » model body string 指定生成模型

    部分参数详细说明

    aspectRatio: 指定所生成视频的宽高比,接受的值如下:

    • 16:9(默认值)
    • 9:16(其中 veo-3.0-generate-preview 暂不支持)

    durationSeconds:生成的视频文件的时长,需要注意如下

    • 在使用 referenceImages 参数时,veo 仅支持 8s 的时长
    • veo2 系列模型支持填写 4 或 8
    • veo3 系列模型支持填写 4、6 或 8

    negativePrompt: 一个文本字符串,用于描述您不希望模型生成的内容;例如:

    • 偏灰暗镜头
    • 人物、动物
    • 多辆汽车、风

    personGeneration: 用于控制是否允许人物或人脸生成的安全设置;支持如下选项:

    • allow_adult(默认值):仅允许生成成年人
    • dont_allow:禁止在图片中包含人物/人脸

    model: 目前支持的模型如下:

    • veo-2.0-generate-001
    • veo-3.0-generate-001
    • veo-3.0-fast-generate-001
    • veo-3.0-generate-preview
    • veo-3.0-fast-generate-preview
    • veo-3.1-generate-001
    • veo-3.1-fast-generate-001
    • veo-3.1-generate-preview
    • veo-3.1-fast-generate-preview

    lastFrame 支持的模型如下:

    • veo-3.1-generate-preview
    • veo-3.1-fast-generate-preview
    • veo-3.1-generate-001
    • veo-3.1-fast-generate-001

    返回示例

    200 Response

    {
      "id": "videos-1756376552064908294-1383010573"
    }
    

    状态查询

    返回结果

    状态码 状态码含义 说明 数据模型
    200 OK none Inline

    返回数据结构

    状态码 200

    名称 类型 必选 约束 中文名 说明
    » id string true none 视频生成的任务ID,可用于后续查询视频生成任务的结果。

    查询视频生成任务结果

    GET /v1/videos/generations/{id}

    请求参数

    名称 位置 类型 必选 说明
    id path string 创建时返回的视频生成任务ID

    返回示例

    200 Response

    {
      "id": "videos-1756373553362141144-1383010573",
      "model": "veo-3.0-fast-generate-preview",
      "status": "Completed",
      "message": "",
      "data": {
        "raiMediaFilteredCount": 0,
        "videos": [
          {
            "url": "https://aitoken-video.qnaigc.com/xxx/xx/sample_0.mp4",
            "mimeType": "video/mp4"
          }
        ]
      },
      "created_at": "2025-08-28T17:32:33+08:00",
      "updated_at": "2025-08-28T17:33:58+08:00"
    }
    

    返回结果

    状态码 状态码含义 说明 数据模型
    200 OK none Inline

    返回数据结构

    状态码 200

    名称 类型 必选 约束 中文名 说明
    » id string true none 创建时返回的视频生成任务ID
    » model string true none 模型
    » status string true none 当前任务状态,可能的值为:
    - Initializing // 初始化中
    - Queued // 排队中
    - Running // 运行中
    - Completed // 完成
    - Failed // 失败
    - Uploading // 汇集、上传结果文件到存储中
    - Unknown // 未定义状态
    » message string true none 任务的状态说明
    » data object true none none
    »» raiMediaFilteredCount integer true none 生成的视频文件中,因受政策因素而被审核系统过滤的视频数量。如果没有过滤任何视频,则返回的计数为 0
    »» videos [object] true none 视频生成结果数据,数组大小由输入的生成数量参数 sampleCount 决定
    »»» url string true none 视频结果文件下载链接,链接有效期为 7 天。
    »»» mimeType string true none 视频结果文件 MIME 类型,为 video/mp4
    » created_at string true none 创建时间
    » updated_at string true none 更新时间
    以上内容是否对您有帮助?