AI 大模型推理

  • AI 大模型推理 > API 文档 > OCR API 使用说明

    OCR API 使用说明

    最近更新时间: 2025-06-12 15:21:49

    简介

    本接口支持对图片和 PDF 文档进行高精度文字识别(OCR),具备超低延迟响应。识别结果可直接作为 AI 推理接口的输入文本,适用于多种智能应用场景。


    功能特性

    • 支持多种输入格式:图片(如 PNG、JPG 等)、PDF 文档。
    • 高精度识别:精准提取图片或文档中的文字内容。
    • 超低延迟:响应速度快,适合实时或批量处理需求。
    • 易于集成:标准 RESTful API,便于与各类系统对接。

    API 调用方式

    获取接口密钥

    1. 请求示例

    使用 curl 命令调用 OCR 接口:

    export OPENAI_BASE_URL="https://api.qnaigc.com/v1"
    export OPENAI_API_KEY="<你的七牛云 AI API KEY>"
    
    curl --location "$OPENAI_BASE_URL/images/ocr" \
    --header "Content-Type: application/json" \
    --header "Authorization: Bearer $OPENAI_API_KEY" \
    --data '{
        "model":"ocr",
        "url":"https://static.qiniu.com/ai-inference/example-resources/ocr-example.png"
    }'
    

    参数说明

    参数名 类型 必填 说明
    model string 固定为 "ocr"
    url string 需识别图片或 PDF 的公网链接

    返回结果示例

    {
      "id": "这是调用 id"
      "text": "这里是图片或PDF中识别出的文字内容"
    }
    
    字段名 类型 说明
    text string 识别出的全部文本内容
    id string 本次调用的 id
    以上内容是否对您有帮助?
  • Close