OCR API 使用说明
简介
本接口支持对图片和 PDF 文档进行高精度文字识别(OCR),具备超低延迟响应。识别结果可直接作为 AI 推理接口的输入文本,适用于多种智能应用场景。
功能特性
- 支持多种输入格式:图片(如 PNG、JPG 等)、PDF 文档。
- 高精度识别:精准提取图片或文档中的文字内容。
- 超低延迟:响应速度快,适合实时或批量处理需求。
- 易于集成:标准 RESTful API,便于与各类系统对接。
API 调用方式
获取接口密钥
1. 请求示例
使用 curl
命令调用 OCR 接口:
export OPENAI_BASE_URL="https://api.qnaigc.com/v1"
export OPENAI_API_KEY="<你的七牛云 AI API KEY>"
curl --location "$OPENAI_BASE_URL/images/ocr" \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $OPENAI_API_KEY" \
--data '{
"model":"ocr",
"url":"https://static.qiniu.com/ai-inference/example-resources/ocr-example.png"
}'
参数说明
参数名 | 类型 | 必填 | 说明 |
---|---|---|---|
model | string | 是 | 固定为 "ocr" |
url | string | 是 | 需识别图片或 PDF 的公网链接 |
返回结果示例
{
"id": "这是调用 id"
"text": "这里是图片或PDF中识别出的文字内容"
}
字段名 | 类型 | 说明 |
---|---|---|
text | string | 识别出的全部文本内容 |
id | string | 本次调用的 id |
文档反馈
(如有产品使用问题,请 提交工单)