API 使用说明
推理 API 支持功能
- 联网搜索推理
- 图片文字识别推理
- 语音文字识别(预计两周内上线,敬请期待)
- 文字生成语音(预计两周内上线,敬请期待)
API 介绍说明
只需调用七牛云的推理 API 接口(兼容 openai 库),就可以将 DeepSeek-R1/V3 的 AI 能力快速集成到您的业务和应用中。
获取接口密钥
支持接口列表
接口名 | 说明 |
---|---|
/v1/models | 列举可用模型 |
/v1/chat/completions | 对话型推理接口,支持联网搜索、图片文字识别 图片格式:支持 JPG、JPEG、PNG、BMP、PDF 等常见格式,建议使用 JPG 格式 |
/v1/voice/asr | 语音文字识别(预计两周内上线,敬请期待) |
/v1/voice/tts | 文字生成语音(预计两周内上线,敬请期待) |
HTTP 调用示例
使用上一步获取的LLM API KEY 调用 chat 接口,支持模型:deepseek-r1 和 deepseek-v3 例如:
# 调用文本摘要 API
export LLM_API_KEY="<你的 LLM API KEY>"
curl https://api.qnaigc.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $LLM_API_KEY" \
-d '{
"messages": [{"role": "user", "content": "七牛云提供 GPU 云产品能用于哪些场景?"}],
"model": "deepseek-v3",
"stream": true
}'
Python openai 库代码示例
- 流式调用
from openai import OpenAI
url = 'https://api.qnaigc.com/v1/'
llm_api_key = 'your llm_api_key'
client = OpenAI(
base_url=url,
api_key=llm_api_key
)
# 发送带有流式输出的请求
content = ""
messages = [
{"role": "user", "content": "七牛云提供 GPU 云产品能用于哪些场景?"}
]
response = client.chat.completions.create(
model="deepseek-v3",
messages=messages,
stream=True, # 启用流式输出
max_tokens=4096
)
# 逐步接收并处理响应
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
print(content)
# Round 2
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "继续"})
response = client.chat.completions.create(
model="deepseek-v3",
messages=messages,
stream=True
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
print(content)
- 非流式调用
from openai import OpenAI
url = 'https://api.qnaigc.com/v1/'
llm_api_key = 'your llm_api_key'
client = OpenAI(
base_url=url,
api_key=llm_api_key
)
# 发送非流式输出的请求
messages = [
{"role": "user", "content": "七牛云提供 GPU 云产品能用于哪些场景?"}
]
response = client.chat.completions.create(
model="deepseek-v3",
messages=messages,
stream=False,
max_tokens=4096
)
content = response.choices[0].message.content
print(content)
# Round 2
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "继续"})
response = client.chat.completions.create(
model="deepseek-v3",
messages=messages,
stream=False
)
content = response.choices[0].message.content
print(content)
联网搜索推理
API 支持联网功能,为保持对 OpenAI 的兼容,联网功能通过在模型后面加”?search”来开启。例如:
# 调用文本摘要 API
export LLM_API_KEY="<你的 LLM API KEY>"
curl https://api.qnaigc.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $LLM_API_KEY" \
-d '{
"messages": [{"role": "user", "content": "七牛云提供 GPU 云产品能用于哪些场景?"}],
"model": "deepseek-v3?search"
}'
图片文字识别推理
API 已经支持图片文字识别推理,同时接口依然兼容 OpenAI, 示例代码如下:
# 调用文本摘要 API
export LLM_API_KEY="<你的 LLM API KEY>"
curl https://api.qnaigc.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $LLM_API_KEY" \
-d '{
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "请帮我整理图片中的内容并整理一份报告给我."
},
{
"type": "image_url",
"image_url": {
"url": "https://www.qiniu.com/qiniu_ai_token_snapshot.png"
}
}
]
}
],
"model": "deepseek-v3"
}'
- 注意:image_url 指向的文件大小不能超过 8MB
- 文件格式:支持 JPG、JPEG、PNG、BMP、PDF 等常见格式,建议使用 JPG 格式
如何获取图片上传地址?
推荐使用七牛对象存储来存储文件并获取在线访问地址,提供给模型来进行识别和推理。
可以通过 curl 快速进行上传测试:
curl $你的空间区域上传地址 \
-F "file=@你的文件路径" \
-F "token=$你的上传 token" \
-F "key=你的文件名" \
或者在代码中使用 python 来实现。
import requests
# 目标 URL
url = "空间区域上传地址"
# 文件字段
files = {
"file": open("上传的文件地址", "rb") # 以二进制模式打开文件
}
# 其他表单字段
data = {
"key": "保存的文件名称",
"token": "你的上传 token"
}
# 发送 POST 请求
response = requests.post(url, files=files, data=data)
# 输出响应
print("Status Code:", response.status_code)
print("Response Body:", response.text)
我们还提供了许多语言的上传 SDK,简单易用,欢迎查看我们的【SDK 中心】来了解。
更多对象存储信息欢迎参考对象存储的【产品使用文档】。
使用七牛云 GPU 主机部署私有版本
文档反馈
(如有产品使用问题,请 提交工单)