大模型 API 参考

统一接入 DeepSeek、豆包、智谱、百度等主流模型,兼容 OpenAI 调用格式

API 概述

黔前智算 API 提供类似硅基流动的大模型统一调用服务。一个平台 API Key 可调用 DeepSeek、豆包、智谱清言 GLM、百度文心一言等主流模型,也可扩展到私有 GPUStack / LM Studio 模型。

Base URL: https://qianqianai.com/v1
协议: HTTPS
数据格式: JSON

认证方式

所有 API 请求都需要在 Header 中携带 API Key:

Authorization: Bearer YOUR_API_KEY

您可以在控制台「API 密钥」页面创建和管理 API Key,并为单个 Key 设置全部模型或指定模型白名单。调用记录和 Token 用量会展示在控制台调用日志中。

立即创建 API Key 查看模型价格

可用模型示例

实际可用模型以 GET /models 返回为准。常见模型名包括:

  • deepseek-chat:DeepSeek 通用对话模型
  • moonshot-v1-8k:Kimi Moonshot 对话模型
  • glm-4-flash:智谱清言 GLM 模型
  • doubao-seed-1-6:豆包模型
  • abab6.5s-chat:MiniMax 对话模型
  • ernie-4.0-turbo-8k:文心一言模型

API 端点

1. Chat Completions

创建聊天完成请求,支持流式输出。

POST /chat/completions

请求参数

参数 类型 必填 说明
model string 模型名称,如 deepseek-chat、glm-4-flash、moonshot-v1-8k
messages array 消息数组,包含 role 和 content
temperature float 采样温度,0-2,默认 1
max_tokens integer 最大生成 token 数
stream boolean 是否流式输出,默认 false
top_p float 核采样概率阈值,默认 1
frequency_penalty float 频率惩罚,-2.0 到 2.0
presence_penalty float 存在惩罚,-2.0 到 2.0

请求示例

{
  "model": "deepseek-chat",
  "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "你好,请用一句话介绍黔前智算的大模型 API 服务。"}
  ],
  "temperature": 0.7,
  "max_tokens": 1000
}

响应示例

{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1677652288,
  "model": "deepseek-chat",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "黔前智算提供 OpenAI 兼容的大模型统一调用服务,可通过一个 API Key 接入多家主流模型。"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 10,
    "total_tokens": 30
  }
}

2. Embeddings

获取文本的向量表示,适合知识库、语义搜索和 RAG 场景。

POST /embeddings

3. Models List

获取当前 API Key 可调用的模型列表。

GET /models

4. Images Generation

根据文本描述生成图像。

POST /images/generations

5. Audio Transcription

将音频文件转录为文本。

POST /audio/transcriptions

错误码

状态码 错误类型 说明
200 OK 请求成功
400 Bad Request 请求参数错误
401 Unauthorized API Key 无效或已过期
403 Forbidden 权限不足
429 Too Many Requests 请求频率超限
500 Internal Server Error 服务器内部错误
503 Service Unavailable 服务暂时不可用

限流说明

为了保证服务稳定性,API 调用有以下限流规则:

  • 免费用户:60 请求/分钟
  • 付费用户:600 请求/分钟
  • 企业用户:6000 请求/分钟(可调整)

超过限流将返回 429 状态码,请合理控制请求频率。