API参考

API 概述

黔前智算 API 提供类似硅基流动的大模型统一调用服务。一个平台 API Key 可调用 DeepSeek、豆包、智谱清言 GLM、百度文心一言等主流模型，也可扩展到私有 GPUStack / LM Studio 模型。

Base URL: https://qianqianai.com/v1

协议: HTTPS

数据格式: JSON

认证方式

所有 API 请求都需要在 Header 中携带 API Key：

Authorization: Bearer YOUR_API_KEY

您可以在控制台「API 密钥」页面创建和管理 API Key，并为单个 Key 设置全部模型或指定模型白名单。调用记录和 Token 用量会展示在控制台调用日志中。

立即创建 API Key 查看模型价格

可用模型示例

实际可用模型以 GET /models 返回为准。常见模型名包括：

deepseek-chat：DeepSeek 通用对话模型
moonshot-v1-8k：Kimi Moonshot 对话模型
glm-4-flash：智谱清言 GLM 模型
doubao-seed-1-6：豆包模型
abab6.5s-chat：MiniMax 对话模型
ernie-4.0-turbo-8k：文心一言模型

API 端点

1. Chat Completions

创建聊天完成请求，支持流式输出。

POST /chat/completions

请求参数

参数	类型	必填	说明
model	string	是	模型名称，如 deepseek-chat、glm-4-flash、moonshot-v1-8k
messages	array	是	消息数组，包含 role 和 content
temperature	float	否	采样温度，0-2，默认 1
max_tokens	integer	否	最大生成 token 数
stream	boolean	否	是否流式输出，默认 false
top_p	float	否	核采样概率阈值，默认 1
frequency_penalty	float	否	频率惩罚，-2.0 到 2.0
presence_penalty	float	否	存在惩罚，-2.0 到 2.0

请求示例

{
  "model": "deepseek-chat",
  "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "你好，请用一句话介绍黔前智算的大模型 API 服务。"}
  ],
  "temperature": 0.7,
  "max_tokens": 1000
}

响应示例

{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1677652288,
  "model": "deepseek-chat",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "黔前智算提供 OpenAI 兼容的大模型统一调用服务，可通过一个 API Key 接入多家主流模型。"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 10,
    "total_tokens": 30
  }
}

2. Embeddings

获取文本的向量表示，适合知识库、语义搜索和 RAG 场景。

POST /embeddings

3. Models List

获取当前 API Key 可调用的模型列表。

GET /models

4. Images Generation

根据文本描述生成图像。

POST /images/generations

5. Audio Transcription

将音频文件转录为文本。

POST /audio/transcriptions

错误码

状态码	错误类型	说明
200	OK	请求成功
400	Bad Request	请求参数错误
401	Unauthorized	API Key 无效或已过期
403	Forbidden	权限不足
429	Too Many Requests	请求频率超限
500	Internal Server Error	服务器内部错误
503	Service Unavailable	服务暂时不可用

限流说明

为了保证服务稳定性，API 调用有以下限流规则：

免费用户：60 请求/分钟
付费用户：600 请求/分钟
企业用户：6000 请求/分钟（可调整）

超过限流将返回 429 状态码，请合理控制请求频率。

大模型 API 参考