API 概述
黔前智算 API 提供类似硅基流动的大模型统一调用服务。一个平台 API Key 可调用 DeepSeek、豆包、智谱清言 GLM、百度文心一言等主流模型,也可扩展到私有 GPUStack / LM Studio 模型。
Base URL:
https://qianqianai.com/v1
协议: HTTPS
数据格式: JSON
认证方式
所有 API 请求都需要在 Header 中携带 API Key:
Authorization: Bearer YOUR_API_KEY
您可以在控制台「API 密钥」页面创建和管理 API Key,并为单个 Key 设置全部模型或指定模型白名单。调用记录和 Token 用量会展示在控制台调用日志中。
可用模型示例
实际可用模型以 GET /models 返回为准。常见模型名包括:
deepseek-chat:DeepSeek 通用对话模型moonshot-v1-8k:Kimi Moonshot 对话模型glm-4-flash:智谱清言 GLM 模型doubao-seed-1-6:豆包模型abab6.5s-chat:MiniMax 对话模型ernie-4.0-turbo-8k:文心一言模型
API 端点
1. Chat Completions
创建聊天完成请求,支持流式输出。
POST
/chat/completions
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 是 | 模型名称,如 deepseek-chat、glm-4-flash、moonshot-v1-8k |
| messages | array | 是 | 消息数组,包含 role 和 content |
| temperature | float | 否 | 采样温度,0-2,默认 1 |
| max_tokens | integer | 否 | 最大生成 token 数 |
| stream | boolean | 否 | 是否流式输出,默认 false |
| top_p | float | 否 | 核采样概率阈值,默认 1 |
| frequency_penalty | float | 否 | 频率惩罚,-2.0 到 2.0 |
| presence_penalty | float | 否 | 存在惩罚,-2.0 到 2.0 |
请求示例
{
"model": "deepseek-chat",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "你好,请用一句话介绍黔前智算的大模型 API 服务。"}
],
"temperature": 0.7,
"max_tokens": 1000
}
响应示例
{
"id": "chatcmpl-xxx",
"object": "chat.completion",
"created": 1677652288,
"model": "deepseek-chat",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "黔前智算提供 OpenAI 兼容的大模型统一调用服务,可通过一个 API Key 接入多家主流模型。"
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 20,
"completion_tokens": 10,
"total_tokens": 30
}
}
2. Embeddings
获取文本的向量表示,适合知识库、语义搜索和 RAG 场景。
POST
/embeddings
3. Models List
获取当前 API Key 可调用的模型列表。
GET
/models
4. Images Generation
根据文本描述生成图像。
POST
/images/generations
5. Audio Transcription
将音频文件转录为文本。
POST
/audio/transcriptions
错误码
| 状态码 | 错误类型 | 说明 |
|---|---|---|
| 200 | OK | 请求成功 |
| 400 | Bad Request | 请求参数错误 |
| 401 | Unauthorized | API Key 无效或已过期 |
| 403 | Forbidden | 权限不足 |
| 429 | Too Many Requests | 请求频率超限 |
| 500 | Internal Server Error | 服务器内部错误 |
| 503 | Service Unavailable | 服务暂时不可用 |
限流说明
为了保证服务稳定性,API 调用有以下限流规则:
- 免费用户:60 请求/分钟
- 付费用户:600 请求/分钟
- 企业用户:6000 请求/分钟(可调整)
超过限流将返回 429 状态码,请合理控制请求频率。