网关配置对象
config 对象用于配置与各种提供者的 API 交互。它支持多种模式,如单一提供者访问、提供者之间的负载均衡和回退策略。
以下 JSON 架构用于验证配置对象:
示例配置
// Simple config with cache and retry
{
"virtual_key": "***", // Your Virtual Key
"cache": { // Optional
"mode": "semantic",
"max_age": 10000
},
"retry": { // Optional
"attempts": 5,
"on_status_codes": []
}
}
// Load balancing with 2 OpenAI keys
{
"strategy": {
"mode": "loadbalance"
},
"targets": [
{
"provider": "openai",
"api_key": "sk-***"
},
{
"provider": "openai",
"api_key": "sk-***"
}
]
}您可以在 下面 找到更多模式的示例。
Schema Details
strategy
配置或任何单独目标的操作策略
object
是(如果没有 provider 或 virtual_key)
-
查看策略对象详情
provider
服务提供商的名称
string
是(如果没有 mode 或 virtual_key)
"openai", "anthropic", "azure-openai", "anyscale", "cohere"
-
api_key
服务提供商的API密钥
string
是(如果指定了 provider)
-
-
virtual_key
虚拟密钥标识符
string
是(如果没有 mode 或 provider)
-
-
cache
缓存配置
object
否
-
查看缓存对象详情
retry
重试配置
object
否
-
查看重试对象详情
weight
负载均衡权重
number
否
-
在 loadbalance 模式中使用
on_status_codes
触发回退的状态码
array of strings
否
-
在 fallback 模式中使用
targets
目标配置列表
array
是(如果指定了 mode)
-
每个项目遵循配置模式
request_timeout
请求超时配置
number
否
-
-
custom_host
路由到私有托管模型
string
否
-
与 provider + api_key 结合使用
forward_headers
直接转发敏感头信息
array of strings
否
-
-
override_params
传递模型名称和其他超参数
object
否
"model", "temperature", "frequency_penalty", "logit_bias", "logprobs", "top_logprobs", "max_tokens", "n", "presence_penalty", "response_format", "seed", "stop", "top_p", 等等
传递通常是有效负载一部分的所有内容
策略对象详细信息
mode
配置的策略模式
string
是
"loadbalance", "fallback"
on_status_codes
应用策略的状态码。此字段仅在策略模式为 "fallback" 时使用
数字数组
否
可选
缓存对象详细信息
mode
缓存模式
string
是
"simple", "semantic"
-
max_age
缓存条目的最大年龄
integer
否
-
可选
重试对象详细信息
attempts
重试次数
整数
是
-
-
on_status_codes
触发重试的状态码
字符串数组
否
-
可选
云服务提供商参数 (Azure OpenAI, Google Vertex, AWS Bedrock)
Azure OpenAI
azure_resource_name
string
否
azure_deployment_id
string
否
azure_api_version
string
否
azure_model_name
string
否
Authorization
string ("Bearer $API_KEY")
否
Google Vertex AI
vertex_project_id
string
否
vertex_region
string
否
AWS Bedrock
aws_access_key_id
string
否
aws_secret_access_key
string
否
aws_region
string
否
aws_session_token
string
否
注意事项
策略
mode键决定配置的操作模式。如果未指定策略mode,则假定为单一提供者模式,需要provider和api_key或virtual_key。在
loadbalance和fallback模式下,targets数组指定每个目标的配置。cache和retry对象分别提供缓存和重试策略的附加配置。
示例
Last updated