llmgate

高性能 LLM 网关，专为 Go 智能体打造 — 统一 API 接入 20 家模型供应商，函数调用、流量控制、自动降级、智能体调试一站解决。

// ❌ 没有 llmgate：每家 SDK 不同，切换模型 = 到处改集成代码
resp, _ := deepseek.Chat(ctx, "sk-xxx", deepseekReq)
// → 换成 Claude？得换成 anthropic.Messages(...)，请求格式全变

// ✅ 有 llmgate：一套 API，任意模型，自动降级，内置指标
gw, _ := llmgate.NewFromFile("llmgate.toml")
reply, _ := gw.With("claude").Chat(ctx, req)         // 切换只需改一个字符串
reply, _ := gw.Fallback("claude", "deepseek").Chat(ctx, req) // 自动降级
snap := gw.Snapshot()                                  // 各 provider 延迟及 token 统计

这是什么

你在构建智能体应用，需要接入多个大模型。三个真实问题：

换模型要改代码 — 每家 API 格式不同，业务逻辑和模型耦合
出了问题不知道为什么 — 是模型慢？被限速？还是 token 超出预算？
Token 用量不透明 — 多个 provider 混用，输入/输出/推理 token 各自消耗对不上

llmgate 的做法：统一接口屏蔽差异，每次调用白盒记录 provider / 模型 / token 明细 / 延迟，内置降级和延迟限制策略，为可视化监控铺路。

三种使用形态，按需选择：

形态	适用场景
SDK	Go 项目直接引入，一行代码接入多个模型
Gateway	独立部署 HTTP 服务，非 Go 项目也能接入
Studio	可视化控制台，渠道管理 / 对话调试 / Mock 桩 / 请求记录一屏看清

核心亮点

函数调用（Tool Use）全协议支持 — 统一的 Tool/ToolCall 类型同时适配 OpenAI、Anthropic、Gemini 三套协议，为 ReAct 智能体和 ToolNode 工作流做好准备。
数据驱动的供应商架构 — 18 个独立 provider 包精简为一张 builtins 表。新增 OpenAI 兼容供应商只需一行数据，无需编写 Go 代码。
零代码自定义接入 — 配置文件中 protocol = "openai-compat" 即可接入任意 OpenAI 兼容 API，完全不用写代码。

快速开始

go get github.com/wzhongyou/llmgate

三种配置方式任选其一：

方式一 — 配置文件（推荐）

cp llmgate.toml.example llmgate.toml
# 编辑 key 字段

gw, err := llmgate.NewFromFile("llmgate.toml")

方式二 — 环境变量

export DEEPSEEK_KEY="sk-xxx"
export GLM_KEY="your-glm-key"

gw := llmgate.New()  // 自动从环境变量加载

方式三 — 代码

gw := llmgate.New()
gw.Use("deepseek", "sk-xxx")

开始使用：

package main

import (
    "context"
    "fmt"

    "github.com/wzhongyou/llmgate"

)

func main() {
    gw, err := llmgate.NewFromFile("llmgate.toml")
    if err != nil {
        panic(err)
    }

    ctx := context.Background()
    reply, err := gw.Chat(ctx, &llmgate.ChatRequest{
        Messages: []llmgate.Message{
            {Role: "user", Content: "帮我写一个 Go HTTP server"},
        },
    })
    if err != nil {
        panic(err)
    }
    fmt.Printf("[%s] %s\n", reply.Provider, reply.Content)
}

API

gw := llmgate.New()

// 注册 provider
gw.Use("deepseek", "sk-xxx")
gw.Use("anthropic", "sk-xxx")

// 指定 provider
reply, _ := gw.With("anthropic").Chat(ctx, req)

// 降级链
reply, _ := gw.Fallback("anthropic", "deepseek").Chat(ctx, req)

// 流式输出（SSE）
ch, err := gw.ChatStream(ctx, &llmgate.ChatRequest{
    Messages: []llmgate.Message{{Role: "user", Content: "你好"}},
})
for chunk := range ch {
    if chunk.Error != nil { break }
    fmt.Print(chunk.Content)
}

// 函数调用（Function Calling / Tool Use）
reply, _ := gw.Chat(ctx, &llmgate.ChatRequest{
    Messages: []llmgate.Message{{Role: "user", Content: "北京今天天气怎么样？"}},
    Tools: []llmgate.Tool{{
        Type: "function",
        Function: llmgate.ToolFunction{
            Name:        "get_weather",
            Description: "获取指定城市的当前天气",
            Parameters: map[string]interface{}{
                "type": "object",
                "properties": map[string]interface{}{
                    "city": map[string]interface{}{"type": "string"},
                },
                "required": []string{"city"},
            },
        },
    }},
    ToolChoice: "auto",
})
// reply.ToolCalls 包含模型决定调用的工具
// reply.FinishReason == "tool_calls"

// 指标
snap := gw.Snapshot()
fmt.Printf("DeepSeek 延迟: %.2f ms\n", snap.Providers["deepseek"].AvgLatencyMs)

控制台

网关二进制内嵌了开发者控制台。配置 admin_token 即可启用：

[server]
listen_addr = ":8080"
admin_token = "your-secret"

go run ./examples/server
# 浏览器打开 http://localhost:8080/admin/

五大页面覆盖开发全流程：

页面	用途
Channels（渠道）	可视化管理 provider — 增/删/改/测，查看状态和延迟
Playground（调试）	交互式测试 — 选模型、看流式输出、Token 用量、延迟
Mock（桩）	模拟返回 — 模拟 429/500/超时/空响应，测试异常处理
Recent（记录）	最近 200 条请求 — 完整输入输出查看，每 5s 自动刷新
Harness（治具）	请求录制/回放、影子流量对比、格式合规告警

Mock provider 以 "mock" 名称注册在引擎上，在 Playground 中选择即可验证规则。

详见 llmgate-design.md。

优先级（从高到低）：

.Fallback(...) — 代码中显式指定降级链
.With(...) — 固定使用某个 provider
UseStrategy(...) — 自定义策略
自动检测（llmgate.toml → 环境变量 → 代码）

Server 模式

独立部署 HTTP 服务，多语言接入：

cp llmgate.toml.example llmgate.toml
go run examples/server/main.go

# llmgate.toml
[[providers]]
name = "glm"
key = "${GLM_KEY}"

[[providers]]
name = "deepseek"
key = "${DEEPSEEK_KEY}"

[strategy]
primary = "glm"
fallback = ["deepseek"]
latency_threshold_ms = 5000

[server]
listen_addr = ":8080"
admin_token = "your-secret"   # 启用 /admin/ 控制台

接口：

POST /v1/chat — 对话，支持函数调用（可选 ?provider= / ?fallback= 查询参数）
GET /v1/models — 可用模型列表
GET /health — 健康检查
GET /metrics — Prometheus 指标
GET /admin/ — 可视化控制台（需配置 admin_token）

Harness（测试治具）

内置的 LLM 测试工程工具，解决模型升级验证和质量监控问题。

[harness]
record = true                         # 录制所有请求/响应到 JSONL
shadow_provider = "deepseek"          # 影子流量：异步发给另一个 provider 对比

能力	说明
请求录制	每次 Chat 调用自动记录到 JSONL 文件，用于回归测试基准
回放对比	历史请求重新发给新模型，对比 finish_reason、tool_calls、token 变化
影子流量	异步复制真实请求到 shadow provider，零延迟影响评估新模型
合规探针	始终检测 tool_calls JSON 合法性和 finish_reason 规范性
Hook 扩展	实现 `core.Hook` 接口，注入自定义观测逻辑

自定义 Hook：

type MetricsHook struct{}

func (h *MetricsHook) AfterChat(ctx context.Context, req *core.ChatRequest, resp *core.ChatResponse, err error) {
    // 上报到你的监控系统
}

gw.Engine().AddHook(&MetricsHook{})

详见 llmgate-design.md。

可观测性

每次 /v1/chat 请求输出一条结构化 JSON 日志：

{"time":"...","level":"INFO","msg":"request",
 "request_id":"1747123456789","method":"POST","path":"/v1/chat",
 "status":200,"latency_ms":312.5,"remote_addr":"127.0.0.1:54321",
 "provider":"glm","model":"glm-5.1",
 "input_tokens":15,"output_tokens":42,"reasoning_tokens":0}

注入自定义 logger：

logger := slog.New(slog.NewJSONHandler(os.Stdout, nil))
srv, _ := server.New(cfg, server.WithLogger(logger))

支持的供应商

供应商	协议	默认模型
Anthropic (Claude)	Anthropic Messages API	`claude-sonnet-4-6`
百川（Baichuan）	OpenAI 兼容	`Baichuan4`
百度（文心 ERNIE）	OpenAI 兼容	`ernie-5.1`
字节跳动（豆包）	OpenAI 兼容	`doubao-seed-1.6-250615`
DeepSeek	OpenAI 兼容	`deepseek-v4-flash`
Google (Gemini)	Gemini generateContent	`gemini-3.1-flash`
Groq	OpenAI 兼容	`meta-llama/llama-4-maverick-17b-128e`
Meta (Llama)	OpenAI 兼容	`llama-4-maverick`
MiniMax	OpenAI 兼容	`MiniMax-M2.7`
Mistral	OpenAI 兼容	`mistral-large-latest`
月之暗面（Kimi）	OpenAI 兼容	`kimi-k2.6`
OpenAI	OpenAI 兼容	`gpt-5.5`
阿里百炼（通义千问）	OpenAI 兼容	`qwen3.6-plus`
SiliconFlow	OpenAI 兼容	`Qwen/Qwen3-72B`
阶跃星辰（StepFun）	OpenAI 兼容	`step-3.7-flash`
腾讯（混元）	OpenAI 兼容	`hy3-preview`
Together AI	OpenAI 兼容	`meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8`
xAI (Grok)	OpenAI 兼容	`grok-4.1-fast-non-reasoning`
小米（MiMo）	OpenAI 兼容	`mimo-v2-pro`
智谱（GLM）	OpenAI 兼容	`glm-5.1`

3 套协议：OpenAI 兼容（18 家）、Anthropic Messages、Gemini generateContent。

所有供应商均支持 base_url 覆盖。无需写代码即可接入任意 OpenAI 兼容的供应商：

[[providers]]
name = "my-provider"
key = "${MY_PROVIDER_KEY}"
base_url = "https://api.my-provider.com/v1"
protocol = "openai-compat"

项目结构

llmgate/
├── core/                 # Provider 接口、引擎、策略、指标
│   └── providers/
│       ├── openaicompat/ # 全部 18 个 OpenAI 兼容 provider（数据驱动）
│       ├── anthropic/    # Anthropic Messages API
│       └── gemini/       # Gemini generateContent API
├── sdk/                  # Go SDK
├── server/               # HTTP 服务
├── docs/                 # llmgate 设计（类型、协议、SDK、网关、扩展）
└── examples/             # 使用示例
├── console/              # 可视化控制台（内嵌）

运行测试

# 1. 配置 key
cp llmgate.toml.example llmgate.toml
# 填入真实 key，或直接设置环境变量：
# export GLM_KEY=xxx  MINIMAX_KEY=xxx  DEEPSEEK_KEY=xxx

# 2. 运行集成测试
go test ./sdk/ ./server/ -v -count=1

未配置 key 时测试自动跳过。

路线图

v0.1 — Go SDK + DeepSeek + 基础降级策略 + 指标采集
v0.2 — 智谱（GLM）+ MiniMax + 结构化日志（slog）
v0.3 — 14 家供应商 / 3 套协议全覆盖，推理 token 追踪，默认模型可配置
v1.0 — Streaming（SSE）+ 生产级路由策略（熔断、限流、重试）
v1.1 — 函数调用（Tool Use）全协议支持；20 家供应商；数据驱动架构
v1.5 — 可视化控制台：渠道管理、对话调试、Mock 桩、请求记录
v2.0 — Harness Engineering：请求录制/回放、影子流量、格式合规探针、Hook 扩展机制

新增 Provider

OpenAI 兼容协议 — 在 core/providers/openaicompat/builtins.go 的 builtins 表里加一行：

{
    name:         "myprovider",
    baseURL:      "https://api.myprovider.com/v1",
    defaultModel: "my-model",
    models:       []string{"my-model"},
    envVar:       "MYPROVIDER_KEY",
},

自定义协议 — 实现 Provider 接口，参考 llmgate-design.md。

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.claude/plans		.claude/plans
.github/workflows		.github/workflows
console		console
core		core
docs		docs
examples		examples
sdk		sdk
server		server
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
go.mod		go.mod
go.sum		go.sum
llmgate.go		llmgate.go
llmgate.toml.example		llmgate.toml.example

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

llmgate

这是什么

核心亮点

快速开始

API

控制台

Server 模式

Harness（测试治具）

可观测性

支持的供应商

项目结构

运行测试

路线图

新增 Provider

License

About

Uh oh!

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

llmgate

这是什么

核心亮点

快速开始

API

控制台

Server 模式

Harness（测试治具）

可观测性

支持的供应商

项目结构

运行测试

路线图

新增 Provider

License

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages