Skip to content

feat(catalog): 接入云账单 / Chrono LLM / k8s metrics — 基础设施成本可见性 #716

@loning

Description

@loning

Background

2026-05-11 我让 /daily 评估 GodGpt PARKED 状态的"流量成本"(每月烧多少钱), 发现公司当前没有任何一个我能访问的系统含云账单/基础设施成本数据:

我查了哪里 结论
NyxID 注册的 22 个 service 无 aliyun/aws/cloud billing service
chrono-finance repo Budget Monitoring P2 框架已搭, 但实际数据在 Stephan 的 Lark Bitable (.env 占位, 没有 commit token), 也没有云成本细分科目
Chrono LLM Gateway (llm.aelf.dev) SPA admin dashboard, 有 token 用量数据但需要 GUI 登录, 没暴露 API
godgpt-api 跑在 chronoai-platform k8s 云账单在某个云账户 (Aliyun / AWS / Azure?), 我和 share-ops 都看不到

结果: 我只能告诉 Auric "GodGpt MRR ~$2,150/月, 估算商店分成后 ~$1,500/月净收入", 但无法回答 "GodGpt 跑起来要烧多少", 也就无法判断 PARK 状态是赚钱还是烧钱

CEO 战略决策 (PARK / KILL / 加大投入 / 升级 instrumentation) 没有真实云成本数据支持, 完全靠经验估算。

需求 / Requirements

把公司云账单/基础设施成本作为 NyxID admin service 注册, 这样 /daily 和战略决策有真实数据。

优先级 / Priority of services to add

P0 (今天最痛点 — godgpt PARKED 评估)

  • 云账单 API (aliyun-billing / aws-cost-explorer / azure-cost-management — 看公司实际用什么云)
    • 按 tag/namespace/project 维度拆分 (chronoai-platform / godgpt-api / nyxid / ornn / sisyphus)
    • 月度 + 日度粒度
    • 支持 last_30_days / current_month 等 standard window

P1 (LLM 成本可见性)

  • Chrono LLM Gateway admin API (https://llm.aelf.dev)
    • 按 app_id (godgpt / nyxid / ornn / sisyphus / aevatar) 拆分 token 用量
    • 按 channel (OpenAI / Anthropic / Azure / Aelf 自家) 拆分成本
    • 折算 USD (用 channel pricing 表)
    • 这块我看到 llm.aelf.dev 是 one-api-like 项目, 应该有现成 admin endpoint, 只需要把 admin token 注册为 NyxID service

P2 (k8s 资源 + 部署级别)

  • chronoai-platform k8s metrics endpoint (Prometheus / k8s API)
    • 每个 namespace / pod 的 CPU/memory/storage 用量
    • 用作云账单成本归因的辅助 (账单是金额, k8s metrics 是资源)

访问控制

  • 默认 admin-only, 但 share-ops + viewer role (#715 落地后) 能读
  • 不能改账单/不能 spend money (read-only)

验收标准 / Acceptance Criteria

  • nyxid service list 至少看到一个 cloud-billing-* service
  • nyxid proxy request cloud-billing-xx api/v1/cost?group_by=namespace&since=2026-05-01 能拿到 JSON 数据
  • /daily skill Step 2.5 可新增 "成本侧" 段, 按产品线显示月度云成本
  • 财务团队不再需要手工 CSV 导出云账单到 Bitable, n8n workflow 直接通过 NyxID 拉

好处 / Benefits

  1. CEO 战略决策有真实数据 — PARK / KILL 不再靠估算
  2. 财务自动化 — Stephan 的 Budget Monitoring P2 可以从 manual CSV 升级到 API 同步
  3. 每个产品线 P&L 透明 — Aevatar / NyxID / GodGpt / Ornn 各自成本 + 收入
  4. GodGpt 这次单独命题 — 95 天无维护, 107 付费订阅, MRR $2150/月, 如果云成本 > $1500/月就是亏钱, 该 KILL; 如果 < $1500/月, 维持 PARK 状态合理

关联 / Related

  • #714 — PostHog 关键事件
  • #715 — viewer role
  • 这三个 issue 合起来 = "NyxID infrastructure observability", 战略决策的数据底座

优先级 / Priority

P1-High — 影响 GodGpt 立刻能做的处置决策 (PARK vs KILL), 以及未来所有产品线的 P&L 透明度。

上下文 / Context

strategy/goals.md 当前显示 GodGpt 处于 PARKED 状态, 但 PARK 的成本不可见。如果是负贡献, 应该考虑 KILL; 如果是正贡献 (订阅收入 > 维护成本), PARK 的资源选择是对的。这个判断必须有数据。


Sub-issues (added 2026-05-18)

Tracking the remaining NyxID-side dev work split out of this issue:

Already shipped (closed scope from this issue's original P0)

Parallel ops work (handled by @kaiweijw, not tracked as NyxID issues)

Consumer (not in NyxID repo)

  • /daily skill Step 2.5 "cost side" section — tracked outside NyxID

Metadata

Metadata

Assignees

No one assigned

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions