Skip to content

[Feature] agent-skill-infra 自动化技能质量评分 #368

@Liber1917

Description

@Liber1917

Problem

SkillHub 是目前最大的中文 Agent Skill 社区,Top 50 技能通过人工审核。随着技能数量增长,纯人工审核无法规模化:

  1. 中文描述被英文检查器误判:关键词正则 [a-zA-Z]{3,} 只统计英文字母,200 字的中文描述被视为"空"(实测 nuwa-skill:描述 200+ 字被检查器报 "Description too short")
  2. 审核一致性难保证:人工审核依赖审核者经验,不同审核员对同一 skill 的评分差异大
  3. 更新后无回归检测:skill 作者修改 SKILL.md 后,审核员需要手动对比变化、重跑测试

Proposed Solution

用 agent-skill-infra 自动完成安装前质量评分:

pip install agent-skill-infra
skill-quality skill目录/SKILL.md --gh-models

三项能力:

  • skill-quality: 8 维度语义评分(0–100%)+ 可执行改进建议。GitHub Models gpt-4o-mini 免费跑,CJK 原生支持
  • skill-test: 行为测试(5 种判定器:keyword/schema/LLM/flow/snapshot)
  • skill-version: 版本 diff/回滚/基线对比——监控 skill 作者修改后是否有回归

Alternatives Considered

  • agent-skill-linter(17 条规则):只做格式校验,不做语义评估
  • OpenAI API:需付费 API key,CI 集成需额外配置 Secret
  • 纯关键词正则:无法正确处理 CJK 内容(已证伪)

Impact

  • UX: 审核员从"打开文件逐行阅读"变为"查看自动生成的评分 + 聚焦改进建议"
  • Deployment: pip install 单行命令,无架构变更
  • Observability: 每次评分产出 JSON 报告,可追踪技能质量趋势

Contract Or SDK Impact

无。agent-skill-infra 是独立 CLI 工具,不修改 SkillHub 的 API 或 SDK。仅在审核工作流中作为可选工具集成。

Metadata

Metadata

Assignees

No one assigned

    Labels

    effort/l大改动或高风险改动,需要 maintainer 负责 / Large or risky change requiring maintainer ownership.priority/p1高优先级 / High priority triage bucket.risk/high涉及安全、鉴权、迁移或公共契约 / Touches security, auth, migrations, or public contracts.triage/core交由 core maintainer 结合 AI 协同处理 / Issue should be handled by a core maintainer with AI support.

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions