可复用的 Claude Code Skills 集合,面向 AITER / CK (Composable Kernel) / ROCm GPU kernel 开发工作流。
agent_skill/
├── CLAUDE.md # 通用工作原则(输出语言、答案验证、ROCm 文档规范)
├── rocm-ref.2026.03.25.gz # ROCm 参考文档(ISA、指令集、硬件规格)
└── .claude/
└── skills/
├── dev-pipeline/ # 全流程开发 pipeline
│ └── SKILL.md
└── sync-ck-fmha/ # CK FMHA API 同步
└── SKILL.md
触发词:full pipeline、dev pipeline、spec and plan for、start pipeline
从需求到执行的完整 7 步工作流:
| 步骤 | 内容 | 方式 |
|---|---|---|
| 1 | Brainstorm,生成初版 spec (specs/*.md) |
自动(/superpowers:brainstorming) |
| 2 | 审查 spec,补充需求 | 人工 |
| 3 | Agent team 迭代(Spec Reviewer + Spec Writer,最多 3 轮) | 自动 |
| 4 | 主 agent 修小问题,列大决策请求确认 | 半自动 |
| 5 | 最终确认 spec | 人工(可跳过) |
| 6 | 生成可执行 plan (plans/*.md) |
自动(/superpowers:writing-plans) |
| 7 | 执行 plan | 自动(/superpowers:executing-plans) |
适用场景:开发新 feature、debug、做 research。支持"下班前给需求,隔天看结果"模式。
触发词:sync CK、update CK submodule、integrate CK PR、CK FMHA 变更
当 ROCm/rocm-libraries 中有 PR 修改了 CK 的 FMHA API(fmha_fwd / fmha_batch_prefill / fmha_fwd_splitkv 的 traits struct、args struct、kernel codegen)时,自动同步 AITER 调用链。
CK submodule 路径:3rdparty/composable_kernel(是 projects/composablekernel/ 的 subtree-split mirror)
cp -r .claude/skills/dev-pipeline ~/.claude/skills/
cp -r .claude/skills/sync-ck-fmha ~/.claude/skills/mkdir -p .claude/skills
cp -r /path/to/agent_skill/.claude/skills/dev-pipeline .claude/skills//dev-pipeline 优化 CK gemm kernel,支持 bf16,当前实现在 xxx.cpp,测试方法是 make test
/sync-ck-fmha PR#1234
rocm-ref.2026.03.25.gz 包含 ROCm ISA、硬件指令、GPU 规格等参考资料。
# 解压
mkdir -p /tmp/rocm-ref && tar -xzf rocm-ref.2026.03.25.gz -C /tmp/rocm-ref
# 查看索引
cat /tmp/rocm-ref/rocm-ref/INDEX.md根据 CLAUDE.md 中的规定,所有涉及 ROCm 硬件/指令的问题必须先查阅此文档再给出答案。
- 输出语言:所有输出使用中文
- 答案验证:所有结论必须经过查阅资料、联网搜索或查看代码验证
- ROCm 相关:必须先查阅
rocm-ref.2026.03.25.gz,未经验证不得输出