- [2026.01.28]: 🚀 集成MindSpeed-RL训练框架,支持GRPO算法
- [2026.01.28]: 🚀 提供BaseEngineWrapper抽象接口,支持自定义Agent逻辑
AgentSDK提供分层解耦昇腾亲和的企业级智能体Agentic RL训推框架。 用于在昇腾NPU基础设施上构建、运行和扩展具有工具和多步推理能力的LLM Agent。 其整合Agent逻辑、工具调用可控等特点有助于Agentic应用开发者快速构建领域Agentic应用。
更多详情请查看简介。
│ __init__.py
│
├─base
│ │ __init__.py
│ │
│ ├─log
│ │ loggers.py
│ │ __init__.py
│ │
│ ├─utils
│ │ checker.py
│ │ class_loader.py
│ │ data_loader.py
│ │ file_utils.py
│ │ get_local_rank.py
│ │ logger_patch.py
│ │ ray_secure_init.py
│ │ __init__.py
│ │
│ └─weight_loaders
│ megatron_weight_loaders.py
│ __init__.py
│
├─configs
│ agentic_rl_config.py
│ ray_env_config.py
│ __init__.py
│
├─data_manager
│ data_manager.py
│ data_registry.py
│ data_transform.py
│ mindspeed_rl_data.py
│ __init__.py
│
├─memory
│ constants.py
│ memory_base.py
│ memory_config.py
│ memory_simple.py
│ memory_summary.py
│ prompts.py
│ summary_client.py
│ token_counter.py
│ utils.py
│ __init__.py
│
├─runner
│ │ runner_worker.py
│ │ __init__.py
│ │
│ ├─agent_engine_wrapper
│ │ base.py
│ │ base_engine_wrapper.py
│ │ __init__.py
│ │
│ └─infer_adapter
│ │ async_server.py
│ │ async_server_base.py
│ │ infer_registry.py
│ │ __init__.py
│ │
│ └─vllm
│ │ base_inference_engine.py
│ │ cache_manager.py
│ │ memory_manager.py
│ │ vllm_async_server.py
│ │ vllm_megatron_weight_loaders.py
│ │ vllm_worker.py
│ │ weight_manager.py
│ │ __init__.py
│ │
│ └─patch
│ ca_mem_sleep.py
│ worker_v1_sleep.py
│ __init__.py
│
└─trainer
│ main.py
│ __init__.py
│
├─rollout
│ rollout_worker.py
│ __init__.py
│
└─train_adapter
│ __init__.py
│
└─mindspeed_rl
│ agent_grpo_trainer.py
│ train_agent_grpo.py
│ __init__.py
│
├─configs
│ parse_config.py
│ __init__.py
│
├─patch
│ compute_utils.py
│ get_current_node_ip.py
│ grpo_actor_loss_func.py
│ launcher.py
| logprob_computer.py
│ __init__.py
│
└─workers
actor_hybrid_worker.py
integrated_worker.py
__init__.py
AgentSDK版本配套详情请参考:版本配套详情。
AgentSDK版本兼容信息请参考:版本兼容信息。
AgentSDK可通过源码进行安装。详细步骤请遵循安装指南。
通过运行一个完整的Agent Loop示例开始使用AgentSDK,该示例演示了工具定义、Agent执行和轨迹观察。快速入门包括创建自定义BaseEngineWrapper实现、配置训练参数和启动agentic_rl命令。
- AgentSDK环境变量使用,模型支持,后端支持请参考附录。
API参考详见:Python API 与 命令行 API。
相关FAQ请参考:FAQ。
- 使用API读取文件时,用户需要保证该文件的owner必须为自己,且权限不高于640,避免发生提权等安全问题。 外部下载的软件代码或程序可能存在风险,功能的安全性需由用户保证。
- 通信矩阵:目前Agent SDK开发套件包不会主动打开或者依赖任意端口,因此不涉及通信矩阵。
- 公网地址详见:公网地址,Agent SDK的安装包中的网址安装结束后会被清除,并不会访问,不会造成风险。
- 安全加固指南请参考:Agent SDK安全加固指南。
版本分支遵循定义的维护阶段:
| 状态 | 时间 | 说明 |
|---|---|---|
| 计划 | 1-3个月 | 特性规划 |
| 开发 | 3个月 | 新特性开发和问题修复,定期发布 |
| 维护 | 3-12个月 | 常规分支维护3个月,长期支持分支维护12个月。仅修复重大BUG,不加入新特性 |
| 生命周期终止(EOL) | N/A | 分支不再接受任何修改 |
| 版本 | 维护策略 | 当前状态 | 发布日期 | 后续状态 | EOL日期 |
|---|---|---|---|---|---|
| master | 长期支持 | 开发 | 在研分支,不发布 | 持续开发 | - |
| v26.0 | 常规分支 | 维护 | 2026-01-28 | 预计2026/4/28起进入无维护状态 | 2026-04-28 |
-
本仓库代码中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布前,这些分支不应被应用于任何生产环境或者依赖关键业务的项目中。请务必使用我们的正式发行版本,以确保代码的稳定性和安全性。 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。
-
版本更新说明请参考:更新说明。
AgentSDK以Mulan PSL v2许可证许可,对应许可证文本可查阅LICENSE。
AgentSDK docs目录下的文档适用CC-BY 4.0许可证,具体请参见LICENSE文件。
- 贡献前,请先签署开放项目贡献者许可协议(CLA)。
- 如果您遇到bug,请提交issue。
- 如果您计划贡献bug-fixes,请提交Pull Requests,参见具体要求。
- 如果您计划贡献新特性、功能,请先创建issue与我们讨论。写明需求背景/目的,如何设计,对现有API等的影响。未经讨论提交PR可能会导致请求被拒绝,因为项目演进方向可能与您的想法存在偏差。
- 更详细的贡献流程,请参考贡献指南。
欢迎大家为社区做贡献。如果有任何疑问或建议,请提交issue,我们会尽快回复。感谢您的支持。