Skip to content

Ascend/AgentSDK

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

87 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AgentSDK

最新消息

  • [2026.01.28]: 🚀 集成MindSpeed-RL训练框架,支持GRPO算法
  • [2026.01.28]: 🚀 提供BaseEngineWrapper抽象接口,支持自定义Agent逻辑

简介

AgentSDK提供分层解耦昇腾亲和的企业级智能体Agentic RL训推框架。 用于在昇腾NPU基础设施上构建、运行和扩展具有工具和多步推理能力的LLM Agent。 其整合Agent逻辑、工具调用可控等特点有助于Agentic应用开发者快速构建领域Agentic应用。

更多详情请查看简介

Zread     DeepWiki

目录结构

│  __init__.py
│
├─base
│  │  __init__.py
│  │
│  ├─log
│  │      loggers.py
│  │      __init__.py
│  │
│  ├─utils
│  │      checker.py
│  │      class_loader.py
│  │      data_loader.py
│  │      file_utils.py
│  │      get_local_rank.py
│  │      logger_patch.py
│  │      ray_secure_init.py
│  │      __init__.py
│  │
│  └─weight_loaders
│          megatron_weight_loaders.py
│          __init__.py
│
├─configs
│      agentic_rl_config.py
│      ray_env_config.py
│      __init__.py
│
├─data_manager
│      data_manager.py
│      data_registry.py
│      data_transform.py
│      mindspeed_rl_data.py
│      __init__.py
│
├─memory
│      constants.py
│      memory_base.py
│      memory_config.py
│      memory_simple.py
│      memory_summary.py
│      prompts.py
│      summary_client.py
│      token_counter.py
│      utils.py
│      __init__.py
│
├─runner
│  │  runner_worker.py
│  │  __init__.py
│  │
│  ├─agent_engine_wrapper
│  │      base.py
│  │      base_engine_wrapper.py
│  │      __init__.py
│  │
│  └─infer_adapter
│      │  async_server.py
│      │  async_server_base.py
│      │  infer_registry.py
│      │  __init__.py
│      │
│      └─vllm
│          │  base_inference_engine.py
│          │  cache_manager.py
│          │  memory_manager.py
│          │  vllm_async_server.py
│          │  vllm_megatron_weight_loaders.py
│          │  vllm_worker.py
│          │  weight_manager.py
│          │  __init__.py
│          │
│          └─patch
│                  ca_mem_sleep.py
│                  worker_v1_sleep.py
│                  __init__.py
│
└─trainer
    │  main.py
    │  __init__.py
    │
    ├─rollout
    │      rollout_worker.py
    │      __init__.py
    │
    └─train_adapter
        │  __init__.py
        │
        └─mindspeed_rl
            │  agent_grpo_trainer.py
            │  train_agent_grpo.py
            │  __init__.py
            │
            ├─configs
            │      parse_config.py
            │      __init__.py
            │
            ├─patch
            │      compute_utils.py
            │      get_current_node_ip.py
            │      grpo_actor_loss_func.py
            │      launcher.py
            |      logprob_computer.py
            │      __init__.py
            │
            └─workers
                    actor_hybrid_worker.py
                    integrated_worker.py
                    __init__.py

版本说明

AgentSDK版本配套详情请参考:版本配套详情

兼容性信息

AgentSDK版本兼容信息请参考:版本兼容信息

环境部署

AgentSDK可通过源码进行安装。详细步骤请遵循安装指南

快速入门

通过运行一个完整的Agent Loop示例开始使用AgentSDK,该示例演示了工具定义、Agent执行和轨迹观察。快速入门包括创建自定义BaseEngineWrapper实现、配置训练参数和启动agentic_rl命令。

特性介绍

  • AgentSDK环境变量使用,模型支持,后端支持请参考附录

API参考

API参考详见:Python API命令行 API

FAQ

相关FAQ请参考:FAQ

安全声明

  • 使用API读取文件时,用户需要保证该文件的owner必须为自己,且权限不高于640,避免发生提权等安全问题。 外部下载的软件代码或程序可能存在风险,功能的安全性需由用户保证。
  • 通信矩阵:目前Agent SDK开发套件包不会主动打开或者依赖任意端口,因此不涉及通信矩阵。
  • 公网地址详见:公网地址,Agent SDK的安装包中的网址安装结束后会被清除,并不会访问,不会造成风险。
  • 安全加固指南请参考:Agent SDK安全加固指南

分支维护策略

版本分支遵循定义的维护阶段:

状态 时间 说明
计划 1-3个月 特性规划
开发 3个月 新特性开发和问题修复,定期发布
维护 3-12个月 常规分支维护3个月,长期支持分支维护12个月。仅修复重大BUG,不加入新特性
生命周期终止(EOL) N/A 分支不再接受任何修改

版本维护策略

版本 维护策略 当前状态 发布日期 后续状态 EOL日期
master 长期支持 开发 在研分支,不发布 持续开发 -
v26.0 常规分支 维护 2026-01-28 预计2026/4/28起进入无维护状态 2026-04-28

免责声明

  • 本仓库代码中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布前,这些分支不应被应用于任何生产环境或者依赖关键业务的项目中。请务必使用我们的正式发行版本,以确保代码的稳定性和安全性。 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。

  • 版本更新说明请参考:更新说明

License

AgentSDK以Mulan PSL v2许可证许可,对应许可证文本可查阅LICENSE

AgentSDK docs目录下的文档适用CC-BY 4.0许可证,具体请参见LICENSE文件。

贡献声明

  • 贡献前,请先签署开放项目贡献者许可协议(CLA)
  • 如果您遇到bug,请提交issue
  • 如果您计划贡献bug-fixes,请提交Pull Requests,参见具体要求
  • 如果您计划贡献新特性、功能,请先创建issue与我们讨论。写明需求背景/目的,如何设计,对现有API等的影响。未经讨论提交PR可能会导致请求被拒绝,因为项目演进方向可能与您的想法存在偏差。
  • 更详细的贡献流程,请参考贡献指南

建议与交流

欢迎大家为社区做贡献。如果有任何疑问或建议,请提交issue,我们会尽快回复。感谢您的支持。

About

No description, website, or topics provided.

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors