Skip to content

Latest commit

 

History

History
143 lines (107 loc) · 10.4 KB

File metadata and controls

143 lines (107 loc) · 10.4 KB

Autonomous-Driving Learning Atlas

自动驾驶学习地图 — 一个以交互知识图谱为核心、面向博士级研究者的、中英双语的机器学习 / 强化学习 / 自动驾驶入门-进阶-前沿学习地图。

Pages Validate Labs smoke License: MIT (code) License: CC BY 4.0 (prose)

🌐 Live atlashttps://chatgpu.github.io/Autonomous-Driving-Learning-Atlas/

Atlas live site (graph + side panel)

点击图片直达"打开 UniAD 卡片"的可分享 permalink。当前图谱 541 节点 / 1568 条带类型边,内部交叉链接全部可跳转(0 条断链)。约 270 个 paradigm / insight / validation / move / problem / paper 节点附带手写深度卡片;其中的核心节点还各配一面「研究透镜」,逐条拆解它成立依赖的前提、失效的边界、一个可证伪的下一步实验,以及它在其它学科里的同型结构。

2x2 map of AD research paradigms

研究范式 2×2 地图:所有 spine 论文按 (modular ↔ E2E) × (data ↔ knowledge-driven) 摆位。


这是什么 / What is this

一个针对已具备 ML/CV 基础的自动驾驶研究者 / 博士生整理的、可交互的学习地图。它不是论文列表、不是综述、不是教程合集;它做三件事:

  1. 画出研究范式的全景图。 把 8 篇论文 + 3 个视频频道 + 2 门课 + 1 篇 Sutton 的短文(共 14 个 spine 节点),加上一组经典基石、平行路线与定位参考节点,在一张可交互的知识图谱里按 拓扑 / 时间轴 / playbook 三种视图组织起来。
  2. 每个节点配一张深度阅读卡片,核心节点再加一面「研究透镜」。 卡片包含 TL;DR · 数学锚点 · 架构直觉 · 工程实现 · 深度链接(PDF 页内锚 + 视频时间戳)· Bitter-Lesson 视角;研究透镜则进一步追问四件事——它成立依赖什么前提、在什么条件下会崩、可以用哪个可证伪的实验把它往前推或推翻、以及同一套结构在别的学科里出现在哪里。卡片底部不再堆砌泛泛的"洞察",只保留由关系网络直接给出的下一步线索(下游可读 / 上游组件 / 它正面回答的开放问题)。
  3. 每篇主线论文配一份可跑通的 lab。 11 个根目录 Jupyter 笔记本由 CI 用 Mock 后端跑一遍,全绿才算"全部跑通";涉及 LLM/VLM 的 lab 通过统一 llm_provider.py 抽象支持 OpenAI / Ollama / HF / Mock 四种后端。另有 3 份长程复现 demo 进驻 labs/<paradigm>/<lab_slug>/rl_decision/lab_dqn_ppo_sac_cartpole(DQN / PPO / SAC 同台对比 + 取消 target net 的发散 ablation)、world_models/lab_dreamer_cartpole_pixels(CartPole 像素观测下学世界模型再做 latent imagination)、rl_decision/lab_cql_offline_minigrid(CQL vs BC vs DQN,附 Q 值过估计可视化与 α 自调 ablation)。

风格定位:客观中立、专业但克制、有明确启发。每张卡片只在 Bitter-Lesson 视角 一节明确表态。


90 秒上手 / Quickstart

  1. 打开交互地图https://chatgpu.github.io/Autonomous-Driving-Learning-Atlas/

  2. 挑一条 playbook(按你已有背景):

    你的背景 推荐路径
    数学好但没碰过 RL Path A — 强化学习从零
    CV / 感知出身,要转 E2E AD Path B — 感知到端到端
    关心能效 / 类脑 / 部署 Path C — 类脑 & 高效 AD
    LLM / VLM / Agent 切入 AD Path D — LLM·VLM·VLA 范式
  3. 跑配套 labpip install -r labs/requirements.txt 后打开对应 notebook。所有 lab 默认用 Mock LLM 后端离线可跑;想用真实 LLM 时把环境变量 LLM_BACKEND 切成 openai / ollama / hf 即可。

一键云端:本仓库带 .devcontainer在 GitHub Codespaces 打开 即得到预装环境的 JupyterLab。每个 lab 顶部都有 Open in Colab 链接。


为什么要做成图,而不是列表 / Why a graph

研究范式的真正难点不在"哪些论文要读",而在"它们彼此什么关系"。本图谱把关系做成一等公民:

  • prereq(先修) · covers(讲解) · extends(扩展) · parallel(平行) · contrasts(争锋) · feeds(喂入) · implements(lab 实现)

这样你能:

  • playbook 预设 一键看清"我这条路要走过的最短子图";
  • 年份滑条 把 2017→2026 的研究范式变迁播成一段 6 秒的"小电影";
  • compare 模式(Shift-click 任意两节点)把两个方法的卡片并排对照;
  • 永久链接 ?node=paper:2212.10156&tab=links&playbook=B 把任意一刻的状态分享给同事。

paradigm timeline 2017-2026


资源分级 / Resource tiers

Tier 角色 视觉权重 卡片深度
Spine 用户提供的 14 项核心资料 厚边框、满色 完整模板(9 节)
Tier-S 经典基石 / 行业通用前置知识(Transformer、ViT、DETR、ResNet、GPT-3、PPO、DQN、DAgger、AlphaZero、BEVFormer 等) 中厚边框 完整讲解卡
Tier-A 平行创新 / 关键启发(VADv2、TransFuser、LLaVA、GAIA-1、DriveDreamer、DINOv2、SAM、Sutton-Barto、RLHF/DPO 等) 中等边框 聚焦“为什么和主线有关”的导读卡
Tier-B 联系较弱但提供宏观坐标(Mamba、Diffuser、CARLA/nuScenes/NAVSIM/Bench2Drive、LINGO-2、Tesla AI Day 等) 细边框 简短定位卡:告诉你何时需要继续深挖

完整节点目录详见 concepts.mddocs/data/graph.json


仓库结构 / Repo layout

Autonomous-Driving-Learning-Atlas/
├── README.md / AGENTS.md / LICENSE / LICENSE-CC / CITATION.cff
├── docs/                          # GitHub-Pages 根目录(交互站点)
│   ├── index.html · atlas3d.css
│   ├── js/                        # atlas-main · atlas-render · atlas-physics ·
│   │                              # atlas-cards (Mermaid + 研究透镜 + 结构导航) · math-katex
│   ├── vendor/                    # KaTeX + auto-render · Mermaid · DOMPurify · marked · Three.js
│   └── data/
│       ├── graph.json · schema.json
│       ├── graph_extended.json    # 541 节点 / 1568 边 (含 paradigm/insight/validation/move/problem)
│       ├── research_lens.json     # 核心节点的「研究透镜」(承重假设/失效边界/可证伪实验/同构迁移)
│       ├── layout_positions.json  # 由 tools/precompute_layout.py 预烤的稳定 3D 位置
│       ├── generated/             # 多维度生成轴(decision / foundation / methodology / perception / wave-E stubs)
│       └── cards/
│           ├── *.md               # spine + Tier-S 原始论文卡 (40 张)
│           └── extended/          # paradigm / insight / validation / move / problem / paper stub (200+ 张)
├── concepts.md                    # ~30 个原子概念表
├── playbooks/                     # Path A / B / C / D
├── labs/
│   ├── llm_provider.py            # OpenAI / Ollama / HF / Mock 四后端
│   ├── lab00 ... lab10            # 11 个根目录入门 lab,CI 用 Mock 跑
│   ├── RESTRUCTURE_PROPOSAL.md    # 长程重构方案:按范式分桶 + 标准目录契约
│   ├── rl_decision/
│   │   ├── lab_dqn_ppo_sac_cartpole/   # DQN / PPO / SAC + target-net ablation
│   │   └── lab_cql_offline_minigrid/   # CQL vs BC vs DQN + α 自调 ablation
│   └── world_models/
│       └── lab_dreamer_cartpole_pixels/ # CartPole 像素 RSSM + latent imagination
├── tools/
│   ├── validate_graph.py · check_links.py · lint_extended_cards.py
│   ├── audit_card_meta_language.py     # 扫描卡片里"元语言泄漏"短语
│   ├── merge_graph.py                  # seed + generated/*.json → graph_extended.json
│   ├── repair_extended_graph.py        # 重建 paradigm-validation-paper 与 problem 反向引用
│   ├── precompute_layout.py            # 预烤 3D 力学位置
│   └── post_wave_verify.sh             # 一键全套体检
└── .github/workflows/                  # Pages 部署 · 图谱校验 · lab 冒烟

贡献 / Contributing

  • 有想法、纠错、资源推荐或页面体验问题,优先开 Atlas feedback issue;这样讨论、证据、状态和后续 PR 都能追踪。
  • 修补深度链接、补充新概念、加 lab 都欢迎,请走 PR;CI 会校验图谱完整性 & lab 可跑性。
  • 采纳后的实质贡献可在对应卡片 front matter 里加入 contributors: ["@github-handle"],页面会自动显示贡献标注。
  • 更完整的流程见 CONTRIBUTING.md

引用 / Citation

学术使用请参考 CITATION.cff;代码 MIT、文字 CC BY 4.0。


*本图谱建立在 14 项一手资源之上,并围绕它们补上经典基石、平行路线和定位参考。每条边都试图回答一个问题:*这两件事到底什么关系?