From 2353e4aad4abed161aa1107a4999774287652239 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:08:30 +0800 Subject: [PATCH 01/48] feat(site): register cards content collection + zod schema Co-Authored-By: Claude Sonnet 4.6 --- site/src/content.config.ts | 33 ++++++++++++++++++++- site/src/content/cards/en/chapters/.gitkeep | 0 site/src/content/cards/en/concepts/.gitkeep | 0 site/src/content/cards/en/entities/.gitkeep | 0 site/src/content/cards/en/sources/.gitkeep | 0 site/src/content/cards/zh/chapters/.gitkeep | 0 site/src/content/cards/zh/concepts/.gitkeep | 0 site/src/content/cards/zh/entities/.gitkeep | 0 site/src/content/cards/zh/sources/.gitkeep | 0 9 files changed, 32 insertions(+), 1 deletion(-) create mode 100644 site/src/content/cards/en/chapters/.gitkeep create mode 100644 site/src/content/cards/en/concepts/.gitkeep create mode 100644 site/src/content/cards/en/entities/.gitkeep create mode 100644 site/src/content/cards/en/sources/.gitkeep create mode 100644 site/src/content/cards/zh/chapters/.gitkeep create mode 100644 site/src/content/cards/zh/concepts/.gitkeep create mode 100644 site/src/content/cards/zh/entities/.gitkeep create mode 100644 site/src/content/cards/zh/sources/.gitkeep diff --git a/site/src/content.config.ts b/site/src/content.config.ts index 74cabea..14eaadb 100644 --- a/site/src/content.config.ts +++ b/site/src/content.config.ts @@ -57,4 +57,35 @@ const wiki = defineCollection({ .passthrough(), }); -export const collections = { mm, lab, wiki }; +/** + * One-shot cards (TL;DR 一图流) for every main-content page. + * Entries live at `src/content/cards/{lang}/{kind}/{slug}.mdx`. + * Consumed by `` in atlas grid, detail + * page splash, and CardTrigger modal overlays. Free-form MDX body — the + * component shell imposes the A4-vertical frame, palette, seal, and + * overflow:hidden; authors pick the layout inside. + */ +const cards = defineCollection({ + loader: glob({ + pattern: "{en,zh}/{concepts,entities,sources,chapters}/*.mdx", + base: "./src/content/cards", + }), + schema: z + .object({ + schema: z.literal("one-shot-card/v1"), + kind: z.enum(["concept", "entity", "source", "chapter"]), + slug: z.string(), + title: z.string(), + titleAlt: z.string().optional(), + seal: z.string().optional(), + tagline: z.string().optional(), + refs: z.array(z.string()).optional(), + sourceLine: z.string().optional(), + author: z.string().optional(), + year: z.union([z.string(), z.number()]).optional(), + url: z.string().url().optional(), + }) + .passthrough(), +}); + +export const collections = { mm, lab, wiki, cards }; diff --git a/site/src/content/cards/en/chapters/.gitkeep b/site/src/content/cards/en/chapters/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/en/concepts/.gitkeep b/site/src/content/cards/en/concepts/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/en/entities/.gitkeep b/site/src/content/cards/en/entities/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/en/sources/.gitkeep b/site/src/content/cards/en/sources/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/zh/chapters/.gitkeep b/site/src/content/cards/zh/chapters/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/zh/concepts/.gitkeep b/site/src/content/cards/zh/concepts/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/zh/entities/.gitkeep b/site/src/content/cards/zh/entities/.gitkeep new file mode 100644 index 0000000..e69de29 diff --git a/site/src/content/cards/zh/sources/.gitkeep b/site/src/content/cards/zh/sources/.gitkeep new file mode 100644 index 0000000..e69de29 From 216e22e165a268d6e1adb534f026fb814fd0060d Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:12:58 +0800 Subject: [PATCH 02/48] =?UTF-8?q?fix(site):=20rename=20\`schema\`=20?= =?UTF-8?q?=E2=86=92=20\`schemaVersion\`,=20drop=20\`slug\`,=20pluralize?= =?UTF-8?q?=20\`kind\`=20in=20cards=20collection?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Code review feedback from T1 reviewer: - slug redundant (derivable from entry.id, matches mm/lab/wiki pattern) - schema collides with Astro's own schema concept - kind singular/plural mismatch with folder names Co-Authored-By: Claude Sonnet 4.6 --- site/src/content.config.ts | 5 ++--- 1 file changed, 2 insertions(+), 3 deletions(-) diff --git a/site/src/content.config.ts b/site/src/content.config.ts index 14eaadb..962f06f 100644 --- a/site/src/content.config.ts +++ b/site/src/content.config.ts @@ -72,9 +72,8 @@ const cards = defineCollection({ }), schema: z .object({ - schema: z.literal("one-shot-card/v1"), - kind: z.enum(["concept", "entity", "source", "chapter"]), - slug: z.string(), + schemaVersion: z.literal("one-shot-card/v1"), + kind: z.enum(["concepts", "entities", "sources", "chapters"]), title: z.string(), titleAlt: z.string().optional(), seal: z.string().optional(), From 3d644bce6bd02826b3d8293a1992c044c84d7835 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:15:09 +0800 Subject: [PATCH 03/48] fix(site): drop `kind` field from cards schema (derivable from entry.id) MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Second round of code-review feedback: `kind` duplicates path info the same way the previously-removed `slug` did. Match the `wiki` collection pattern — kind derives from entry.id at query time. --- site/src/content.config.ts | 1 - 1 file changed, 1 deletion(-) diff --git a/site/src/content.config.ts b/site/src/content.config.ts index 962f06f..724b093 100644 --- a/site/src/content.config.ts +++ b/site/src/content.config.ts @@ -73,7 +73,6 @@ const cards = defineCollection({ schema: z .object({ schemaVersion: z.literal("one-shot-card/v1"), - kind: z.enum(["concepts", "entities", "sources", "chapters"]), title: z.string(), titleAlt: z.string().optional(), seal: z.string().optional(), From 3160e7ffa33e51410e31aed740abfa2c05f26aec Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:18:12 +0800 Subject: [PATCH 04/48] feat(site): OneShotCard shell (full/mini variants, A4 frame, palette-locked) Co-Authored-By: Claude Sonnet 4.6 --- site/src/components/card/OneShotCard.astro | 264 +++++++++++++++++++++ 1 file changed, 264 insertions(+) create mode 100644 site/src/components/card/OneShotCard.astro diff --git a/site/src/components/card/OneShotCard.astro b/site/src/components/card/OneShotCard.astro new file mode 100644 index 0000000..b1b0df5 --- /dev/null +++ b/site/src/components/card/OneShotCard.astro @@ -0,0 +1,264 @@ +--- +/** + * The universal "one-shot card" — a TL;DR poster for any main-content + * page (wiki concepts/entities/sources, mm chapters). Two render + * variants: + * - `full` (default): A4 vertical, body visible, used in detail-page + * splash and modal overlays. + * - `mini`: 4:5 portrait, body hidden, header-only, used in atlas grid. + * + * The shell locks the frame (aspect-ratio, overflow:hidden, palette); + * the MDX body inside the default slot is free-form. Authors / AI can + * use the block kit under `./blocks/` or drop any Astro component / HTML. + * + * `kind` and `slug` are derived from `entry.id` (format: `{lang}/{kind}/{slug}`), + * matching how `wiki`, `mm`, `lab` collections handle identity. The + * frontmatter schema therefore does NOT include `kind` or `slug`. + */ +import { getEntry, render } from "astro:content"; + +interface Props { + /** + * Either pass `of="{kind}/{slug}"` (plural kind, e.g. "concepts/causal-dag") + * to load the card from the collection, or pass frontmatter fields + * directly as props (for inline / test use). + */ + of?: string; + /** Override language; defaults to Astro.params.lang */ + lang?: "en" | "zh"; + variant?: "full" | "mini"; + /** Fallback props when not loading from collection */ + kind?: "concepts" | "entities" | "sources" | "chapters"; + slug?: string; + title?: string; + titleAlt?: string; + tagline?: string; + seal?: string; + refs?: string[]; + sourceLine?: string; + author?: string; + year?: string | number; + url?: string; +} + +const props = Astro.props as Props; +const variant = props.variant ?? "full"; +const lang = props.lang ?? (Astro.params as any)?.lang ?? "zh"; + +// Resolve card: either load from collection via `of`, or use literal props. +let data: any; +let Content: any = null; +let kind: string; +let slug: string; + +if (props.of) { + [kind, slug] = props.of.split("/"); + const entry = await getEntry("cards", `${lang}/${kind}/${slug}` as any); + if (!entry) { + throw new Error(`[OneShotCard] missing card: ${lang}/${kind}/${slug}`); + } + data = entry.data; + const rendered = await render(entry); + Content = rendered.Content; +} else { + kind = props.kind ?? "concepts"; + slug = props.slug ?? ""; + data = props; +} + +const sealChar = + data.seal ?? + ({ concepts: "念", entities: "实", sources: "源", chapters: "篇" } as const)[ + kind as "concepts" + ] ?? + "·"; + +const kindLabel = + lang === "zh" + ? ({ concepts: "概念", entities: "实体", sources: "源头", chapters: "章节" } as const)[ + kind as "concepts" + ] + : ({ concepts: "Concept", entities: "Entity", sources: "Source", chapters: "Chapter" } as const)[ + kind as "concepts" + ]; +--- + +
+
+ {kindLabel} + +
+ +
+

{data.title}

+ {data.titleAlt &&
{data.titleAlt}
} + {data.tagline &&

{data.tagline}

} +
+ + { + variant === "full" && ( +
+ {Content ? : } +
+ ) + } + +
+ { + data.refs && data.refs.length > 0 && ( +
    + {data.refs.slice(0, 4).map((r: string) => ( +
  • {r}
  • + ))} +
+ ) + } + {data.sourceLine &&

{data.sourceLine}

} +
+
+ + From 1a41d8de5108a2c5d41fd7d10070aa8cb778f699 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:20:34 +0800 Subject: [PATCH 05/48] =?UTF-8?q?feat(site):=20causal-dag.zh.mdx=20?= =?UTF-8?q?=E2=80=94=20first=20one-shot=20card=20sample?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../content/cards/zh/concepts/causal-dag.mdx | 17 +++++++++++++++++ 1 file changed, 17 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/causal-dag.mdx diff --git a/site/src/content/cards/zh/concepts/causal-dag.mdx b/site/src/content/cards/zh/concepts/causal-dag.mdx new file mode 100644 index 0000000..2bfd343 --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-dag.mdx @@ -0,0 +1,17 @@ +--- +schemaVersion: one-shot-card/v1 +title: 因果有向无环图 +titleAlt: Causal DAG +tagline: 链 / 叉 / 对撞 · d-分离 · 去混淆的桥 +refs: + - concepts/structural-causal-model + - concepts/do-calculus +sourceLine: 参 Pearl (2009); Book of Why (2018) +--- + +**三种连接模式** — 链 `A → B → C` / 叉 `A ← B → C` / 对撞 `A → B ← C`; +条件化中间节点对前两者阻断路径,对对撞反而打开。 + +**d-分离** — 给定变量集 Z 阻断 X→Y 的所有路径时,X ⊥ Y | Z。DAG 上判定条件独立的图论准则。 + +**去混淆** — 后门 / 前门调整,观测数据到因果估计的桥。后门要求 Z 阻断所有后门路径且不含 X 的后代。 From a8aea0e2130eb259180eeda9068a8c4ab071b57d Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:22:21 +0800 Subject: [PATCH 06/48] feat(site): wire OneShotCard splash onto wiki detail page --- .../src/pages/[lang]/wiki/[kind]/[slug].astro | 20 ++++++++++++++++++- 1 file changed, 19 insertions(+), 1 deletion(-) diff --git a/site/src/pages/[lang]/wiki/[kind]/[slug].astro b/site/src/pages/[lang]/wiki/[kind]/[slug].astro index b28e935..a3a9543 100644 --- a/site/src/pages/[lang]/wiki/[kind]/[slug].astro +++ b/site/src/pages/[lang]/wiki/[kind]/[slug].astro @@ -1,6 +1,7 @@ --- import { getCollection, render } from "astro:content"; import Hall from "~/layouts/Hall.astro"; +import OneShotCard from "~/components/card/OneShotCard.astro"; import type { Locale } from "~/i18n/strings"; import { wiki as wikiIndex } from "~/lib/urls"; import manifest from "~/content/wiki/_manifest.json"; @@ -36,6 +37,12 @@ const entry = all.find((e) => e.id === entryId); if (!entry) throw new Error(`unknown wiki entry: ${entryId}`); const { Content } = await render(entry); +// Look up a matching one-shot card for this wiki entry. Card +// entry.id format mirrors the URL: `{lang}/{kind}/{slug}`. +const cardEntries = await getCollection("cards"); +const cardEntryId = `${lang}/${kind}/${slug}`; +const hasCard = cardEntries.some((c) => c.id === cardEntryId); + const meta = entries.find((e) => e.kind === kind && e.slug === slug); const kindLabel = lang === "zh" ? ({ concepts: "概念", entities: "实体", sources: "源头" } as const)[kind as "concepts"] @@ -57,7 +64,13 @@ const kindLabel = lang === "zh"
- {meta?.card && {meta.title}} + {hasCard ? ( +
+ +
+ ) : meta?.card ? ( + {meta.title} + ) : null}
@@ -80,6 +93,11 @@ const kindLabel = lang === "zh" max-width: min(100%, 360px); margin: 0 0 2em; } + .wiki-page__oneshot { + margin: 0 0 2.4em; + display: flex; + justify-content: flex-start; + } .wiki-page .reader__body { max-width: var(--measure); } From 748947f9877e935b95d36fa4116f7955dbc84178 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:26:08 +0800 Subject: [PATCH 07/48] feat(site): card block kit (PillarGrid/Pillar/KV/Formula/Quote/Caption/Chip/Divider/Stack) --- site/src/components/card/blocks/Caption.astro | 12 +++++++ site/src/components/card/blocks/Chip.astro | 21 +++++++++++ site/src/components/card/blocks/Divider.astro | 25 +++++++++++++ site/src/components/card/blocks/Formula.astro | 12 +++++++ site/src/components/card/blocks/KV.astro | 31 ++++++++++++++++ site/src/components/card/blocks/Pillar.astro | 35 +++++++++++++++++++ .../components/card/blocks/PillarGrid.astro | 15 ++++++++ site/src/components/card/blocks/Quote.astro | 28 +++++++++++++++ site/src/components/card/blocks/Stack.astro | 14 ++++++++ site/src/components/card/blocks/index.ts | 6 ++++ 10 files changed, 199 insertions(+) create mode 100644 site/src/components/card/blocks/Caption.astro create mode 100644 site/src/components/card/blocks/Chip.astro create mode 100644 site/src/components/card/blocks/Divider.astro create mode 100644 site/src/components/card/blocks/Formula.astro create mode 100644 site/src/components/card/blocks/KV.astro create mode 100644 site/src/components/card/blocks/Pillar.astro create mode 100644 site/src/components/card/blocks/PillarGrid.astro create mode 100644 site/src/components/card/blocks/Quote.astro create mode 100644 site/src/components/card/blocks/Stack.astro create mode 100644 site/src/components/card/blocks/index.ts diff --git a/site/src/components/card/blocks/Caption.astro b/site/src/components/card/blocks/Caption.astro new file mode 100644 index 0000000..12c9a13 --- /dev/null +++ b/site/src/components/card/blocks/Caption.astro @@ -0,0 +1,12 @@ +--- +--- +

+ diff --git a/site/src/components/card/blocks/Chip.astro b/site/src/components/card/blocks/Chip.astro new file mode 100644 index 0000000..9278569 --- /dev/null +++ b/site/src/components/card/blocks/Chip.astro @@ -0,0 +1,21 @@ +--- +interface Props { tone?: "vermilion" | "gold" | "celadon" | "ink"; } +const { tone = "ink" } = Astro.props as Props; +--- + + diff --git a/site/src/components/card/blocks/Divider.astro b/site/src/components/card/blocks/Divider.astro new file mode 100644 index 0000000..0fc7862 --- /dev/null +++ b/site/src/components/card/blocks/Divider.astro @@ -0,0 +1,25 @@ +--- +interface Props { dot?: boolean; } +const { dot = true } = Astro.props as Props; +--- +
+ diff --git a/site/src/components/card/blocks/Formula.astro b/site/src/components/card/blocks/Formula.astro new file mode 100644 index 0000000..070af71 --- /dev/null +++ b/site/src/components/card/blocks/Formula.astro @@ -0,0 +1,12 @@ +--- +--- +
+ diff --git a/site/src/components/card/blocks/KV.astro b/site/src/components/card/blocks/KV.astro new file mode 100644 index 0000000..58a3e8e --- /dev/null +++ b/site/src/components/card/blocks/KV.astro @@ -0,0 +1,31 @@ +--- +interface Props { label: string; } +const { label } = Astro.props as Props; +--- +
+
{label}
+
+
+ diff --git a/site/src/components/card/blocks/Pillar.astro b/site/src/components/card/blocks/Pillar.astro new file mode 100644 index 0000000..11c9919 --- /dev/null +++ b/site/src/components/card/blocks/Pillar.astro @@ -0,0 +1,35 @@ +--- +interface Props { label?: string; } +const { label } = Astro.props as Props; +--- +
+ {label &&
{label}
} +
+
+ diff --git a/site/src/components/card/blocks/PillarGrid.astro b/site/src/components/card/blocks/PillarGrid.astro new file mode 100644 index 0000000..8da9ff8 --- /dev/null +++ b/site/src/components/card/blocks/PillarGrid.astro @@ -0,0 +1,15 @@ +--- +interface Props { cols?: 2 | 3 | 4; } +const { cols = 3 } = Astro.props as Props; +--- +
+ +
+ diff --git a/site/src/components/card/blocks/Quote.astro b/site/src/components/card/blocks/Quote.astro new file mode 100644 index 0000000..5e7f33e --- /dev/null +++ b/site/src/components/card/blocks/Quote.astro @@ -0,0 +1,28 @@ +--- +interface Props { cite?: string; } +const { cite } = Astro.props as Props; +--- +
+
+ {cite &&
— {cite}
} +
+ diff --git a/site/src/components/card/blocks/Stack.astro b/site/src/components/card/blocks/Stack.astro new file mode 100644 index 0000000..ef1a7ea --- /dev/null +++ b/site/src/components/card/blocks/Stack.astro @@ -0,0 +1,14 @@ +--- +interface Props { gap?: number; } +const { gap = 10 } = Astro.props as Props; +--- +
+ +
+ diff --git a/site/src/components/card/blocks/index.ts b/site/src/components/card/blocks/index.ts new file mode 100644 index 0000000..b596bfe --- /dev/null +++ b/site/src/components/card/blocks/index.ts @@ -0,0 +1,6 @@ +/** + * Block kit for OneShotCard MDX bodies. Import individually in MDX: + * import Pillar from '~/components/card/blocks/Pillar.astro'; + * or auto-imported via MDX components provider (see docs/.../exemplars). + */ +export {}; From 73335184c7edd673d1e77a8f982138b02886b06a Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:27:12 +0800 Subject: [PATCH 08/48] feat(site): upgrade causal-dag sample to use block kit --- .../content/cards/zh/concepts/causal-dag.mdx | 18 ++++++++++++++---- 1 file changed, 14 insertions(+), 4 deletions(-) diff --git a/site/src/content/cards/zh/concepts/causal-dag.mdx b/site/src/content/cards/zh/concepts/causal-dag.mdx index 2bfd343..a07ffdf 100644 --- a/site/src/content/cards/zh/concepts/causal-dag.mdx +++ b/site/src/content/cards/zh/concepts/causal-dag.mdx @@ -9,9 +9,19 @@ refs: sourceLine: 参 Pearl (2009); Book of Why (2018) --- -**三种连接模式** — 链 `A → B → C` / 叉 `A ← B → C` / 对撞 `A → B ← C`; -条件化中间节点对前两者阻断路径,对对撞反而打开。 +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; +import Divider from '~/components/card/blocks/Divider.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; -**d-分离** — 给定变量集 Z 阻断 X→Y 的所有路径时,X ⊥ Y | Z。DAG 上判定条件独立的图论准则。 + + `A → B → C`
条件化 B 阻断
+ `A ← B → C`
B 是混淆因子
+ `A → B ← C`
条件化反而打开
+
-**去混淆** — 后门 / 前门调整,观测数据到因果估计的桥。后门要求 Z 阻断所有后门路径且不含 X 的后代。 + + +**d-分离** — 给定 Z 阻断 X→Y 的所有路径 ⇒ X ⊥ Y | Z。 + +P(Y | do(X)) = Σz P(Y | X, Z=z) P(Z=z) From 64f2d4ccacd29cb353c620e9ce414bb45d16c619 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:29:51 +0800 Subject: [PATCH 09/48] feat(site): atlas grid mini OneShotCard for samples (PNG fallback preserved) --- site/src/components/WikiAtlas.astro | 84 ++++++++++++++++++++--------- 1 file changed, 58 insertions(+), 26 deletions(-) diff --git a/site/src/components/WikiAtlas.astro b/site/src/components/WikiAtlas.astro index 323940b..bf85765 100644 --- a/site/src/components/WikiAtlas.astro +++ b/site/src/components/WikiAtlas.astro @@ -18,6 +18,8 @@ import type { Locale } from "~/i18n/strings"; import { wikiEntry } from "~/lib/urls"; import manifest from "~/content/wiki/_manifest.json"; +import { getCollection } from "astro:content"; +import OneShotCard from "~/components/card/OneShotCard.astro"; interface ManifestEntry { kind: "concepts" | "entities" | "sources"; @@ -45,6 +47,9 @@ const labels = locale === "zh" ? { concepts: "概念", entities: "实体", sources: "源头", all: "全部", random: "抽卡", cards: "展陈", index: "目录" } : { concepts: "Concepts", entities: "Entities", sources: "Sources", all: "All", random: "Draw", cards: "Exhibits", index: "Index" }; +const oneShotEntries = await getCollection("cards"); +const cardEntryIds = new Set(oneShotEntries.map((c) => c.id)); + // Cards section = concepts + entities (image-forward) const cardEntries = [...byKind.concepts, ...byKind.entities].sort((a, b) => a.slug.localeCompare(b.slug)); --- @@ -87,32 +92,43 @@ const cardEntries = [...byKind.concepts, ...byKind.entities].sort((a, b) => a.sl @@ -572,6 +588,22 @@ const cardEntries = [...byKind.concepts, ...byKind.entities].sort((a, b) => a.sl .atlas-card--concepts .atlas-card__tag .seal { background: var(--celadon); } .atlas-card--entities .atlas-card__tag .seal { background: var(--gold); } + .atlas-card--oneshot { + background: transparent; + border: 0; + padding: 0; + display: block; + } + .atlas-card--oneshot::after { display: none; } + .atlas-card__oneshot { + width: 100%; + height: 100%; + display: flex; + } + .atlas-card--oneshot:hover { + transform: translateY(-4px); + } + .atlas-card__meta { position: relative; margin-top: auto; From 91cb89417102b2594ecc9d10cb249d3e79ffe2ca Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:32:19 +0800 Subject: [PATCH 10/48] =?UTF-8?q?feat(site):=204=20=E5=BC=82=E8=B4=A8=20on?= =?UTF-8?q?e-shot-card=20samples=20(do-calculus/judea-pearl/anthropic-ctx-?= =?UTF-8?q?eng/ch-02-cybernetics)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/chapters/ch-02-cybernetics.mdx | 23 +++++++++++++++++ .../content/cards/zh/concepts/do-calculus.mdx | 22 ++++++++++++++++ .../content/cards/zh/entities/judea-pearl.mdx | 22 ++++++++++++++++ ...nthropic-effective-context-engineering.mdx | 25 +++++++++++++++++++ 4 files changed, 92 insertions(+) create mode 100644 site/src/content/cards/zh/chapters/ch-02-cybernetics.mdx create mode 100644 site/src/content/cards/zh/concepts/do-calculus.mdx create mode 100644 site/src/content/cards/zh/entities/judea-pearl.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx diff --git a/site/src/content/cards/zh/chapters/ch-02-cybernetics.mdx b/site/src/content/cards/zh/chapters/ch-02-cybernetics.mdx new file mode 100644 index 0000000..4fed720 --- /dev/null +++ b/site/src/content/cards/zh/chapters/ch-02-cybernetics.mdx @@ -0,0 +1,23 @@ +--- +schemaVersion: one-shot-card/v1 +title: 控制论 +titleAlt: Cybernetics · 篇 II +tagline: 舵手 · 反馈 · 必要多样性 —— 系统如何在扰动里保持方向 +refs: + - concepts/requisite-variety + - concepts/feedback-loop +sourceLine: 心智七篇 · 篇 II +--- + +import Stack from '~/components/card/blocks/Stack.astro'; +import Divider from '~/components/card/blocks/Divider.astro'; + + +
**舵手** — 设定航向的是舵手不是舵;模型是舵,harness 是舵手。
+
**反馈** — 观测 → 误差 → 修正;没有反馈环的 agent 无法收敛。
+
**必要多样性** (Ashby) — 控制器的复杂度必须不小于被控系统;越难的域需要越会 reason 的 agent。
+
+ + + +**二阶控制** — 当外界扰动超出一阶环的纠偏范围,让一阶目标本身变为变量。 diff --git a/site/src/content/cards/zh/concepts/do-calculus.mdx b/site/src/content/cards/zh/concepts/do-calculus.mdx new file mode 100644 index 0000000..04833b7 --- /dev/null +++ b/site/src/content/cards/zh/concepts/do-calculus.mdx @@ -0,0 +1,22 @@ +--- +schemaVersion: one-shot-card/v1 +title: do 演算 +titleAlt: do-Calculus +tagline: Pearl 的三条规则 —— 把因果查询还原为可估计的观测表达式 +refs: + - concepts/causal-dag + - concepts/structural-causal-model +sourceLine: Pearl (1995, 2009); Shpitser & Pearl (2006) +--- + +import Stack from '~/components/card/blocks/Stack.astro'; +import KV from '~/components/card/blocks/KV.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 插入/删除观测 —— 若 Y ⊥ Z | X, W 在 G(X̄) 中成立 + 动作 ↔ 观测 —— 若 Y ⊥ Z | X, W 在 G(X̄, Z̲) 中成立 + 插入/删除动作 —— 若 Y ⊥ Z | X, W 在 G(X̄, Z̄(W)) 中成立 + + +P(y | do(x)) = Σz P(y | x, z) P(z) diff --git a/site/src/content/cards/zh/entities/judea-pearl.mdx b/site/src/content/cards/zh/entities/judea-pearl.mdx new file mode 100644 index 0000000..fa55b8c --- /dev/null +++ b/site/src/content/cards/zh/entities/judea-pearl.mdx @@ -0,0 +1,22 @@ +--- +schemaVersion: one-shot-card/v1 +title: Judea Pearl +tagline: 因果革命的奠基者 · 图灵奖 2011 · UCLA CS 教授 +refs: + - concepts/causal-dag + - concepts/do-calculus +sourceLine: Causality (2009); The Book of Why (2018) +--- + +import KV from '~/components/card/blocks/KV.astro'; +import Stack from '~/components/card/blocks/Stack.astro'; +import Caption from '~/components/card/blocks/Caption.astro'; + + + 1936— + UCLA Computer Science + 2011 "因果与概率推理基础性贡献" + 结构因果模型 · do 演算 · 因果之梯 + + +把因果推理从哲学思辨提升为可操作的数学学科。 diff --git a/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx new file mode 100644 index 0000000..a78f702 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx @@ -0,0 +1,25 @@ +--- +schemaVersion: one-shot-card/v1 +title: Effective Context Engineering for AI Agents +tagline: Anthropic 官方 · 长时程 agent 的上下文工程总论 +author: Anthropic Applied AI team +year: 2026 +url: https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents +refs: + - concepts/context-engineering + - concepts/context-rot +sourceLine: Anthropic Engineering, July 2026 +--- + +import Quote from '~/components/card/blocks/Quote.astro'; +import Stack from '~/components/card/blocks/Stack.astro'; + + + 注意力预算是稀缺资源 —— just-in-time、compaction、note-taking、sub-agent 是四种抵御 context rot 的工程手法。 + + + +
**① just-in-time context** — 按需注入而非 upfront 堆砌
+
**② compaction** — 旧轮次摘要化;保留结构,丢弃细节
+
**③ note-taking** — agent 自持外部笔记,跨 session 回忆
+
From be34f9dfda7fda921845582900d7f1436cde9ca6 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:34:25 +0800 Subject: [PATCH 11/48] feat(site): CardTrigger chip + CardModal singleton overlay --- site/src/components/card/CardModal.astro | 112 +++++++++++++++++++++ site/src/components/card/CardTrigger.astro | 81 +++++++++++++++ 2 files changed, 193 insertions(+) create mode 100644 site/src/components/card/CardModal.astro create mode 100644 site/src/components/card/CardTrigger.astro diff --git a/site/src/components/card/CardModal.astro b/site/src/components/card/CardModal.astro new file mode 100644 index 0000000..61889ab --- /dev/null +++ b/site/src/components/card/CardModal.astro @@ -0,0 +1,112 @@ +--- +/** + * Singleton modal overlay for CardTriggers. Mounted once (in Hall.astro + * via a slot or direct include) so any CardTrigger on the page can + * surface a card through it. Listens for clicks on elements with class + * `card-trigger` + `data-card-of` / `data-card-lang` attributes. Content + * is fetched from `/card-fragment/{lang}/{kind}/{slug}` — a layout-less + * server-rendered route created in T10. + */ +--- + + + + + + diff --git a/site/src/components/card/CardTrigger.astro b/site/src/components/card/CardTrigger.astro new file mode 100644 index 0000000..dd8b68f --- /dev/null +++ b/site/src/components/card/CardTrigger.astro @@ -0,0 +1,81 @@ +--- +/** + * Inline "trigger" for a one-shot card. Rendered as a small印章-like chip + * you can drop into any prose (md / mdx). Clicking opens the global + * CardModal overlay with the full card. The modal itself is mounted + * once in Hall.astro; the trigger just dispatches a click captured by + * CardModal's global listener on elements with class `card-trigger` and + * `data-card-of` / `data-card-lang`. + */ +import { getCollection } from "astro:content"; + +interface Props { + /** `{kind}/{slug}` — e.g. "concepts/causal-dag" (kind is plural) */ + of: string; + /** Optional override label; defaults to the card title */ + label?: string; +} + +const { of, label: labelProp } = Astro.props as Props; +const [kind, slug] = of.split("/"); +const lang = ((Astro.params as any)?.lang as "en" | "zh") ?? "zh"; + +const all = await getCollection("cards"); +const entry = all.find((c) => c.id === `${lang}/${kind}/${slug}`); +if (!entry) { + throw new Error(`[CardTrigger] missing card: ${lang}/${kind}/${slug}`); +} +const data = entry.data as any; +const title = data.title; +const sealChar = + data.seal ?? + ({ concepts: "念", entities: "实", sources: "源", chapters: "篇" } as const)[ + kind as "concepts" + ] ?? + "·"; +const label = labelProp ?? title; +--- + + + + From b30683adb01108e660ea58f4592aab33e7141627 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 15:36:07 +0800 Subject: [PATCH 12/48] feat(site): card-fragment route + CardModal mounted in Hall --- site/src/layouts/Hall.astro | 3 ++ .../card-fragment/[lang]/[kind]/[slug].astro | 34 +++++++++++++++++++ 2 files changed, 37 insertions(+) create mode 100644 site/src/pages/card-fragment/[lang]/[kind]/[slug].astro diff --git a/site/src/layouts/Hall.astro b/site/src/layouts/Hall.astro index f2b0220..ed441c5 100644 --- a/site/src/layouts/Hall.astro +++ b/site/src/layouts/Hall.astro @@ -1,5 +1,6 @@ --- import { ClientRouter } from "astro:transitions"; +import CardModal from "~/components/card/CardModal.astro"; import Topbar from "~/components/Topbar.astro"; import { type Locale } from "~/i18n/strings"; import { url } from "~/lib/urls"; @@ -51,6 +52,8 @@ const pathname = Astro.url.pathname; + + @@ -68,8 +148,10 @@ display: flex; align-items: center; justify-content: center; + perspective: 1200px; } .card-modal[hidden] { display: none; } + .card-modal__backdrop { position: absolute; inset: 0; @@ -78,19 +160,65 @@ -webkit-backdrop-filter: blur(4px); border: 0; cursor: pointer; + opacity: 0; + transition: opacity 260ms ease-out; + } + .card-modal.is-opening .card-modal__backdrop, + .card-modal__stage:not([hidden]) ~ .card-modal__backdrop { + /* placeholder — backdrop opacity driven by the modal class below */ } + .card-modal.is-opening .card-modal__backdrop { opacity: 1; } + .card-modal.is-closing .card-modal__backdrop { + opacity: 0; + transition: opacity 260ms ease-in; + } + .card-modal__stage { + --fx-dx: 0px; + --fx-dy: 0px; + --fx-scale: 0.2; position: relative; width: min(560px, 88vw); aspect-ratio: 1 / 1.414; max-height: calc(100vh - 80px); display: flex; + transform-style: preserve-3d; + will-change: transform, opacity; + opacity: 1; } + .card-modal.is-opening .card-modal__stage { + animation: oscard-flip-in 420ms cubic-bezier(0.22, 0.9, 0.35, 1) both; + } + .card-modal.is-closing .card-modal__stage { + animation: oscard-flip-out 340ms cubic-bezier(0.6, 0, 0.7, 0.2) both; + } + @keyframes oscard-flip-in { + from { + transform: translate(var(--fx-dx), var(--fx-dy)) scale(var(--fx-scale)) rotateY(90deg); + opacity: 0; + } + to { + transform: none; + opacity: 1; + } + } + @keyframes oscard-flip-out { + from { + transform: none; + opacity: 1; + } + to { + transform: translate(var(--fx-dx), var(--fx-dy)) scale(var(--fx-scale)) rotateY(90deg); + opacity: 0; + } + } + .card-modal__frame { width: 100%; height: 100%; border: 0; background: transparent; + backface-visibility: visible; } .card-modal__close { position: absolute; diff --git a/site/src/pages/card-fragment/[lang]/[kind]/[slug].astro b/site/src/pages/card-fragment/[lang]/[kind]/[slug].astro index d7d6cfd..9950e6f 100644 --- a/site/src/pages/card-fragment/[lang]/[kind]/[slug].astro +++ b/site/src/pages/card-fragment/[lang]/[kind]/[slug].astro @@ -37,6 +37,17 @@ const theme = themeParam === "dark" || themeParam === "light" ? themeParam : "da
+ @@ -45,18 +56,25 @@ const theme = themeParam === "dark" || themeParam === "light" ? themeParam : "da body { margin: 0; background: transparent; - display: flex; + display: block; } + /* Astro injects + a stray text node into body in + dev mode; both would otherwise show inside the iframe. Nuke any + body child except the intended fragment root. */ + body > *:not(.card-fragment-root), + astro-dev-toolbar { display: none !important; } .card-fragment-root { width: 100%; height: 100%; display: flex; } - /* When loaded in an iframe, let the card fill the iframe exactly - rather than capping at its own width/height tokens. */ + /* Let the card fill the iframe exactly — override the shell's own + width/max-height tokens that target the main viewport, not the + embedded iframe case. */ .card-fragment-root > .oscard--full { - width: 100%; - max-height: 100%; - max-width: none; + width: 100% !important; + height: 100% !important; + max-width: none !important; + max-height: none !important; } From 1927fdc3823410c5c2e6d46e6811bb93aa79a131 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 16:13:21 +0800 Subject: [PATCH 18/48] =?UTF-8?q?fix(site):=20CardModal=20close=20?= =?UTF-8?q?=E2=86=92=20viewport=20top-right;=20scrollbar=20width=20compens?= =?UTF-8?q?ation=20to=20kill=20reflow=20jitter?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- site/src/components/card/CardModal.astro | 40 +++++++++++++++++++----- 1 file changed, 33 insertions(+), 7 deletions(-) diff --git a/site/src/components/card/CardModal.astro b/site/src/components/card/CardModal.astro index 067559d..c02585c 100644 --- a/site/src/components/card/CardModal.astro +++ b/site/src/components/card/CardModal.astro @@ -17,9 +17,9 @@ @@ -84,6 +84,13 @@ frame.addEventListener("load", syncTheme, { once: true }); modal.hidden = false; + // Lock scroll WITHOUT layout shift: compensate scrollbar width + // with padding-right so the main page's content doesn't jump + // left/right when the scrollbar disappears. + const scrollbarWidth = window.innerWidth - document.documentElement.clientWidth; + if (scrollbarWidth > 0) { + document.body.style.paddingRight = `${scrollbarWidth}px`; + } document.body.style.overflow = "hidden"; // Next frame: now that the modal is in layout tree, measure the // stage and set FLIP vars, then add the opening class to start the @@ -111,6 +118,7 @@ modal.classList.remove("is-closing"); frame.src = "about:blank"; document.body.style.overflow = ""; + document.body.style.paddingRight = ""; }, 340); } @@ -133,6 +141,7 @@ modal.classList.remove("is-opening", "is-closing"); frame.src = "about:blank"; document.body.style.overflow = ""; + document.body.style.paddingRight = ""; } }); document.addEventListener("astro:page-load", prefetchAll); @@ -220,17 +229,34 @@ background: transparent; backface-visibility: visible; } + /* Pinned to the viewport's top-right corner so it does NOT get swept + along with the stage's flip animation. Sibling of the stage rather + than a child. */ .card-modal__close { - position: absolute; - top: -40px; - right: 0; - width: 32px; - height: 32px; + position: fixed; + top: 20px; + right: 20px; + width: 36px; + height: 36px; border: 1px solid var(--rule); background: var(--paper-raised); color: var(--ink); font-size: 1.2rem; - cursor: pointer; line-height: 1; + cursor: pointer; + opacity: 0; + transition: opacity 220ms ease-out, border-color 160ms ease-out; + z-index: 1; + } + .card-modal__close:hover { + border-color: var(--vermilion); + } + .card-modal.is-opening .card-modal__close { + opacity: 1; + transition-delay: 160ms; + } + .card-modal.is-closing .card-modal__close { + opacity: 0; + transition: opacity 160ms ease-in; } From 86a9921505be8776e0f3147b5b8ecb171eecd33e Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 16:22:59 +0800 Subject: [PATCH 19/48] feat(site): CardModal open-original-doc button + causal-dag SVG topology visualization --- site/src/components/card/CardModal.astro | 49 +++++++--- .../content/cards/zh/concepts/causal-dag.mdx | 90 +++++++++++++++++-- 2 files changed, 121 insertions(+), 18 deletions(-) diff --git a/site/src/components/card/CardModal.astro b/site/src/components/card/CardModal.astro index c02585c..399e13d 100644 --- a/site/src/components/card/CardModal.astro +++ b/site/src/components/card/CardModal.astro @@ -18,6 +18,12 @@ + -**去混淆** — 后门路径调整从观测数据中取出因果效应;Z 要覆盖所有后门路径、且不含 X 的后代。 + + d-分离:Z 阻断 X→Y 的所有路径 ⇒ X ⊥ Y | Z。链/叉条件化中间节点阻断;对撞条件化中间节点反而打开——最反直觉的偏差来源。 + + + + P(Y | do(X)) = Σz P(Y | X, Z=z) · P(Z=z) +

后门调整:Z 覆盖所有后门路径且不含 X 的后代

+

Pearl 2010:图中缺失的箭头比存在的箭头更重要——缺失边声称零影响,是结构假设的核心编码。

+
+ + +
+ → 结构因果模型 · do演算 + Pearl (2009) · Book of Why (2018) +
+
diff --git a/site/src/content/cards/zh/concepts/do-calculus.mdx b/site/src/content/cards/zh/concepts/do-calculus.mdx index 04833b7..6c336ba 100644 --- a/site/src/content/cards/zh/concepts/do-calculus.mdx +++ b/site/src/content/cards/zh/concepts/do-calculus.mdx @@ -3,20 +3,180 @@ schemaVersion: one-shot-card/v1 title: do 演算 titleAlt: do-Calculus tagline: Pearl 的三条规则 —— 把因果查询还原为可估计的观测表达式 +cardLayout: bleed refs: - concepts/causal-dag - concepts/structural-causal-model sourceLine: Pearl (1995, 2009); Shpitser & Pearl (2006) --- -import Stack from '~/components/card/blocks/Stack.astro'; -import KV from '~/components/card/blocks/KV.astro'; +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; import Formula from '~/components/card/blocks/Formula.astro'; - - 插入/删除观测 —— 若 Y ⊥ Z | X, W 在 G(X̄) 中成立 - 动作 ↔ 观测 —— 若 Y ⊥ Z | X, W 在 G(X̄, Z̲) 中成立 - 插入/删除动作 —— 若 Y ⊥ Z | X, W 在 G(X̄, Z̄(W)) 中成立 - + -P(y | do(x)) = Σz P(y | x, z) P(z) + + 概念 · DO-CALCULUS · 因果推断 +

do 演算

+

Pearl's Three Rules · 图手术 · 干预推断

+
+ + + do(X) 不是观察条件化 —— 它是在 DAG 上切断指向 X 的所有箭头,再量 Y 的分布。 + + + +
+ +
+
Rule 1
+
插入 / 删除观测
+
P(Y|do(X),Z,W) = P(Y|do(X),Z)
+
在 G(X̄) 中,Z 阻断了 W→Y 的所有路径
+
+
+
+ + +
+ +
+
Rule 2
+
干预 ↔ 观测互换
+
P(Y|do(X),Z) = P(Y|X,Z)
+
在 G(X̄,Z̲) 中,Z 满足后门准则,混淆被控制
+
+
+
+ + +
+ +
+
Rule 3
+
插入 / 删除干预
+
P(Y|do(X)) = P(Y)
+
在 G(X̄,Z̄(W)) 中,X 到 Y 不存在因果路径
+
+
+
+ + + 后门调整公式(Rule 2 的规范应用) + P(y | do(x)) = Σz P(y | x, z) · P(z) +

三条规则联立 → 完备:任何可识别的因果量均可还原为观测分布。

+
+ + +
+ 因果 DAG + SCM + Pearl (1995, 2009) · Shpitser & Pearl (2006) +
+
diff --git a/site/src/content/cards/zh/entities/judea-pearl.mdx b/site/src/content/cards/zh/entities/judea-pearl.mdx index fa55b8c..d33022d 100644 --- a/site/src/content/cards/zh/entities/judea-pearl.mdx +++ b/site/src/content/cards/zh/entities/judea-pearl.mdx @@ -2,21 +2,136 @@ schemaVersion: one-shot-card/v1 title: Judea Pearl tagline: 因果革命的奠基者 · 图灵奖 2011 · UCLA CS 教授 +cardLayout: bleed refs: - concepts/causal-dag - concepts/do-calculus sourceLine: Causality (2009); The Book of Why (2018) --- +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; import KV from '~/components/card/blocks/KV.astro'; -import Stack from '~/components/card/blocks/Stack.astro'; -import Caption from '~/components/card/blocks/Caption.astro'; - - 1936— - UCLA Computer Science - 2011 "因果与概率推理基础性贡献" - 结构因果模型 · do 演算 · 因果之梯 - + -把因果推理从哲学思辨提升为可操作的数学学科。 + +
+ 实体 · TURING AWARD 2011 + Pearl +
+
+

Judea Pearl

+

1936 — · Tel Aviv → UCLA

+

因果革命的奠基者

+
+
+ + + UCLA Computer Science(1970—) + 2011 · "概率与因果推理的基础性贡献" + 结构因果模型(SCM)· do 演算 · 因果之梯 + 后门准则 · 前门准则 · Halpern-Pearl 个例因果 + 贝叶斯网络(1985)— 概率推理图模型 + + + + + + + 1936 + 诞生 + + 1985 + 贝叶斯 + 网络 + + 2000 + Causality + 出版 + + 2011 + 图灵奖 + + 2018 + Book of + Why + + + + + 把因果推理从哲学思辨提升为可操作的数学学科——联合、干预、反事实,三级阶梯缺一不可。 + + + +
+ 因果 DAG + do 演算 + Causality (2009) · The Book of Why (2018) +
+
diff --git a/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx index a78f702..5ffb0bc 100644 --- a/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx +++ b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx @@ -1,5 +1,6 @@ --- schemaVersion: one-shot-card/v1 +cardLayout: bleed title: Effective Context Engineering for AI Agents tagline: Anthropic 官方 · 长时程 agent 的上下文工程总论 author: Anthropic Applied AI team @@ -11,15 +12,88 @@ refs: sourceLine: Anthropic Engineering, July 2026 --- -import Quote from '~/components/card/blocks/Quote.astro'; -import Stack from '~/components/card/blocks/Stack.astro'; +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; - - 注意力预算是稀缺资源 —— just-in-time、compaction、note-taking、sub-agent 是四种抵御 context rot 的工程手法。 - + + 源头 · ANTHROPIC ENGINEERING · 2026 +

Effective Context Engineering

+

for AI Agents · 长时程 agent 的上下文工程总论

+
- -
**① just-in-time context** — 按需注入而非 upfront 堆砌
-
**② compaction** — 旧轮次摘要化;保留结构,丢弃细节
-
**③ note-taking** — agent 自持外部笔记,跨 session 回忆
-
+ + + "注意力预算是稀缺资源——每个输入的 token 都在消耗模型的'认知带宽'。Context engineering 就是用最小的高信号 token 集合来完成任务。" + +

—— 抵御 context rot 的四种工程手法 ↓

+
+ + +
+
+ JUST-IN-TIME +

按需注入,不 upfront 堆砌。工具 / 文档 / 记忆在模型真正需要时才 surface,保持 attention 锐利。

+
+
+
+ COMPACTION +

旧轮次摘要化。保留结构性结论,丢弃冗余对话;长对话不线性膨胀。

+
+
+
+ NOTE-TAKING +

Agent 自持外部笔记;跨 session 回忆 + 工作记忆与情景记忆分离。

+
+
+
+ SUB-AGENT +

拆分长任务到多个独立上下文;父只消费子的结论,不看中间痕迹。

+
+
+ + +
+ → context-engineering · context-rot + anthropic.com/engineering +
+
+ + From e249290615ac7578b40487200b84b40147f40dca Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 17:16:09 +0800 Subject: [PATCH 22/48] fix(cards): ink band stays dark in dark mode + chip/foot text uses currentColor (skill doc updated) --- .../one-shot-card/references/aesthetic.md | 20 +++++++++++++++++++ site/src/components/card/blocks/Band.astro | 9 +++++++++ site/src/components/card/blocks/Chip.astro | 5 ++++- .../content/cards/zh/concepts/causal-dag.mdx | 6 ++++-- .../content/cards/zh/concepts/do-calculus.mdx | 8 +++++--- .../content/cards/zh/entities/judea-pearl.mdx | 10 +++++++--- ...nthropic-effective-context-engineering.mdx | 7 ++++--- 7 files changed, 53 insertions(+), 12 deletions(-) diff --git a/.claude/skills/one-shot-card/references/aesthetic.md b/.claude/skills/one-shot-card/references/aesthetic.md index db7d18c..a9ca708 100644 --- a/.claude/skills/one-shot-card/references/aesthetic.md +++ b/.claude/skills/one-shot-card/references/aesthetic.md @@ -16,6 +16,26 @@ The dark-mode palette flips automatically via `[data-theme="dark"]`. Your card should not hard-code any hex value. +### Gotcha — day/night inversion of `--paper` and `--ink` + +In light mode `--paper` is cream, `--ink` is near-black. +In dark mode they flip: `--paper` is near-black, `--ink` is cream. + +So a rule like `color: var(--paper)` on an "ink-dark band" gives cream text in +light mode but near-black text in dark mode — invisible either way depending +on the band. + +**Always inherit the enclosing band's text color for body/chip text** — +use `color: currentColor` (the band already sets the correct text color +via ``'s own CSS, flipped for both modes). + +For semi-transparent variants use `color-mix(in oklab, currentColor 70%, transparent)` +or simply `opacity: 0.75` — both track the band's text direction. + +Never write `color: var(--paper)` / `color: var(--ink)` directly inside a +card's ` diff --git a/site/src/content/cards/zh/concepts/causal-dag.mdx b/site/src/content/cards/zh/concepts/causal-dag.mdx index 1b76963..1f97372 100644 --- a/site/src/content/cards/zh/concepts/causal-dag.mdx +++ b/site/src/content/cards/zh/concepts/causal-dag.mdx @@ -202,12 +202,14 @@ import Formula from '~/components/card/blocks/Formula.astro'; .foot-refs { font-family: var(--font-mono); font-size: 0.65rem; - color: color-mix(in oklab, var(--paper) 60%, transparent); + color: currentColor; + opacity: 0.75; letter-spacing: 0.04em; } .foot-source { font-family: var(--font-han); font-size: 0.65rem; - color: color-mix(in oklab, var(--paper) 45%, transparent); + color: currentColor; + opacity: 0.55; } `} diff --git a/site/src/content/cards/zh/concepts/do-calculus.mdx b/site/src/content/cards/zh/concepts/do-calculus.mdx index 6c336ba..45baee4 100644 --- a/site/src/content/cards/zh/concepts/do-calculus.mdx +++ b/site/src/content/cards/zh/concepts/do-calculus.mdx @@ -54,15 +54,17 @@ import Formula from '~/components/card/blocks/Formula.astro'; font-size: 0.6rem; letter-spacing: 0.1em; padding: 2px 7px; - border: 1px solid color-mix(in oklab, var(--paper) 35%, transparent); + border: 1px solid color-mix(in oklab, currentColor 35%, transparent); border-radius: 3px; - color: color-mix(in oklab, var(--paper) 65%, transparent); + color: currentColor; + opacity: 0.75; text-decoration: none; } .do-source { font-family: var(--font-mono); font-size: 0.6rem; - color: color-mix(in oklab, var(--paper) 45%, transparent); + color: currentColor; + opacity: 0.55; margin-left: auto; } .rnode { fill: var(--paper-sunk); stroke: var(--ink-soft); stroke-width: 1.2; } diff --git a/site/src/content/cards/zh/entities/judea-pearl.mdx b/site/src/content/cards/zh/entities/judea-pearl.mdx index d33022d..8353fd3 100644 --- a/site/src/content/cards/zh/entities/judea-pearl.mdx +++ b/site/src/content/cards/zh/entities/judea-pearl.mdx @@ -62,20 +62,24 @@ import KV from '~/components/card/blocks/KV.astro'; flex-wrap: wrap; align-items: center; } + /* Inherit the ink band's text color (paper in light, ink in dark) via + currentColor + alpha overlays, so both modes stay legible. */ .pearl-ref-chip { font-family: var(--font-mono); font-size: 0.6rem; letter-spacing: 0.1em; padding: 2px 7px; - border: 1px solid color-mix(in oklab, var(--paper) 40%, transparent); + border: 1px solid color-mix(in oklab, currentColor 40%, transparent); border-radius: 3px; - color: color-mix(in oklab, var(--paper) 70%, transparent); + color: currentColor; text-decoration: none; + opacity: 0.85; } .pearl-src { font-family: var(--font-mono); font-size: 0.6rem; - color: color-mix(in oklab, var(--paper) 50%, transparent); + color: currentColor; + opacity: 0.6; margin-left: auto; } `} diff --git a/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx index 5ffb0bc..308286d 100644 --- a/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx +++ b/site/src/content/cards/zh/sources/anthropic-effective-context-engineering.mdx @@ -92,8 +92,9 @@ import CoreDef from '~/components/card/blocks/CoreDef.astro'; font-family: var(--font-mono); font-size: 0.62rem; letter-spacing: 0.1em; - color: color-mix(in oklab, var(--paper) 70%, transparent); + color: currentColor; + opacity: 0.75; } - .foot-refs { color: color-mix(in oklab, var(--paper) 80%, transparent); } - .foot-source { font-style: italic; opacity: 0.7; } + .foot-refs { opacity: 1; } + .foot-source { font-style: italic; opacity: 0.75; } `} From 9d4d7dc9a4a36a3b2ef4435ff4b4835e98f81075 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:10:36 +0800 Subject: [PATCH 23/48] =?UTF-8?q?feat(cards):=20batch=201/18=20=E2=80=94?= =?UTF-8?q?=20concepts/a2a-protocol=E2=86=92ai-summers-history=20(15=20car?= =?UTF-8?q?ds)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/concepts/a2a-protocol.mdx | 100 ++++++++++++++++++ site/src/content/cards/zh/concepts/aci.mdx | 67 ++++++++++++ .../concepts/action-metamorphic-relations.mdx | 78 ++++++++++++++ .../zh/concepts/activation-intervention.mdx | 87 +++++++++++++++ .../content/cards/zh/concepts/agent-card.mdx | 70 ++++++++++++ .../zh/concepts/agent-interoperability.mdx | 92 ++++++++++++++++ .../zh/concepts/agent-native-software.mdx | 67 ++++++++++++ .../content/cards/zh/concepts/agent-os.mdx | 88 +++++++++++++++ .../concepts/agent-reliability-evaluation.mdx | 87 +++++++++++++++ .../zh/concepts/agent-resource-control.mdx | 81 ++++++++++++++ .../cards/zh/concepts/agent-sandboxing.mdx | 94 ++++++++++++++++ .../cards/zh/concepts/agent-scheduling.mdx | 93 ++++++++++++++++ .../cards/zh/concepts/agent-skills.mdx | 85 +++++++++++++++ .../cards/zh/concepts/agentic-systems.mdx | 91 ++++++++++++++++ .../cards/zh/concepts/ai-summers-history.mdx | 83 +++++++++++++++ 15 files changed, 1263 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/a2a-protocol.mdx create mode 100644 site/src/content/cards/zh/concepts/aci.mdx create mode 100644 site/src/content/cards/zh/concepts/action-metamorphic-relations.mdx create mode 100644 site/src/content/cards/zh/concepts/activation-intervention.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-card.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-interoperability.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-native-software.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-os.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-reliability-evaluation.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-resource-control.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-sandboxing.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-scheduling.mdx create mode 100644 site/src/content/cards/zh/concepts/agent-skills.mdx create mode 100644 site/src/content/cards/zh/concepts/agentic-systems.mdx create mode 100644 site/src/content/cards/zh/concepts/ai-summers-history.mdx diff --git a/site/src/content/cards/zh/concepts/a2a-protocol.mdx b/site/src/content/cards/zh/concepts/a2a-protocol.mdx new file mode 100644 index 0000000..907622b --- /dev/null +++ b/site/src/content/cards/zh/concepts/a2a-protocol.mdx @@ -0,0 +1,100 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: A2A 协议 +titleAlt: Agent2Agent Protocol +tagline: 跨框架 Agent 通信的开放标准 +refs: + - concepts/agent-card + - concepts/agent-interoperability + - concepts/agentic-systems +sourceLine: Google/Linux Foundation · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · A2A PROTOCOL · AGENT 通信 + + + +

A2A 协议

+

Agent2Agent — 跨框架 Agent 互操作通信标准

+
+ + + MCP 连 agent 与工具;A2A 连 agent 与 agent。将 agent 包装成工具是根本性的降格——agent 有自主性,需要以"代理人"身份交互。 + + + +
+ 技术栈定位 +
+
用户需求
+
+
框架层 ADK / LangGraph / CrewAI
+
+
MCP — Agent ↔ 工具/数据
+
+
A2A — Agent ↔ Agent(跨框架)
+
+
多 Agent 协作网络
+
+
+
+ + +
+ 发现 +

Agent Card 发布于 /.well-known/agent-card,声明能力、鉴权、技能

+
+
+ 状态 +

Task 有状态工作单元:submitted→working→completed,支持断线续连

+
+
+ 传输 +

HTTP 轮询 / SSE 流式 / Push Webhook,原生支持长时任务

+
+
+ + +
+ → Agent Card · Agent 互操作 · Task 生命周期 + Google / Linux Foundation +
+
+ + diff --git a/site/src/content/cards/zh/concepts/aci.mdx b/site/src/content/cards/zh/concepts/aci.mdx new file mode 100644 index 0000000..3a1f852 --- /dev/null +++ b/site/src/content/cards/zh/concepts/aci.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: ACI — Agent 计算机接口 +titleAlt: Agent-Computer Interface +tagline: 为模型设计接口,如同为人类设计 HCI +refs: + - concepts/tool-design + - concepts/augmented-llm + - concepts/agent-native-software +sourceLine: Anthropic Building Effective Agents; Karpathy YC 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · ACI · AGENT-COMPUTER INTERFACE + + + +

ACI — Agent 计算机接口

+

Agent-Computer Interface · 为模型而设计的接口学科

+
+ + + 在 ACI 上投入的设计精力应与 HCI 同等。站在模型的角度:仅凭工具描述和参数,使用方式是否显而易见? + + + + + 参数名和描述让用途一目了然——"给初级开发者写文档"的标准 + 防误设计:强制绝对路径而非相对路径,消灭易错参数 + 用大量样本观察模型犯什么错,然后改接口而非改 prompt + llms.txt / MCP / CLI-first — 主动让整个互联网适配 LLM + + + + +
+ Anthropic 实战 + SWE-bench agent 中,优化工具接口的时间比优化 prompt 更多。强制绝对路径后,路径类错误归零。 +
+
+ Karpathy 扩展 + Agent 是信息的新消费者——Meeting LLMs halfway。llms.txt / Docs-for-LLMs / MCP 是基础设施层的 ACI 实践。 +
+
+ + +
+ → Tool Design · Agent Native Software · MCP + Anthropic (2025) · Karpathy YC (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/action-metamorphic-relations.mdx b/site/src/content/cards/zh/concepts/action-metamorphic-relations.mdx new file mode 100644 index 0000000..1cd6bdf --- /dev/null +++ b/site/src/content/cards/zh/concepts/action-metamorphic-relations.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 动作蜕变关系 +titleAlt: Action Metamorphic Relations +tagline: 语义等价变换 · 终态判等 · 可测量的鲁棒性 +refs: + - concepts/reliability-surface + - concepts/guardrails +sourceLine: ReliabilityBench · arXiv 2601.06112 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · ACTION METAMORPHIC RELATIONS · 鲁棒性测试 + + + +

动作蜕变关系

+

Action Metamorphic Relations · Agent 鲁棒性的形式化测量

+
+ + + 对任务描述施加语义等价变换,判等锚点不是输出文本,而是**世界终态**。"订纽约到洛杉矶的机票"与"我要从 NYC 出发去 LAX"——步骤可不同,终态应相同。 + + + +
+
+ 扰动类别变换类型示例 +
+
+ 语言层同义词、改写、语态变换"book" → "reserve" +
+
+ 结构层约束重排、指令拆分/合并先时间后地点 → 反转 +
+
+ 上下文层干扰信息注入、中途改口加入无关偏好再取消 +
+
+
+ + +
+ pass@1 = 96.88% + pass@1 = 88.12%(−8.8pp) + 任务本身未变,仅说法不同 +
+

与传统蜕变测试的区别:判等从"输出一致"下沉到"终态一致"——序列决策任务的必要适配。

+
+ + +
+ → 可靠性曲面 · Guardrails + Gupta (2026) ReliabilityBench +
+
+ + diff --git a/site/src/content/cards/zh/concepts/activation-intervention.mdx b/site/src/content/cards/zh/concepts/activation-intervention.mdx new file mode 100644 index 0000000..63b3ce5 --- /dev/null +++ b/site/src/content/cards/zh/concepts/activation-intervention.mdx @@ -0,0 +1,87 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 激活干预 +titleAlt: Activation Intervention +tagline: 修改中间层激活 · 验证表征的因果性角色 +refs: + - concepts/probing-classifiers + - concepts/mechanistic-interpretability + - concepts/linear-representation-hypothesis +sourceLine: Li et al. 2022 · Nanda et al. 2023 · OthelloGPT +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 概念 · ACTIVATION INTERVENTION · 机制可解释性 + + + +

激活干预

+

Activation Intervention / Steering / Patching

+
+ + + 探针问"是否编码",干预问"是否因果驱动"。在前向传播中修改中间层激活,观察输出变化——从相关性跃升到因果性证据。 + + + +
+
+ 梯度引导修改 + Li et al. 2022 +

梯度下降将激活推向目标状态 B';可干预训练分布外状态

+
+
+ 线性向量加法 + Nanda et al. 2023 +

x' ← x + α·v,单次加法等效干预;证明表征本身是线性的

+
+
+ 缓存替换 Patching + Meng et al. 2022 +

干净运行 vs 受损运行;定位哪一层存储事实(ROME)

+
+
+ 方向向量操控 + Zou et al. 2023 +

对比两类输入提取特征方向,注入方向向量改变模型行为

+
+
+
+ + +
+ OthelloGPT 结果 + 干预后预测错误:2.68 → 0.12(合法棋位);线性向量版本 0.02——验证表征对预测具有因果作用 +
+
+ + +
+ → 探针分类器 · 机制可解释性 · 线性表征假说 + Li (2022) · Nanda (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-card.mdx b/site/src/content/cards/zh/concepts/agent-card.mdx new file mode 100644 index 0000000..fa3d8d3 --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-card.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent Card +titleAlt: Agent Capability Discovery +tagline: Agent 的数字名片 · /.well-known/agent-card +refs: + - concepts/a2a-protocol + - concepts/agent-interoperability +sourceLine: Google A2A Protocol · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · AGENT CARD · A2A 能力发现 + + + +

Agent Card

+

Agent 的数字名片 — A2A 能力发现的核心载体

+
+ + + Client agent 只需知道 domain,GET /.well-known/agent-card 即可在运行时发现:对方能做什么、向哪里发请求、需要什么鉴权、支持流式吗? + + + +
+ Agent Card 核心字段 + agent 身份声明 + A2A 服务端点(sendMessage 目标) + streaming · pushNotifications 等布尔能力标志 + 擅长的任务类型列表(细粒度能力公告) + OAuth2 / OpenID Connect / API Key 认证要求 + 自定义协议扩展声明 +
+
+ + +
+ GET /.well-known/agent-card + + 解析 securitySchemes,取 token + + 向 url 发 sendMessage +
+

capabilities 是运行时能力协商——streaming: true 才用 SSE;pushNotifications: true 才注册 webhook。

+
+ + +
+ → A2A Protocol · Agent Interoperability + Google A2A (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-interoperability.mdx b/site/src/content/cards/zh/concepts/agent-interoperability.mdx new file mode 100644 index 0000000..969561c --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-interoperability.mdx @@ -0,0 +1,92 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 互操作 +titleAlt: Agent Interoperability +tagline: 从孤岛到网络 · 跨框架 Agent 协作 +refs: + - concepts/a2a-protocol + - concepts/agent-card + - concepts/orchestrator-workers +sourceLine: Google A2A Protocol · ASPLOS 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · AGENT INTEROPERABILITY · 跨框架协作 + + + +

Agent 互操作

+

Agent Interoperability — 从孤岛生态到多 Agent 网络

+
+ + + 将 Agent 包装成工具是常见妥协——但这强行截断了多轮协商、有状态执行和异步委派。真正的互操作需要以"代理人"而非"函数"为粒度。 + + + +
+
+ MCP(Agent ↔ 工具) +
    +
  • 无状态函数调用
  • +
  • JSON Schema 能力描述
  • +
  • 单次请求-响应
  • +
  • 适合:搜索、数据库
  • +
+
+
VS
+
+ A2A(Agent ↔ Agent) +
    +
  • 有状态任务委派
  • +
  • Agent Card 能力发现
  • +
  • 异步 / 多轮 / 断线续连
  • +
  • 适合:委托子任务
  • +
+
+
+
+ + +
+ + 标准化发现:Agent Card 让任何 A2A-compliant client 运行时发现对方能力 +
+
+ + 不透明执行:协作不暴露内部状态,只依赖声明能力和交换上下文 +
+
+ + 分工专业化:各框架专注最擅长的 agent,通过 A2A 接入生态 +
+
+ + +
+ → A2A Protocol · MCP · Orchestrator-Workers + Google / Linux Foundation (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-native-software.mdx b/site/src/content/cards/zh/concepts/agent-native-software.mdx new file mode 100644 index 0000000..427e826 --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-native-software.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 原生软件 +titleAlt: Agent-Native Software +tagline: 以 Agent 为一等用户类型设计软件 +refs: + - concepts/aci + - concepts/tool-design + - concepts/agent-skills +sourceLine: CLI-Anything · Anthropic Agent Skills +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · AGENT-NATIVE SOFTWARE · 软件设计 + + + +

Agent 原生软件

+

Agent-Native Software — 以 Agent 为一等用户类型

+
+ + + 不是先做 GUI 再适配 agent。Agent 与人类的输入/输出/状态/发现需求差异大到足以推导出不同的软件形态——agent-native 是这个推导的结果。 + + + + + 所有返回可切换到 JSON;错误是带 code + remediation 的对象,不是 traceback + --help / schema / metadata 回答"你能做什么";文档与代码同一工具 + 每个命令做一件事,可管道;状态显式可序列化为文本 + 长任务可 save/load;支持 undo 原语;不依赖连续会话 + 副作用标记清晰;只读 vs 写 vs 不可逆;失败可重试 + 复用 agent 已掌握的工具:shell / pip / env var;避免自研 SDK + + + + +
+ 立场 A · CLI+JSON 即够:Unix 哲学、低协议开销(CLI-Anything 的选择) + vs + 立场 B · 需要新协议:MCP/A2A 处理跨机器、权限、双向流(生态方向) +
+
+ + +
+ → ACI · Tool Design · Agent Skills · MCP + CLI-Anything · Anthropic (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-os.mdx b/site/src/content/cards/zh/concepts/agent-os.mdx new file mode 100644 index 0000000..7fdf4c8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-os.mdx @@ -0,0 +1,88 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent OS +titleAlt: Agent Operating System +tagline: 原生理解 Agent 语义的操作系统抽象 +refs: + - concepts/agent-resource-control + - concepts/agent-sandboxing + - concepts/harness-engineering +sourceLine: AgenticOS Workshop ASPLOS 2026 · AIOS COLM 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + +
+ 概念 · AGENT OS + +
+
+

Agent OS

+

为 AI Agent 负载重新设计的操作系统抽象

+
+
+ + + 传统 OS 服务确定性计算。Agent 负载根本不同:动态规划、工具链不可预测、context 是核心资源、执行路径由模型推理决定。这种不匹配催生了 Agent OS。 + + + +
+
+ 传统 OSAgent OS +
+
+ 执行单元进程 / 线程Agent / 技能 / 工具链 +
+
+ 核心资源CPU / 内存 / IOToken / API配额 / GPU +
+
+ 调度时间片 / 优先级语义感知(任务紧急度) +
+
+ 状态管理文件系统 / 内存Context window / 向量存储 +
+
+ 安全用户 / 组 / 权限位动态沙箱 / 凭证隔离 +
+
+
+ + +
+ Karpathy LLM OS 类比 (2023) + + AIOS 工程原型 (2024) + + AgenticOS Workshop 系统研究 (2026) +
+
+ + +
+ → 资源控制 · 沙箱 · Harness Engineering · Fork-Explore-Commit + ASPLOS 2026 Workshop +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-reliability-evaluation.mdx b/site/src/content/cards/zh/concepts/agent-reliability-evaluation.mdx new file mode 100644 index 0000000..78f5b52 --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-reliability-evaluation.mdx @@ -0,0 +1,87 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 可靠性评估 +titleAlt: Agent Reliability Evaluation +tagline: pass@1 ≠ 可靠性 · 四指标框架 +refs: + - concepts/reliability-decay + - concepts/long-running-agents + - concepts/evaluator-optimizer +sourceLine: Beyond pass@1 · arXiv 2603.29231 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · AGENT RELIABILITY EVALUATION · 四指标框架 + + + +

Agent 可靠性评估

+

Beyond pass@1 — 能力与可靠性是不同的问题

+
+ + + pass@1 衡量能力(一次最佳能否完成);可靠性衡量一致性(反复调用、不同时长、不同域任务)。GPT-4o pass@1=61%,但 pass^8 只有 25%。 + + + +
+
+ RDC + 可靠性衰减曲线 +

pass^k 随任务时长变化——刻画群体级可靠性轮廓

+
+
+ VAF + 方差放大因子 +

高 VAF ≥ 2.37 是能力标志(有时成功有时失败);低 VAF 意味着稳定地失败

+
+
+ GDS + 优雅退化评分 +

失败时已完成多少——单次失败的质量指标

+
+
+ MOP + 熔断起始点 +

行为崩溃的轨迹动态;不是终止信号,而是 context reset 触发器

+
+
+
+ + +
+ 反直觉 + 给 agent 加 episodic memory:10 个模型中 6 个变差、4 个中性、0 个改善。记忆 overhead 超过收益。 +
+
+ + +
+ → 可靠性衰减 · 长时运行 Agent · Evaluator-Optimizer + Beyond pass@1 (2026) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-resource-control.mdx b/site/src/content/cards/zh/concepts/agent-resource-control.mdx new file mode 100644 index 0000000..0526a0c --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-resource-control.mdx @@ -0,0 +1,81 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 资源控制 +titleAlt: Agent Resource Control +tagline: 扩展 cgroup 到 Token · API 配额 · 工具权限 +refs: + - concepts/agent-os + - concepts/context-management + - concepts/harness-engineering +sourceLine: AgentCgroup · AgenticOS Workshop ASPLOS 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · AGENT RESOURCE CONTROL · AGENT OS 资源层 + + + +

Agent 资源控制

+

AgentCgroup — 将 Linux cgroup 扩展到 Agent 特有资源维度

+
+ + + 传统 cgroup 限制 CPU / 内存 / IO。Agent 负载的关键资源是 token 消耗、API 调用配额、工具访问权限——突发性、不可预测性、级联性是 agent 资源的三大特征。 + + + +
+
+ 资源维度传统 OSAgent OS 新增 +
+
+ CPU / 内存cgroup v2 ✓需按 agent 粒度(非进程) +
+
+ GPUCUDA MPS/MIG按推理请求公平调度 +
+
+ Tokencontext window 预算 + 总限额 +
+
+ API 调用速率限制 + 成本上限 +
+
+ 工具访问文件权限动态权限(按任务 / 风险等级) +
+
+
+ + +
+ Context compaction / guardrails / harness retry 间接控制资源 + 将上述机制下沉到 OS 层,提供更强隔离保证和更低开销 +
+
+ + +
+ → Agent OS · Context 管理 · Guardrails + AgentCgroup · ASPLOS 2026 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-sandboxing.mdx b/site/src/content/cards/zh/concepts/agent-sandboxing.mdx new file mode 100644 index 0000000..97a93bd --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-sandboxing.mdx @@ -0,0 +1,94 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 沙箱 +titleAlt: Agent Sandboxing +tagline: 动态代码 · 语义攻击面 · 多层纵深防御 +refs: + - concepts/guardrails + - concepts/agent-os + - concepts/harness-engineering +sourceLine: AgenticOS Workshop ASPLOS 2026 · Anthropic Claude Code +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · AGENT SANDBOXING · 安全隔离 + + + +

Agent 沙箱

+

Agent Sandboxing — 动态代码生成时代的安全隔离

+
+ + + 传统沙箱假设代码是静态已知的。Agent 面对的是动态代码生成、语义层 prompt injection、工具链权限传递、上下文污染——四类传统沙箱无法覆盖的新攻击面。 + + + +
+
+ Execute-Only Agents + 架构级 Prompt Injection 防御 +

将规划与执行严格分离——执行层只能执行预批准操作集,无语言理解能力,从根本上消除注入攻击面

+
+
+ Grimlock + eBPF + 可信通道 +

内核级行为监控 + 强制执行策略;同一框架同时提供可观测性(监控)和安全性(阻断)

+
+
+ 动态沙箱 + 轻量级运行时 +

为 agent 生成的代码提供极低开销的沙箱创建/销毁;agent 每分钟可能生成数十段代码

+
+
+
+ + +
+
+ 应用层 + Guardrails — 有害内容 / 越权操作 +
+
+
+
+ 系统层 + 沙箱 — Prompt Injection / 代码逃逸 +
+
+
+
+ 基础设施层 + 凭证隔离 — 结构性不可达 +
+
+
+ + +
+ → Guardrails · Agent OS · Meta-Harness · Claude Code 权限 + ASPLOS 2026 · Anthropic +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-scheduling.mdx b/site/src/content/cards/zh/concepts/agent-scheduling.mdx new file mode 100644 index 0000000..11c439b --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-scheduling.mdx @@ -0,0 +1,93 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 调度 +titleAlt: Agent Scheduling +tagline: 多 Agent 共享 LLM 资源的系统层仲裁 +refs: + - concepts/agent-os + - concepts/llm-os-analogy + - concepts/context-management +sourceLine: AIOS · arXiv 2403.16971 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · AGENT SCHEDULING · AGENT OS 调度层 + + + +

Agent 调度

+

Agent Scheduling — LLM 资源的系统层公平调度

+
+ + + 当前框架无调度层——并发 agent 直接抢 GPU 显存,塞满报 OOM,释放后重试。这不是调度,是碰运气。AIOS 将 OS 进程调度类比引入 agent 资源管理。 + + + +
+
+ FIFO + 先进先出 +
    +
  • 按到达顺序处理
  • +
  • 简单可预测
  • +
  • 后到 agent 可能长等
  • +
+
+
+
+ Round Robin + 时间片轮转 +
    +
  • 每 agent 一个时间片
  • +
  • 更公平
  • +
  • 需 context snapshot/restore
  • +
+
+
+
+ + +
+ 与传统 OS 调度的映射 +
+ 进程Agent 请求 + CPU 时间片LLM 推理时间片 + 上下文切换Context snapshot/restore +
+

关键差异:LLM 中断需保存生成中的 token 序列和搜索树,远比寄存器快照复杂

+
+
+ + +
+ → Agent OS · LLM-OS 类比 · Context 管理 + AIOS (Mei et al., COLM 2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agent-skills.mdx b/site/src/content/cards/zh/concepts/agent-skills.mdx new file mode 100644 index 0000000..b5c2c95 --- /dev/null +++ b/site/src/content/cards/zh/concepts/agent-skills.mdx @@ -0,0 +1,85 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent Skills +titleAlt: Agent Skills Standard +tagline: 领域知识的可发现打包单元 · SKILL.md 为核心 +refs: + - concepts/aci + - concepts/harness-engineering + - concepts/agent-os +sourceLine: Anthropic Agent Skills 开放标准 · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · AGENT SKILLS · 能力模块化标准 + + + +

Agent Skills

+

Agent Skills Standard — 让通用 Agent 通过加载技能变成专家

+
+ + + 不是为每个场景定制 agent,而是让通用 agent 通过加载技能变成专家。技能是"给新员工的入职指南"——领域知识、指令、脚本、资源的可组合单元。 + + + +
+ 渐进式披露(Progressive Disclosure) +
+ ① 元数据 + name + description → 始终在 system prompt 中 + 发现层:agent 判断是否相关 +
+
+ ② SKILL.md body + 完整指导 → agent 判断相关时读取 + 理解层:获取使用方式 +
+
+ ③ 附加文件 + 深层资源 → agent 按需深入 + 深入层:理论上无上限 context +
+
+
+ + +
+ Tool = 单个操作接口 + + Skill = 一组操作 + 上下文 + 流程指导 + + Skill OS = 技能是新的 App(AgenticOS 2026) +
+
+ + +
+ → ACI · Harness Engineering · Agent OS · 分形架构 + Anthropic (2025) · agentskills.io +
+
+ + diff --git a/site/src/content/cards/zh/concepts/agentic-systems.mdx b/site/src/content/cards/zh/concepts/agentic-systems.mdx new file mode 100644 index 0000000..4d6ef5f --- /dev/null +++ b/site/src/content/cards/zh/concepts/agentic-systems.mdx @@ -0,0 +1,91 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agentic 系统 +titleAlt: Agentic Systems +tagline: Workflows vs Agents · 从单次调用到自主决策 +refs: + - concepts/augmented-llm + - concepts/harness-engineering + - concepts/orchestrator-workers +sourceLine: Anthropic Building Effective Agents · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · AGENTIC SYSTEMS · 系统分类 + + + +

Agentic 系统

+

Agentic Systems — 利用 LLM 完成任务的系统总称

+
+ + + Workflow:预定义路径编排 LLM,流程确定性。Agent:LLM 动态指挥自身流程,自主决定下一步。选择取决于任务开放程度——只在有证据表明复杂度能改善结果时才升级。 + + + +
+
+ Level 1 + 单次 LLM + 检索 + 示例 + 大多数场景够用 +
+
+ Level 2 + Workflow 模式 + prompt chaining / routing / parallelization / orchestrator-workers / evaluator-optimizer +
+
+ Level 3 + 自主 Agent + 开放式问题、步骤数不可预测 +
+
+
+ + +
+
+ Anthropic + Workflows vs Agents 分类——回答"内部如何组织" +
+
+ Karpathy + LLM OS 类比——回答"在系统中处于什么位置";Iron Man 战甲而非机器人 +
+
+ ASPLOS + Agent OS 基础设施——回答"需要什么操作系统支撑" +
+
+
+ + +
+ → Augmented LLM · Harness · Agent OS · A2A + Anthropic (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/ai-summers-history.mdx b/site/src/content/cards/zh/concepts/ai-summers-history.mdx new file mode 100644 index 0000000..3dfb75f --- /dev/null +++ b/site/src/content/cards/zh/concepts/ai-summers-history.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AI 三个夏天 +titleAlt: Three AI Summers +tagline: Kautz 历史周期论 · 神经与符号的共同演化 +refs: + - concepts/neurosymbolic-ai + - concepts/bitter-lesson + - concepts/physical-symbol-system +sourceLine: Kautz AAAI Engelmore Lecture · AI Magazine 43(1) 2022 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + +
+ 概念 · AI 历史 · KAUTZ 2022 + +
+
+

AI 三个夏天

+

Three AI Summers — 神经与符号方法的共同演化

+
+
+ + +
+
+
+ 第一夏 1948–1966 +
+

感知机 + Logic Theorist 同步出现;启发式搜索 / A*;非对立,而是共生

+
+
+ 第一冬 → 贝叶斯网络 Pearl 1988 +
+
+
+ 第二夏 1968–1987 +
+

专家系统商业化(MYCIN / DENDRAL);规则系统的概率局限暴露

+
+
+ 第二冬 → SVM · 统计关系学习 +
+
+
+ 第三夏 2012— 不会有第三个冬天 +
+

AlexNet → AlphaGo(神经+MCTS)→ LLM;工业化嵌入;神经符号集成

+
+
+
+ + + AlphaGo 本身就是神经符号系统。AI 历史从未是猫鼠博弈,而是"不同思想交织演化"——Kautz 对二元对立叙事的根本批判。 + + + +
+ → 神经符号 AI · 苦涩教训 · 物理符号系统 + Kautz AI Magazine (2022) +
+
+ + From 6d1fb7f18faf20e13d585e50588779779f0fef37 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:15:57 +0800 Subject: [PATCH 24/48] =?UTF-8?q?feat(cards):=20batch=202/18=20=E2=80=94?= =?UTF-8?q?=20concepts/aitia=E2=86=92claude-code-permission-system=20(15?= =?UTF-8?q?=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- site/src/content/cards/zh/concepts/aitia.mdx | 75 +++++++++++++ .../cards/zh/concepts/augmented-llm.mdx | 62 +++++++++++ .../cards/zh/concepts/autonomy-slider.mdx | 96 +++++++++++++++++ .../cards/zh/concepts/backdoor-criterion.mdx | 88 +++++++++++++++ .../cards/zh/concepts/bag-of-heuristics.mdx | 94 ++++++++++++++++ .../cards/zh/concepts/bayesian-induction.mdx | 79 ++++++++++++++ .../cards/zh/concepts/bitter-lesson.mdx | 80 ++++++++++++++ .../zh/concepts/causal-contextualism.mdx | 69 ++++++++++++ .../zh/concepts/causal-inner-product.mdx | 69 ++++++++++++ .../cards/zh/concepts/causal-intervention.mdx | 90 ++++++++++++++++ .../cards/zh/concepts/causal-models.mdx | 90 ++++++++++++++++ .../cards/zh/concepts/causal-relata.mdx | 63 +++++++++++ .../cards/zh/concepts/causation-hume.mdx | 80 ++++++++++++++ .../concepts/chaos-engineering-for-agents.mdx | 77 +++++++++++++ .../claude-code-permission-system.mdx | 101 ++++++++++++++++++ 15 files changed, 1213 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/aitia.mdx create mode 100644 site/src/content/cards/zh/concepts/augmented-llm.mdx create mode 100644 site/src/content/cards/zh/concepts/autonomy-slider.mdx create mode 100644 site/src/content/cards/zh/concepts/backdoor-criterion.mdx create mode 100644 site/src/content/cards/zh/concepts/bag-of-heuristics.mdx create mode 100644 site/src/content/cards/zh/concepts/bayesian-induction.mdx create mode 100644 site/src/content/cards/zh/concepts/bitter-lesson.mdx create mode 100644 site/src/content/cards/zh/concepts/causal-contextualism.mdx create mode 100644 site/src/content/cards/zh/concepts/causal-inner-product.mdx create mode 100644 site/src/content/cards/zh/concepts/causal-intervention.mdx create mode 100644 site/src/content/cards/zh/concepts/causal-models.mdx create mode 100644 site/src/content/cards/zh/concepts/causal-relata.mdx create mode 100644 site/src/content/cards/zh/concepts/causation-hume.mdx create mode 100644 site/src/content/cards/zh/concepts/chaos-engineering-for-agents.mdx create mode 100644 site/src/content/cards/zh/concepts/claude-code-permission-system.mdx diff --git a/site/src/content/cards/zh/concepts/aitia.mdx b/site/src/content/cards/zh/concepts/aitia.mdx new file mode 100644 index 0000000..57543fe --- /dev/null +++ b/site/src/content/cards/zh/concepts/aitia.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Aitia — 原因与解释 +titleAlt: Aitia (Aristotle) +tagline: 希腊哲学 · 原因即解释 · 四因说的基础 +refs: + - concepts/four-causes + - concepts/teleological-explanation +sourceLine: Stanford Encyclopedia · Aristotle on Causality +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + +
+ 概念 · AITIA · 亚里士多德 + +
+
+

Aitia — αἰτία

+

原因与解释的双重含义 · 四因说的基础概念

+
+
+ + + Aitia 兼有"原因"和"解释"双重含义——这不是翻译模糊,而是亚里士多德刻意维持的概念张力。原因就是解释;解释就是回答"为什么"(dia ti)的问题。 + + + +
+
+ 形而上学面向 +

原因是世界中事物之间的实际解释关系——自然界某些要素确实解释了另一些要素

+
+
+ 认识论面向 +

"只有在掌握了事物的原因时才拥有对它的知识"(APst. I 2)——理解即掌握原因

+
+
+ 因果多元主义 +

同一事物可以有多于一种的非偶然原因——本体论承诺,不是认识不完整的妥协

+
+
+ 解释力标准 +

固有因(kath'hauton)vs 偶然因——"X 的女儿做了铜像"为真,但不构成解释

+
+
+
+ + +

前辈哲学家"像缺乏技术的拳手——偶尔能打出漂亮的一拳,但命中的都是运气"——他们使用因果性,但没有理解因果性。

+
+ + +
+ → 四因说 · 目的论解释 + 亚里士多德 · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/augmented-llm.mdx b/site/src/content/cards/zh/concepts/augmented-llm.mdx new file mode 100644 index 0000000..a85d208 --- /dev/null +++ b/site/src/content/cards/zh/concepts/augmented-llm.mdx @@ -0,0 +1,62 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 增强型 LLM +titleAlt: Augmented LLM +tagline: 检索 + 工具 + 记忆 · Agentic 系统的基础构建块 +refs: + - concepts/context-engineering + - concepts/agentic-systems + - concepts/tool-design +sourceLine: Anthropic Building Effective Agents · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · AUGMENTED LLM · AGENTIC 基础构建块 + + + +

增强型 LLM

+

Augmented LLM — LLM + 检索 + 工具 + 记忆

+
+ + + Agentic 系统的基础构建块。当前模型已能主动使用增强能力:自己生成搜索查询、选择工具、决定保留什么。关键:针对具体用例裁剪,而非堆叠通用能力。 + + + + + 按需加载相关 context;Just-in-time 胜过 upfront 堆砌;Claude Code = CLAUDE.md 预加载 + glob/grep 按需 + MCP 标准化接口;工具文档即 ACI 设计;不可预测的工具行为是 agent 失败的首要来源 + 会话内 context window;跨会话外部存储;记忆 overhead 可能超过收益(episodic memory 实验教训) + + + + +
+ Karpathy + LLM = CPU(原始计算力);增强 LLM = CPU + 协处理器/外设——检索是 DMA,工具是 I/O,记忆是缓存层级。但这颗 CPU 处理的是 token,行为是统计性的——不能假设工具调用幂等。 +
+
+ + +
+ → Context Engineering · Agentic Systems · Tool Design · MCP + Anthropic (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/autonomy-slider.mdx b/site/src/content/cards/zh/concepts/autonomy-slider.mdx new file mode 100644 index 0000000..97b80c8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/autonomy-slider.mdx @@ -0,0 +1,96 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 自主度滑块 +titleAlt: Autonomy Slider +tagline: 从 Tab 补全到全 Repo Agent · 部分自主产品设计 +refs: + - concepts/agentic-systems + - concepts/harness-engineering + - concepts/generation-verification-loop +sourceLine: Karpathy YC Software is Changing Again · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · AUTONOMY SLIDER · 部分自主产品 + + + +

自主度滑块

+

Autonomy Slider — Karpathy 提出的部分自主产品设计原则

+
+ + + 现阶段应造 Iron Man 战甲(augmentation),不是 Iron Man 机器人(full agent)。但不要丢掉 slider——产品应预留向更高自主度演进的路径。这是 agent 的十年,不是 agent 之年。 + + + +
+ Cursor 的自主度阶梯 +
+
+ Tab 补全 + 用户在掌控,AI 只提建议 + 人类控制:高 +
+
+ Cmd+K(改选中代码) + 用户指定范围和意图 + 人类控制:中高 +
+
+ Cmd+L(改整个文件) + 用户给出意图,AI 决定改动 + 人类控制:中 +
+
+ Cmd+I(全 repo agent) + 用户只给目标,AI 自主决策路径 + 人类控制:低 +
+
+
+
+ + +
+ 上下文管理 + · + 多 LLM 编排 + · + 专用 GUI(diff 比文本快) + · + 自主度可调 +
+

Tesla Autopilot:从 2013 完美 demo 到今天仍未完全解决——12 年的渐进演化。

+
+ + +
+ → Agentic Systems · Harness Engineering · Generation-Verification + Karpathy YC (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/backdoor-criterion.mdx b/site/src/content/cards/zh/concepts/backdoor-criterion.mdx new file mode 100644 index 0000000..7b5a64a --- /dev/null +++ b/site/src/content/cards/zh/concepts/backdoor-criterion.mdx @@ -0,0 +1,88 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 后门准则 +titleAlt: Backdoor Criterion +tagline: 图形化去混淆判据 · Pearl 后门调整公式 +refs: + - concepts/causal-dag + - concepts/do-calculus + - concepts/frontdoor-criterion +sourceLine: Pearl Causality 2009 · Pearl 2010 Intro to Causal Inference +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · BACKDOOR CRITERION · 因果推理 + + + +

后门准则

+

Backdoor Criterion — 图形化去混淆的充分条件判据

+
+ + + 变量集 S 满足后门准则:① S 中无 X 的后代;② S 阻断 X→Y 的所有"后门路径"(以箭头指向 X 结尾的路径)。满足时,后门调整公式成立。 + + + +
+ + + + + + + + X + + Y + + Z + 混淆因子 + + + + 条件化 Z → 阻断后门路径 Z→X→Y + Z 满足后门准则(Z 非 X 后代) + +
+
+ + + P(Y | do(X=x)) = Σs P(Y | X=x, S=s) P(S=s) +
+

⚠ 充分集不唯一:同一 DAG 可能有多个满足准则的集合,选测量成本最低的

+

⚠ 不要盲目控制所有预处理变量——对撞节点被条件化反而增加偏差

+
+
+ + +
+ → Causal DAG · do 演算 · 前门准则 · 中介分析 + Pearl (2009, 2010) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/bag-of-heuristics.mdx b/site/src/content/cards/zh/concepts/bag-of-heuristics.mdx new file mode 100644 index 0000000..cd62142 --- /dev/null +++ b/site/src/content/cards/zh/concepts/bag-of-heuristics.mdx @@ -0,0 +1,94 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 启发式规则集合 +titleAlt: Bag of Heuristics +tagline: 局部 · 位置特异 · 无统一算法的世界模型 +refs: + - concepts/othello-world-model-hypothesis + - concepts/mechanistic-interpretability + - concepts/probing-classifiers +sourceLine: jylin04 MATS 6.0 · OthelloGPT 机制可解释性分析 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · BAG OF HEURISTICS · 机制可解释性 + + + +

启发式规则集合

+

Bag of Heuristics — 无统一算法的分散实现

+
+ + + 模型不是实现了一个统一可组合的算法,而是积累了大量局部的、位置特异的 if-then 规则,其聚合效果在宏观上近似"世界模型"——但没有任何中央协调机制。 + + + +
+ MLP 神经元 L1N421 的具体规则(OthelloGPT) +
+ IF 刚落子 A4 + AND B4 非空(L0N377 判断) + AND C4 非空 + → 将 B4+C4+D4 更新为"对方" +
+
+ 位置特异:不可平移 + 局部性:仅 A-D 列 + 独立性:不共享参数 +
+
+
+
+ 算法统一Bag of Heuristics +
+
+ 表征准确 + 理想世界模型 + ← OthelloGPT 实际情况 +
+
+ 表征不准 + 执行错误 + 两者皆无 +
+
+
+ + +

泛化性担忧:局部规则集合在训练分布内工作良好,但在稀有/新颖配置下更可能失败——benchmark 优秀不意味着底层算法健全。

+
+ + +
+ → Othello 世界模型 · 机制可解释性 · 探针分类器 + jylin04 MATS 6.0 (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/bayesian-induction.mdx b/site/src/content/cards/zh/concepts/bayesian-induction.mdx new file mode 100644 index 0000000..2a77a61 --- /dev/null +++ b/site/src/content/cards/zh/concepts/bayesian-induction.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 贝叶斯归纳 +titleAlt: Bayesian Induction +tagline: 先验 → 后验更新 · 归纳的概率化方案 +refs: + - concepts/induction-problem + - concepts/uniformity-principle + - concepts/scaling-laws +sourceLine: Bayes 1764 · Laplace 1814 · SEP Problem of Induction +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · BAYESIAN INDUCTION · 归纳推理 + + + +

贝叶斯归纳

+

Bayesian Induction — 用概率框架重述归纳推理

+
+ + + 为假说赋予先验,观察后用贝叶斯规则更新为后验,再据此预测。提供精确的从观察到预测路径——但先验的选择引入了不可消除的假设,这正是经验假设进入推理的地方。 + + + + p(H | E) = p(E | H) · p(H) / p(E) +
+
+ p(H) + 先验 + 观察前的信念 = 归纳偏置 = 架构选择 +
+
+ p(E|H) + 似然 + 假说为真时观察到证据的概率 +
+
+ p(H|E) + 后验 + 更新后的信念 = 微调/in-context learning +
+
+
+ + +
+ 无差别原则导致 Bertrand 悖论;主观主义接受先验是个人信念——没有"无偏"的模型 + 均匀分布下所有算法期望泛化误差 = 1/2;有效学习依赖特定假设下的模型相对保证 + 100 次白球→下一次白的概率 = 101/102 ≈ 0.99,不是 1——归纳结论永远概率性 +
+
+ + +
+ → 归纳问题 · 齐一性原则 · 缩放定律 · No Free Lunch + Bayes (1764) · Laplace (1814) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/bitter-lesson.mdx b/site/src/content/cards/zh/concepts/bitter-lesson.mdx new file mode 100644 index 0000000..b2b0949 --- /dev/null +++ b/site/src/content/cards/zh/concepts/bitter-lesson.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 苦涩的教训 +titleAlt: The Bitter Lesson +tagline: 通用计算终将胜出 · 不要内建你发现了什么 +refs: + - concepts/harness-engineering + - concepts/meta-harness + - concepts/scaling-laws +sourceLine: Rich Sutton 2019 · Anthropic Managed Agents +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Quote from '~/components/card/blocks/Quote.astro'; + + +
+ 概念 · BITTER LESSON · SUTTON 2019 + +
+
+

苦涩的教训

+

The Bitter Lesson — AI 研究的元原则

+
+
+ + + 利用通用计算(搜索和学习)的方法最终总是以巨大优势胜出。将人类领域知识内建到系统中虽短期有效,但长期会停滞甚至阻碍进展。 + + + + 我们应该内建能找到和捕捉复杂性的元方法,而不是内建我们认为自己已经发现的东西。 +
+
+ 1 + 研究者观察到模型局限 → 在 harness 中加入补偿机制 +
+
↓ 模型升级
+
+ 2 + 补偿机制变成死重 → "context anxiety" reset 在新模型上消失 +
+
↓ 正确方向
+
+ 3 + "我可以停止做什么?" 删除过时假设,向模型交还主权 +
+
+
+ + +

OS 类比:read() 系统调用从 1970 年代到今天适用于所有存储介质——因为它没有内建任何关于硬件的具体知识。元接口的持久性验证了 Bitter Lesson。

+
+ + +
+ → Harness Engineering · Meta-Harness · Scaling Laws + Sutton (2019) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causal-contextualism.mdx b/site/src/content/cards/zh/concepts/causal-contextualism.mdx new file mode 100644 index 0000000..7bc646b --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-contextualism.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果语境主义 +titleAlt: Causal Contextualism +tagline: 因果判断是否依赖评估语境?三种立场 +refs: + - concepts/counterfactual-theory + - concepts/causal-models + - concepts/causal-relata +sourceLine: SEP Counterfactual Theories of Causation · Schaffer 2005 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · CAUSAL CONTEXTUALISM · 因果形而上学 + + + +

因果语境主义

+

Causal Contextualism — 因果关系是客观的还是语境依赖的?

+
+ + + 核心问题:因果判断是像质量一样客观不变,还是像"高"一样随语境变化?"Suzy 偷了椰子蛋糕导致生病"——对比项不同,真值不同。 + + + + + 因果是客观关系;不同语境只是选择提及什么(语用问题),不影响因果真值 + 因果是四元关系:c 而非 c* 导致 e 而非 e*;语境固定隐含对比项 + 同一声明在不同语境中有不同真值——"什么算作原因"本身随语境变化 + + + + +
+

园丁与女王测试案例

+

两人都没浇水,花都死了,因果依赖相同。但大多数人判断只有园丁的不作为是原因——因为女王从无此习惯,也无人期待。

+
+ 不变主义:两者都是原因,但女王的不值得提 + 语境主义:常态性区分使女王不"算作"原因 +
+
+
+ + +
+ → 反事实理论 · 因果模型 · 因果关系项 + Lewis (1986) · Schaffer (2005) · Menzies (2017) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causal-inner-product.mdx b/site/src/content/cards/zh/concepts/causal-inner-product.mdx new file mode 100644 index 0000000..26b14f0 --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-inner-product.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果内积 +titleAlt: Causal Inner Product +tagline: 因果可分离的概念在此内积下正交 +refs: + - concepts/linear-representation-hypothesis + - concepts/probing-classifiers + - concepts/mechanistic-interpretability +sourceLine: Park, Choe, Veitch 2023 · arXiv 2311.03658 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 概念 · CAUSAL INNER PRODUCT · 线性表征 + + + +

因果内积

+

Causal Inner Product — 为 LLM 表征空间定义"正确"的几何

+
+ + + 欧氏内积的问题:训练目标只由概率分布决定,同一分布可由无数个表征实现(差一个可逆线性变换)——余弦相似度结果取决于训练随机性,而非语义。因果内积解决了这个问题。 + + + +
+ 核心定义 +

因果内积中,因果可分离的概念 W 和 Z(可独立变化,如"语言"和"性别")的向量正交:

+ ⟨γ̄_W, γ̄_Z⟩_C = 0 +
+
+ 显式构造(由非嵌入矩阵决定) + ⟨γ̄, γ̄'⟩_C := γ̄ᵀ Cov(γ)⁻¹ γ̄' +

Cov(γ)⁻¹ 是词汇非嵌入矩阵的协方差逆矩阵——无需额外训练或人工标注

+
+
+ 统一三种 LRH 表征 +

在因果内积下,非嵌入表征与嵌入表征通过 Riesz 同构统一——同一方向向量可同时用于探针和 steering vector

+
+
+ + +

LLaMA-2 7B 验证:27 个概念在因果内积下呈现 block diagonal 热力图——语义相似的概念聚集成块,因果可分离的概念近似正交。

+
+ + +
+ → 线性表征假说 · 探针分类器 · 机制可解释性 + Park et al. (2023) ICML 2024 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causal-intervention.mdx b/site/src/content/cards/zh/concepts/causal-intervention.mdx new file mode 100644 index 0000000..79de0c0 --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-intervention.mdx @@ -0,0 +1,90 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果干预 +titleAlt: Causal Intervention +tagline: do 算子 · 切断原有输入 · 图上的微型手术 +refs: + - concepts/do-calculus + - concepts/causal-dag + - concepts/structural-causal-model +sourceLine: Pearl Causality 2009 · Pearl 2010 Intro +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 概念 · CAUSAL INTERVENTION · 因果之梯第二级 + + + +

因果干预

+

Causal Intervention — do 算子与"微型手术"

+
+ + + 干预 = 切断变量原有的因果输入,将其固定为指定值。Pearl 称之为 DAG 上的"微型手术":删除指向被干预变量的所有箭头。这使 do(X=x) 与 P(Y|X=x) 有根本不同。 + + + +
+
+ 观察 + P(康复 | 吃药) + 可能混入选择偏差——健康的人更倾向吃药 +
+
+
+ 干预 + P(康复 | do(吃药)) + 随机分组切断选择偏差;do 算子删除了"为何吃药"的原因 +
+
+
+ 两条实现路径 +
+ RCT(实验) + 随机分组使处理分配独立于所有混淆因子——直接但不总是可行 +
+
+ do 演算(形式化) + 后门/前门调整将 do 表达式转为可估计的观察概率 +
+
+
+ + + P(Y | do(X=x)) = Σz P(Y | X=x, Z=z) P(Z=z) +

Pearl 2010:因果核心是信号的传递与感知,而非实验者的物理操纵——"没有操纵就没有因果"应被拒绝。

+
+ + +
+ → do 演算 · Causal DAG · SCM · 因果之梯 + Pearl (2009, 2010) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causal-models.mdx b/site/src/content/cards/zh/concepts/causal-models.mdx new file mode 100644 index 0000000..a148d2f --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-models.mdx @@ -0,0 +1,90 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果模型 +titleAlt: Causal Models +tagline: 结构方程 · 干预语义 · 模块性 +refs: + - concepts/structural-causal-model + - concepts/causal-dag + - concepts/interventionist-theory +sourceLine: SEP Metaphysics of Causation · Pearl 2000 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · CAUSAL MODELS · 形式化工具 + + + +

因果模型

+

Causal Models — 编码变量间因果影响的形式化工具

+
+ + + 结构方程模型(SEM)用非对称方程 D ≔ C 编码因果方向——不同于数学等式 D = C 的对称性。干预在此模型中的操作:删除 V 的结构方程,将 V 视为外生变量。 + + + +
+
+ 核心构成 + 值由模型内方程决定(出现在左侧) + 值由模型外因素决定(只出现在右侧) + D ≔ C(非对称,编码方向) + 外生变量赋值唯一确定所有内生变量 +
+
+ 干预操作步骤 +
+ ① 删除 V 的结构方程 + ② 将 V 视为外生变量,设为指定值 + ③ 保持其他方程不变 + ④ 求解剩余变量 +
+
+
+
+ + +
+ 模型准确性标准(争议中) +
+ 反事实充分性 + 模型蕴含的反事实族都为真 +
+
+ 模块性 + 每个方程可独立被干预破坏——这是干预可行的前提 +
+
+ 稳定性 + 添加额外变量不推翻既有因果判断 +
+
+
+ + +
+ → SCM · Causal DAG · 干预主义理论 · 反事实理论 + Pearl (2000) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causal-relata.mdx b/site/src/content/cards/zh/concepts/causal-relata.mdx new file mode 100644 index 0000000..39249ee --- /dev/null +++ b/site/src/content/cards/zh/concepts/causal-relata.mdx @@ -0,0 +1,63 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果关系项 +titleAlt: Causal Relata +tagline: 原因和结果各是什么类型的实体? +refs: + - concepts/causal-models + - concepts/counterfactual-theory +sourceLine: SEP Metaphysics of Causation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · CAUSAL RELATA · 因果形而上学基础 + + + +

因果关系项

+

Causal Relata — 因果关系两端的实体类型之争

+
+ + + 原因和结果各自是什么类型的实体?这个基础性问题对它的回答决定了整个因果理论的承诺。"因果差异论证"反复施压:c 是原因而 c* 不是 → 两者必须是不同实体。 + + + + + 最流行——但个体化标准有争议:粗粒度(Quine)/ Davidson 因果个体化 / Kim 细粒度(属性+对象+时间) / Lewis 属性论 + 处理缺席/遗漏为原因——"Anna 没浇水"不是事件但可以是事实;反对者否认缺席是真正的原因 + 建模传统:Hitchcock/Woodward。重点不是单个值,而是它如何被打包进变量——同一 Kim 式三元组,不同变量角色不同 + 因果是四元关系:c 而非 c* 导致 e 而非 e*。焦点/重音固定隐含对比项,无需区分关系项本身 + + + + +
+ Dretske 论证 + Susan 偷了自行车导致被捕(变量="做了什么")vs Susan 了自行车没有导致被捕(变量="偷了什么",安保对任何偷盗均报警)——同一 Kim 三元组,不同变量,不同因果角色 +
+
+ + +
+ → 因果模型 · 反事实理论 · 因果语境主义 + SEP (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/causation-hume.mdx b/site/src/content/cards/zh/concepts/causation-hume.mdx new file mode 100644 index 0000000..8a47d67 --- /dev/null +++ b/site/src/content/cards/zh/concepts/causation-hume.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果性(休谟) +titleAlt: Causation (Hume) +tagline: 必然联系不可观察 · 习惯是因果推理的真正基础 +refs: + - concepts/constant-conjunction + - concepts/necessary-connection + - concepts/regularity-theory +sourceLine: David Hume Enquiry 1748 · SEP David Hume +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Quote from '~/components/card/blocks/Quote.astro'; + + +
+ 概念 · 休谟因果性 + +
+
+

因果性(休谟)

+

Causation — 必然联系在我们之中,不在事物之中

+
+
+ + + 批判:先验推理无效;经验推理循环(预设齐一性原则);必然联系不可观察——只有恒常连结。建构:习惯(custom/habit)是因果推理的真正驱动力,不是理性。 + + + +
+
+ 批判阶段(理性基础被瓦解) +
    +
  • 先验推理:从未见过火的人不能推断火会灼伤
  • +
  • 经验推理:依赖未来像过去→需要预设齐一性→循环
  • +
  • 必然联系:经验中只能观察到连结,从未观察到联系
  • +
+
+
+ 建构阶段(习惯的真正基础) +
    +
  • 恒常连结后,习惯形成"期望"倾向
  • +
  • 必然联系观念来自"心灵的决定感"——内部印象
  • +
  • 必然性在我们之中,不在事物之中
  • +
+
+
+
+ + + 如果第一个对象没有存在,第二个就永远不会存在。 +

休谟其实给出了历史上第一个反事实定义——但此路线要到 1970 年代可能世界语义学出现后才被 Lewis 系统发展。

+
+ + +
+ → 恒常连结 · 必然联系 · 规则性理论 · 反事实理论 + Hume (1748) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/chaos-engineering-for-agents.mdx b/site/src/content/cards/zh/concepts/chaos-engineering-for-agents.mdx new file mode 100644 index 0000000..0ea767f --- /dev/null +++ b/site/src/content/cards/zh/concepts/chaos-engineering-for-agents.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 混沌工程 +titleAlt: Chaos Engineering for Agents +tagline: 故障注入 · 可靠性退化测量 · 生产压力模拟 +refs: + - concepts/guardrails + - concepts/reliability-surface + - concepts/error-cascade +sourceLine: ReliabilityBench · arXiv 2601.06112 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · CHAOS ENGINEERING FOR AGENTS · 故障注入 + + + +

Agent 混沌工程

+

Chaos Engineering — Netflix Chaos Monkey 方法论在 Agent 评估中的应用

+
+ + + 在工具调用层系统性注入生产环境常见故障,测量 agent 在基础设施不稳定条件下的可靠性退化。故障注入是 guardrails 的测试对偶——制造故障来验证防御是否有效。 + + + +
+
+ 类别故障类型可恢复 +
+
+ 网络TransientTimeout / ConnectionReset +
+
+ 限流SoftRateLimit / HardRateLimit部分 +
+
+ 数据PartialResponse / SchemaDrift / StaleData +
+
+
+ + +
+ 纯限流通过率 93.75% vs 基线 96.25%;agent 普遍缺乏退避重试逻辑 + ReAct 恢复率 80.9% vs Reflexion 67.3%——反思在错误观察上建立的"教训"反而误导 + ∂R/∂λ 绝对值大于 ∂R/∂ε;容错比鲁棒性对 agent 更重要 +
+
+ + +
+ → Guardrails · 可靠性曲面 · Error Cascade · Harness + ReliabilityBench (2026) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/claude-code-permission-system.mdx b/site/src/content/cards/zh/concepts/claude-code-permission-system.mdx new file mode 100644 index 0000000..3a1863f --- /dev/null +++ b/site/src/content/cards/zh/concepts/claude-code-permission-system.mdx @@ -0,0 +1,101 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Claude Code 权限系统 +titleAlt: Claude Code Permission System +tagline: 三级工具分类 · allow/ask/deny 规则 · 纵深防御 +refs: + - concepts/permission-rules-hierarchy + - concepts/permission-modes + - concepts/agent-sandboxing +sourceLine: Anthropic Claude Code Permissions · 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · CLAUDE CODE 权限系统 · 分层审批 + + + +

Claude Code 权限系统

+

Claude Code Permission System — 基于可逆性的分层工具审批

+
+ + + 三级结构背后的设计逻辑是可逆性:只读操作无副作用可自由执行;文件修改可撤销(git),会话级授权够用;Bash 命令可能执行任意系统操作,需要永久记录。 + + + +
+
+ 只读工具 + Read · Grep · Glob + 无需审批 +
+
+ 文件修改工具 + Edit · Write + "不再询问" → 会话内永久授权 +
+
+ Bash 命令 + Shell 执行(任意系统操作) + "不再询问" → 保存为永久 allow 规则 +
+
+
+ 规则语法示例 +
+ allow: ["Bash(npm run *)", "WebFetch(domain:github.com)"] + deny: ["Bash(git push *)", "Read(~/.ssh/**)"] +
+
+
+ + +
+
+ 权限层(应用层) + 控制 Claude 能调用哪些工具 +
+
+ 沙箱层(OS 层) + 控制 Bash 子进程能访问什么(Read deny 不阻止 cat .env) +
+
+ Hooks 层(动态层) + PreToolUse 注入自定义策略,exit 2 阻止调用 +
+
+
+ + +
+ → 规则层次 · 权限模式 · Agent 沙箱 · Guardrails + Anthropic (2026) +
+
+ + From f50df43ca6ad39441fd46100151a8c59451c5166 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:22:52 +0800 Subject: [PATCH 25/48] =?UTF-8?q?feat(cards):=20batch=203/18=20=E2=80=94?= =?UTF-8?q?=20concepts/cli-vs-gui-automation=E2=86=92error-cascade=20(15?= =?UTF-8?q?=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../zh/concepts/cli-vs-gui-automation.mdx | 82 ++++++++++++++++ .../cards/zh/concepts/coastline-paradox.mdx | 91 ++++++++++++++++++ .../cards/zh/concepts/compositionality.mdx | 64 +++++++++++++ .../zh/concepts/constant-conjunction.mdx | 79 +++++++++++++++ .../zh/concepts/constrained-decoding.mdx | 87 +++++++++++++++++ .../cards/zh/concepts/context-compression.mdx | 91 ++++++++++++++++++ .../cards/zh/concepts/context-engineering.mdx | 80 ++++++++++++++++ .../zh/concepts/context-free-grammar-llm.mdx | 95 +++++++++++++++++++ .../cards/zh/concepts/context-management.mdx | 71 ++++++++++++++ .../content/cards/zh/concepts/context-rot.mdx | 68 +++++++++++++ .../zh/concepts/counterfactual-theory.mdx | 76 +++++++++++++++ .../cards/zh/concepts/custom-and-habit.mdx | 73 ++++++++++++++ .../cards/zh/concepts/difference-making.mdx | 58 +++++++++++ .../content/cards/zh/concepts/empiricism.mdx | 71 ++++++++++++++ .../cards/zh/concepts/error-cascade.mdx | 84 ++++++++++++++++ 15 files changed, 1170 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/cli-vs-gui-automation.mdx create mode 100644 site/src/content/cards/zh/concepts/coastline-paradox.mdx create mode 100644 site/src/content/cards/zh/concepts/compositionality.mdx create mode 100644 site/src/content/cards/zh/concepts/constant-conjunction.mdx create mode 100644 site/src/content/cards/zh/concepts/constrained-decoding.mdx create mode 100644 site/src/content/cards/zh/concepts/context-compression.mdx create mode 100644 site/src/content/cards/zh/concepts/context-engineering.mdx create mode 100644 site/src/content/cards/zh/concepts/context-free-grammar-llm.mdx create mode 100644 site/src/content/cards/zh/concepts/context-management.mdx create mode 100644 site/src/content/cards/zh/concepts/context-rot.mdx create mode 100644 site/src/content/cards/zh/concepts/counterfactual-theory.mdx create mode 100644 site/src/content/cards/zh/concepts/custom-and-habit.mdx create mode 100644 site/src/content/cards/zh/concepts/difference-making.mdx create mode 100644 site/src/content/cards/zh/concepts/empiricism.mdx create mode 100644 site/src/content/cards/zh/concepts/error-cascade.mdx diff --git a/site/src/content/cards/zh/concepts/cli-vs-gui-automation.mdx b/site/src/content/cards/zh/concepts/cli-vs-gui-automation.mdx new file mode 100644 index 0000000..3e93953 --- /dev/null +++ b/site/src/content/cards/zh/concepts/cli-vs-gui-automation.mdx @@ -0,0 +1,82 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: CLI vs GUI 自动化 +titleAlt: CLI vs GUI Automation +tagline: Agent 驱动软件的两条根本路线 +refs: + - concepts/agent-native-software + - concepts/aci +sourceLine: CLI-Anything · Anthropic computer-use +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · CLI VS GUI AUTOMATION · 哲学分歧 + + + +

CLI vs GUI 自动化

+

Agent 驱动存量软件的两条根本路线

+
+ + + 不是战术差异,而是对"agent 与软件应该如何相处"的根本哲学分歧。GUI 让 agent 像人一样操作 UI;CLI 给软件套结构化接口让 agent 直接调用功能。 + + + +
+
+ 维度GUI AutomationCLI Generation +
+
接口像素 / Accessibility Tree命令字符串 / JSON
+
生成时成本低(无需分析内部)高(需生成/测试/维护)
+
运行时成本高(截图 tokens + 慢速)低(纯文本,毫秒响应)
+
稳定性低(UI 改版即崩)高(CLI 命令相对稳定)
+
可并行性难(独占屏幕)天然并发
+
可审计弱(截图记录)强(命令历史即 log)
+
+
+ + +
+
+ GUI 擅长 + 完全闭源软件 · 视觉判断任务 · 临时一次性操作 · 人机协作场景 +
+
+ CLI 擅长 + 可重复结构化工作流 · 有数据模型的软件 · 高并发 · 长时运行跨会话任务 +
+
+
+ + +
+ → Agent Native Software · ACI · CLI-Anything + CLI-Anything (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/coastline-paradox.mdx b/site/src/content/cards/zh/concepts/coastline-paradox.mdx new file mode 100644 index 0000000..86999a9 --- /dev/null +++ b/site/src/content/cards/zh/concepts/coastline-paradox.mdx @@ -0,0 +1,91 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 海岸线悖论 +titleAlt: Coastline Paradox +tagline: 测量单位越小,长度越大 · 分形维数的直觉入口 +refs: + - concepts/fractal-dimension + - concepts/statistical-self-similarity +sourceLine: Mandelbrot 1967 · Wikipedia Coastline Paradox +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 概念 · COASTLINE PARADOX · 分形几何 + + + +

海岸线悖论

+

Coastline Paradox — 没有确定长度的边界

+
+ + + 海岸线没有确定长度。测量单位越小,测得的总长度越大,理论上趋向无穷。直尺放大后仍是直线;海岸线放大后暴露出更多湾与岬——这就是可求长曲线与分形曲线的本质区别。 + + + +
+ + 测量尺度 ε 对测量长度 L 的影响 + + ε 大(粗) + + + L ≈ 100 + + + ε 小(细) + + L ≈ 180 + + L(ε) ~ F · ε^(1-D) 其中 D = 分形维数 > 1 + 当 D > 1 时:ε → 0 ⇒ L → ∞ + +
+
+ + +
+
+ 光滑曲线(圆) + 内接多边形边数→∞,周长收敛到 2πr。这是"可求长曲线"(rectifiable)。 +
+
vs
+
+ 分形曲线(海岸线) + 精度提高只会增加长度,永远不收敛。分形维数 D > 1 是数学表征。 +
+
+
+ + +
+ → 分形维数 · 统计自相似性 + Mandelbrot (1967) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/compositionality.mdx b/site/src/content/cards/zh/concepts/compositionality.mdx new file mode 100644 index 0000000..d26314a --- /dev/null +++ b/site/src/content/cards/zh/concepts/compositionality.mdx @@ -0,0 +1,64 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 组合性 +titleAlt: Compositionality +tagline: 复杂表达式的意义 = 部分意义 × 组合方式 +refs: + - concepts/systematicity + - concepts/language-of-thought + - concepts/neurosymbolic-ai +sourceLine: Frege 1892 · Fodor-Pylyshyn 1988 · arXiv 2407.13419 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · COMPOSITIONALITY · 语义学原则 + + + +

组合性

+

Compositionality — Frege 原则与认知系统性

+
+ + + 复杂表达式的意义是其组成部分的意义及组合方式的系统性函数。用有限词汇+有限规则生成无限理解——这就是人类语言能力的秘密,也是符号 AI 的核心诉求。 + + + + M(f(a, b)) = F(M(a), M(b), f) + + 有限词汇+规则 → 理解无限新表达式——学会部分,就能组合出任意新表达 + "John loves Mary"的表征包含 JOHN、LOVES、MARY → 保证理解"Mary loves John"的能力 + 新表达的意义完全由已知的部分意义确定——这是神经网络难以保证的 + + + + +
+ LLM 的组合性挑战 + LLM 展示组合泛化但不如人类系统,且对长句柄不组合错误(compositional tail failures)敏感。神经符号混合架构(SCAN/COGS 基准测试)提供了修补路径。 +
+
+ + +
+ → 系统性 · 思维语言 · 神经符号 AI + Frege (1892) · Fodor-Pylyshyn (1988) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/constant-conjunction.mdx b/site/src/content/cards/zh/concepts/constant-conjunction.mdx new file mode 100644 index 0000000..c854fb6 --- /dev/null +++ b/site/src/content/cards/zh/concepts/constant-conjunction.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 恒常连结 +titleAlt: Constant Conjunction +tagline: 休谟因果性的经验基础 · 我们实际观察到的全部 +refs: + - concepts/causation-hume + - concepts/necessary-connection + - concepts/custom-and-habit +sourceLine: David Hume Enquiry 1748 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · CONSTANT CONJUNCTION · 休谟经验主义 + + + +

恒常连结

+

Constant Conjunction — 因果推理中实际可观察的全部

+
+ + + 当 A 类事件在经验中总是先于 B 类事件出现,就是恒常连结。休谟的核心洞见:这是我们在因果关系中实际观察到的全部内容。超出恒常连结的"必然联系"来自心灵,不来自事物。 + + + +
+
+ 经验输入 + 重复观察 A→B 的恒常连结 +
+
↓ 习惯运作
+
+ 心理机制 + 形成"倾向":遇到 A 时自动期望 B;重复100万次与第1次在经验内容上无区别 +
+
↓ 产生
+
+ 认知输出 + 必然联系的观念("心灵的决定感")+ 因果信念 +
+
+
+ + +
+ 恒常连结 = 可观察的事实;必然联系 = 心灵的投射,不可观察 + 简单印象与简单观念之间也存在恒常连结——休谟据此推断两者的因果关系 + 缩放定律是一种"恒常连结"——从过去数据规律推断未来趋势 +
+
+ + +
+ → 因果性(休谟)· 必然联系 · 习惯 · 规则性理论 + Hume (1748) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/constrained-decoding.mdx b/site/src/content/cards/zh/concepts/constrained-decoding.mdx new file mode 100644 index 0000000..97cce24 --- /dev/null +++ b/site/src/content/cards/zh/concepts/constrained-decoding.mdx @@ -0,0 +1,87 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 约束解码 +titleAlt: Constrained Decoding +tagline: 将非法 token 概率强制置零 · 结构化输出的底层机制 +refs: + - concepts/structured-outputs + - concepts/context-free-grammar-llm +sourceLine: RANLP 2025 · OpenAI Structured Outputs +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · CONSTRAINED DECODING · 结构化输出底层 + + + +

约束解码

+

Constrained Decoding — 动态 token 掩码强制合法输出

+
+ + + {"每步采样前构造合法 token 的掩码,将非法 token 概率强制置零。核心难点:合法集随已生成序列动态变化——已生成 val 时,{ 不再合法。必须实现动态约束解码。"} + + + +
+
+ +
+ JSON Schema → CFG 编译 + 将 schema 编译为上下文无关文法;处理递归嵌套结构(FSM 无法原生处理) +
+
+
+ +
+ 预处理 + 缓存 + 首次请求一次性开销;后续复用缓存的 CFG 制品 +
+
+
+ +
+ 每步动态掩码 + 根据当前已生成序列 + CFG 状态计算合法 token 集;将非法 token 概率 mask = 0 +
+
+
+
+ + +
+ 隐性成本(RANLP 2025) + 约束解码延迟随 token 词汇表大小和 schema 复杂度增长,在 LLM 推理总延迟中占比可达 40%+。ACI 的"机器可验证契约"是好的,但要认识到 overhead。 +
+
+ + +
+ → Structured Outputs · Context-Free Grammar · ACI + OpenAI (2024) · RANLP (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/context-compression.mdx b/site/src/content/cards/zh/concepts/context-compression.mdx new file mode 100644 index 0000000..7ae70db --- /dev/null +++ b/site/src/content/cards/zh/concepts/context-compression.mdx @@ -0,0 +1,91 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Context 压缩 +titleAlt: Context Compression +tagline: 三种策略的质量 / 压缩率 / 可读性权衡 +refs: + - concepts/context-management + - concepts/long-running-agents + - concepts/context-rot +sourceLine: Factory Evaluating Context Compression · 36000+ 真实 sessions +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · CONTEXT COMPRESSION · 长时运行 AGENT + + + +

Context 压缩

+

Context Compression — 超出 context window 时的对话历史压缩

+
+ + + 压缩后的 context 可能丢失关键细节,导致下一 session 误解状态——压缩是双刃剑。三种策略各有其质量/压缩率/可解释性权衡。 + + + +
+
+ 策略质量压缩率可读性代表 +
+
+ 结构化摘要 + 3.70/5.0 + + + Factory 锚定式 +
+
+ 全量重生成 + 3.55/5.0 + + + Anthropic SDK +
+
+ 不透明压缩 + 3.35/5.0 + 99.3% + + OpenAI /compact +
+
+
+ + +
+ 显式 section(intent / modifications / decisions / next steps)迫使保留——每个 section 是检查清单,防止信息静默丢失 + 无法阅读或验证压缩内容;技术细节(文件路径、错误信息)丢失严重 +
+
+ + +
+ → Context Management · Long-Running Agents · Context Rot + Factory (2025) · 36k+ sessions +
+
+ + diff --git a/site/src/content/cards/zh/concepts/context-engineering.mdx b/site/src/content/cards/zh/concepts/context-engineering.mdx new file mode 100644 index 0000000..e778571 --- /dev/null +++ b/site/src/content/cards/zh/concepts/context-engineering.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Context Engineering +titleAlt: Context Engineering +tagline: 找到最小的高信号 token 集合 · 策展不是堆砌 +refs: + - concepts/context-management + - concepts/context-rot + - concepts/context-compression +sourceLine: Anthropic Effective Context Engineering · Manus Context Engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · CONTEXT ENGINEERING · 推理前信息策展 + + + +

Context Engineering

+

Context Engineering — 策展和维护最优 token 集合的策略总称

+
+ + + 找到最小的高信号 token 集合,最大化期望结果的可能性。Prompt engineering 写好指令(静态);Context engineering 策展信息(动态)——每次推理前都要决定放什么、丢什么。 + + + + + Transformer 的 n² pairwise 关系——随 token 数增长,注意力被摊薄;每个 token 都在消耗预算 + 维护轻量级引用(路径/查询/链接),运行时动态加载;优于 upfront 堆砌 + 超出 context 上限时压缩历史;结构化摘要(显式 section)胜过全量重生成 + 长任务拆分到多个独立 context;跨 session 状态外部化(progress file) + + + + +
+
+ 静态策展 +
    +
  • System prompt:不过度具体,不过度模糊
  • +
  • 工具设计:自包含、无歧义、最小重叠
  • +
  • CLAUDE.md / AGENTS.md 预加载
  • +
+
+
+ 动态策展 +
    +
  • glob/grep 按需检索,不维护陈旧索引
  • +
  • 工具结果选择性保留/丢弃
  • +
  • Note-taking:agent 自持外部笔记
  • +
+
+
+
+ + +
+ → Context Management · Context Rot · Compaction · Sub-agent + Anthropic (2026) · Manus (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/context-free-grammar-llm.mdx b/site/src/content/cards/zh/concepts/context-free-grammar-llm.mdx new file mode 100644 index 0000000..6b65cf6 --- /dev/null +++ b/site/src/content/cards/zh/concepts/context-free-grammar-llm.mdx @@ -0,0 +1,95 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 上下文无关文法(LLM) +titleAlt: Context-Free Grammar for LLM +tagline: JSON Schema → CFG → 动态 token 掩码 +refs: + - concepts/constrained-decoding + - concepts/structured-outputs +sourceLine: OpenAI Structured Outputs · RANLP 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · CFG FOR LLM · 结构化输出底层 + + + +

上下文无关文法(LLM)

+

Context-Free Grammar — JSON Schema 约束解码的语法基础

+
+ + + JSON 属于上下文无关语言(CFG 可识别),而非正则语言(FSM 可识别)。这个理论区别有实际影响:FSM 无法原生处理递归嵌套 JSON 结构,CFG 可以。 + + + +
+ 乔姆斯基层级 +
+
+ 递归可枚举语言 + 图灵机 +
+
+ 上下文相关语言 + 线性有界自动机 +
+
+ 上下文无关语言(CFG) + 下推自动机 · JSON ✓ +
+
+ 正则语言(FSM) + 有限状态机 · 无嵌套 ✗ +
+
+
+
+ 实际工作流 +
+ JSON Schema + → 编译 → + CFG + → 预处理缓存 → + 推理时动态掩码 +
+
+
+ + +

CFG vs FSM 的实际优势:嵌套对象 {"{field: {nested: ...}}"} 需要下推自动机的栈记忆来追踪嵌套层级——正则语言无法表达这种递归结构。

+
+ + +
+ → 约束解码 · Structured Outputs + OpenAI (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/context-management.mdx b/site/src/content/cards/zh/concepts/context-management.mdx new file mode 100644 index 0000000..53aeb70 --- /dev/null +++ b/site/src/content/cards/zh/concepts/context-management.mdx @@ -0,0 +1,71 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Context 管理 +titleAlt: Context Management +tagline: 顺行性遗忘 · 工作记忆必须被显式编程 +refs: + - concepts/context-engineering + - concepts/long-running-agents + - concepts/context-compression +sourceLine: Anthropic Effective Harnesses · Claude Agent SDK +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · CONTEXT MANAGEMENT · AGENT 状态管理 + + + +

Context 管理

+

Context Management — LLM 的工作记忆必须被显式编程

+
+ + + LLM 患有"顺行性遗忘"——weights 固定、context window 每个 session 清零。人类同事会积累上下文、巩固记忆、发展专业知识;LLM 不会原生做到这些,context 是工作记忆,必须被显式编程。 + + + +
+
+ Context Window 内 + Claude Agent SDK 内建:context 接近上限时压缩对话历史 + 选择性保留或丢弃工具调用结果 +
+
+ 跨 Session(外部化状态) + claude-progress.txt:每 session 末写入结构化进度摘要 + commit message 作为可审计的变更记录 + 任务完成度的客观指标,防止 session 间信息断层 +
+
+
+ + +
+ Karpathy 类比 + 《Memento》和《50 First Dates》的主角——每次 session 都是全新的开始。"很多人被类比误导了"——把 LLM 当会自主学习的同事,是 context 管理问题的根源。 +
+
+ + +
+ → Context Engineering · Long-Running Agents · Compaction + Anthropic (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/context-rot.mdx b/site/src/content/cards/zh/concepts/context-rot.mdx new file mode 100644 index 0000000..810c5ec --- /dev/null +++ b/site/src/content/cards/zh/concepts/context-rot.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Context Rot +titleAlt: Context Rot +tagline: 随 token 数增长的系统性性能退化 +refs: + - concepts/context-engineering + - concepts/context-management +sourceLine: Chroma Context Rot Research · 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · CONTEXT ROT · CHROMA 命名 2025 + + + +

Context Rot

+

Context Rot — LLM 性能随 token 数增长的系统性退化

+
+ + + 模型不会均匀处理其 context window——第 10,000 个 token 不如第 100 个可靠。这不是任务变难了,而是相同内容在更长 context 中准确率系统性下降。 + + + + + 随输入长度增加,每个 token 分配到的注意力被稀释;needle 语义相似度越低,退化越快 + 相关但错误的内容干扰检索;Claude 倾向弃权,GPT 倾向幻觉——家族级差异 + 逻辑连贯的 haystack 反而比打乱顺序更损害性能——注意力被结构"吸引" + + + + +
+
+ vs Lost-in-Middle + LITM 是特定位置效应(中间弱);Context Rot 是全局退化趋势(越长越弱),两者都需要 context engineering 来对抗 +
+
+ 工程含义 + 不是"能放就放"——Just-in-time 加载、主动 compaction 不只是节约,更是质量保证 +
+
+
+ + +
+ → Context Engineering · Context Management · Compaction + Chroma (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/counterfactual-theory.mdx b/site/src/content/cards/zh/concepts/counterfactual-theory.mdx new file mode 100644 index 0000000..4c95d72 --- /dev/null +++ b/site/src/content/cards/zh/concepts/counterfactual-theory.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 反事实理论 +titleAlt: Counterfactual Theory of Causation +tagline: 如果 c 没有发生,e 就不会发生 · 可能世界语义 +refs: + - concepts/possible-world-semantics + - concepts/preemption + - concepts/causal-models +sourceLine: David Lewis 1973 · SEP Counterfactual Causation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · COUNTERFACTUAL THEORY · 因果理论 + + + +

反事实理论

+

Counterfactual Theory of Causation — Lewis 1973

+
+ + + c 是 e 的原因,当且仅当"如果 c 没有发生,e 就不会发生"。因果关系被还原为可能世界之间的关系——在最近的 c 不发生的可能世界中,e 也不发生。 + + + +
+
+ 1 + 反事实条件句有真值条件:通过"最近可能世界"语义分析 +
+
+ 2 + 因果依赖 = 反事实依赖:如果 c 没有发生,e 就不会发生 +
+
+ 3 + 因果关系 = 因果依赖链的传递闭包(Lewis 后来修订为"影响"理论) +
+
+
+ 主要挑战 + Billy 先于 Suzy 击中目标——Billy 是原因,但即使 Billy 没扔,Suzy 也会扔,反事实依赖不成立 + 两块石头同时击碎瓶子——哪个是"原因"?两者都是必要的吗? + Bond 射下导弹阻止了 Blofield 死亡——预防是"缺席原因",物理上无过程 +
+
+ + +

现代因果建模(Pearl, Hitchcock)提供了反事实语义的图形化实现——在因果模型上执行干预,比可能世界语义学更具可操作性。

+
+ + +
+ → 可能世界语义学 · 先占 · 因果模型 · 差异制造 + Lewis (1973, 2000) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/custom-and-habit.mdx b/site/src/content/cards/zh/concepts/custom-and-habit.mdx new file mode 100644 index 0000000..78591a7 --- /dev/null +++ b/site/src/content/cards/zh/concepts/custom-and-habit.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 习惯 +titleAlt: Custom and Habit +tagline: 联想原则的一般名称 · 因果推理的真正基础 +refs: + - concepts/causation-hume + - concepts/constant-conjunction + - concepts/induction-problem +sourceLine: David Hume Enquiry 1748 EHU 5.1.5 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Quote from '~/components/card/blocks/Quote.astro'; + + +
+ 概念 · CUSTOM AND HABIT · 休谟 + +
+
+

习惯

+

Custom / Habit — 与理性"同等权威"的认知原则

+
+
+ + + 习惯不是新发现的心灵原则——它就是联想原则的一般名称。重复经验形成倾向;倾向使我们期望;期望产生信念。理性无法解释因果推理,但我们确实在做——驱动它的就是习惯。 + + + + 每当任何特定行为或操作的重复产生了一种倾向,使我们重新做出相同的行为……我们总是说,这种倾向是习惯的效果。 +
+
+ 因果推理的基础 +

恒常连结 → 习惯 → 倾向 → 期望 → 因果信念。不是理性证明,是自然倾向。

+
+
+ 齐一性原则的来源 +

"未来将与过去相似"的信念本身就是习惯的产物——不是理性前提

+
+
+ 信念的力量来源 +

当前印象的力量通过联想路径传递到结果观念,赋予它"信念的坚实性"

+
+
+
+ + +

休谟:"依赖习惯比依赖理性更好——自然的普通智慧确保生存"。这预示了达尔文:习惯是进化选择的认知机制,不是理性的次级替代品。

+
+ + +
+ → 因果性(休谟)· 恒常连结 · 归纳问题 + Hume (1748) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/difference-making.mdx b/site/src/content/cards/zh/concepts/difference-making.mdx new file mode 100644 index 0000000..5ecd97d --- /dev/null +++ b/site/src/content/cards/zh/concepts/difference-making.mdx @@ -0,0 +1,58 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 差异制造 +titleAlt: Difference-Making +tagline: 多种因果理论的共同内核 +refs: + - concepts/counterfactual-theory + - concepts/regularity-theory + - concepts/interventionist-theory +sourceLine: SEP Metaphysics of Causation · Strevens 2004 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · DIFFERENCE-MAKING · 因果理论共同内核 + + + +

差异制造

+

Difference-Making — 跨越理论边界的因果核心

+
+ + + 如果一个因子的存在或缺席会改变结果是否发生,这个因子就是结果的差异制造者。这个思想跨越规则性理论、反事实理论和干预主义的边界——是多种因果理论的共同内核。 + + + + + INUS 条件的非冗余性要求——移除因子,其所属充分条件簇不再充分——就是差异制造的逻辑化 + 最直接的表达:如果 C 没发生,E 就不会发生。Lewis 2000"影响"版:C 的变化导致 E 的相应变化 + Strevens 的 kairetic 账户:解释核心的每个成员必须对效应构成差异;三类非差异制造者被排除 + Woodward:C 对 E 构成差异 ⟺ 存在某种对 C 的干预会改变 E 的值 + + + + +

Strevens 的精细化:比简单反事实依赖更精细——区分①完全不参与过程的因子;②参与但影响可忽略;③描述过于精细("四千克砖头"vs"超过阈值的刚性物体")。

+
+ + +
+ → 反事实理论 · 规则性理论 · 干预主义 · INUS 条件 + Lewis (1973) · Strevens (2004) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/empiricism.mdx b/site/src/content/cards/zh/concepts/empiricism.mdx new file mode 100644 index 0000000..3c8d246 --- /dev/null +++ b/site/src/content/cards/zh/concepts/empiricism.mdx @@ -0,0 +1,71 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 经验主义 +titleAlt: Empiricism +tagline: 一切知识最终来源于经验 · 复本原则 · 定义方法 +refs: + - concepts/causation-hume + - concepts/induction-problem + - concepts/falsificationism +sourceLine: David Hume Enquiry · SEP David Hume +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + +
+ 概念 · EMPIRICISM · 认识论 + +
+
+

经验主义

+

Empiricism — 知识来源于经验和观察

+
+
+ + + 一切知识最终来源于经验和观察。休谟将牛顿的实验方法扩展到"道德科学"——拒绝声称发现"终极原理"的形而上学:那些超越一切可能经验的主张,不仅是假的,而且是不可理解的。 + + + +
+
+ 复本原则(Copy Principle) +

所有简单观念派生自与之对应的简单印象。思想的材料最终来自感觉经验——只能对经验材料"组合、转移、增大或减小"。

+
+
+ 定义方法("新显微镜") +

从术语追问对应的观念 → 追溯到原始印象。任何环节失败,该观念缺乏认知内容——批判传统形而上学和神学概念的主要武器。

+
+
+
+ + +
+ 揭露传统形而上学违背经验主义原则——那些声称超越经验的"终极原理"是不可理解的 + 在经验基础上建立关于人性的科学;接受"我不做假说";不追求确定性,只追求最佳解释 +
+
+ + +
+ → 因果性(休谟)· 归纳问题 · 证伪主义 · 贝叶斯归纳 + Hume (1748) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/error-cascade.mdx b/site/src/content/cards/zh/concepts/error-cascade.mdx new file mode 100644 index 0000000..f76937d --- /dev/null +++ b/site/src/content/cards/zh/concepts/error-cascade.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 误差级联 +titleAlt: Error Cascade +tagline: 前步小错在后续步骤被放大 · 不只是概率相乘 +refs: + - concepts/long-running-agents + - concepts/harness-engineering + - concepts/reliability-decay +sourceLine: SWE-EVO · arXiv multi-step evaluation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · ERROR CASCADE · 多步任务失败机制 + + + +

误差级联

+

Error Cascade — 步骤耦合放大效应

+
+ + + 前一步的小错在后续步骤中被放大,导致整体成功率远低于单步成功率的乘积。这不是独立错误累积,而是步骤间的耦合放大——一步错误改变了下一步的输入条件。 + + + +
+ SWE-EVO 量化证据 +
+
+ 单步(SWE-Bench Verified) + + 72.8% +
+
+ 多步(SWE-EVO) + + 25% +
+
+ 理论乘积(3步 × 72.8%) + + 38.6% +
+
+

实际比理论乘积更差——耦合放大效应的直接证据

+
+
+ 放大机制 + 函数签名改错 → 后续调用面对"看似合理但语义错误"的接口 + 前步回归错误让后步无法分清哪些失败是自己造成的 + 错误信息写入 context → 后续推理在污染的上下文上运行 +
+
+ + +
+ → Long-Running Agents · Harness Engineering · Reliability Decay + SWE-EVO (2025) +
+
+ + From db931565fb010050382b6791246f41d50f4c47b9 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:29:57 +0800 Subject: [PATCH 26/48] =?UTF-8?q?feat(cards):=20batch=204/18=20=E2=80=94?= =?UTF-8?q?=20concepts/evaluator-optimizer=E2=86=92implicit-loop-architect?= =?UTF-8?q?ure=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/concepts/evaluator-optimizer.mdx | 79 ++++++++++++++ .../cards/zh/concepts/falsificationism.mdx | 91 ++++++++++++++++ .../cards/zh/concepts/feature-tracking.mdx | 89 +++++++++++++++ .../cards/zh/concepts/fork-explore-commit.mdx | 78 +++++++++++++ .../content/cards/zh/concepts/four-causes.mdx | 63 +++++++++++ .../zh/concepts/fractal-architecture.mdx | 92 ++++++++++++++++ .../cards/zh/concepts/fractal-dimension.mdx | 103 ++++++++++++++++++ .../cards/zh/concepts/frontdoor-criterion.mdx | 83 ++++++++++++++ .../concepts/generation-verification-loop.mdx | 68 ++++++++++++ .../cards/zh/concepts/grue-problem.mdx | 83 ++++++++++++++ .../content/cards/zh/concepts/guardrails.mdx | 96 ++++++++++++++++ .../cards/zh/concepts/harness-engineering.mdx | 68 ++++++++++++ .../cards/zh/concepts/heuristic-search.mdx | 69 ++++++++++++ .../zh/concepts/hierarchical-systems.mdx | 82 ++++++++++++++ .../concepts/implicit-loop-architecture.mdx | 86 +++++++++++++++ 15 files changed, 1230 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/evaluator-optimizer.mdx create mode 100644 site/src/content/cards/zh/concepts/falsificationism.mdx create mode 100644 site/src/content/cards/zh/concepts/feature-tracking.mdx create mode 100644 site/src/content/cards/zh/concepts/fork-explore-commit.mdx create mode 100644 site/src/content/cards/zh/concepts/four-causes.mdx create mode 100644 site/src/content/cards/zh/concepts/fractal-architecture.mdx create mode 100644 site/src/content/cards/zh/concepts/fractal-dimension.mdx create mode 100644 site/src/content/cards/zh/concepts/frontdoor-criterion.mdx create mode 100644 site/src/content/cards/zh/concepts/generation-verification-loop.mdx create mode 100644 site/src/content/cards/zh/concepts/grue-problem.mdx create mode 100644 site/src/content/cards/zh/concepts/guardrails.mdx create mode 100644 site/src/content/cards/zh/concepts/harness-engineering.mdx create mode 100644 site/src/content/cards/zh/concepts/heuristic-search.mdx create mode 100644 site/src/content/cards/zh/concepts/hierarchical-systems.mdx create mode 100644 site/src/content/cards/zh/concepts/implicit-loop-architecture.mdx diff --git a/site/src/content/cards/zh/concepts/evaluator-optimizer.mdx b/site/src/content/cards/zh/concepts/evaluator-optimizer.mdx new file mode 100644 index 0000000..24ad40d --- /dev/null +++ b/site/src/content/cards/zh/concepts/evaluator-optimizer.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 评估器-优化器 +titleAlt: Evaluator-Optimizer +tagline: 生成者与评估者分离 · GAN 式质量反馈回路 +refs: + - concepts/harness-engineering + - concepts/feature-tracking + - concepts/agentic-systems +sourceLine: Anthropic Building Effective Agents +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · EVALUATOR-OPTIMIZER · Workflow 模式 + + + +

评估器-优化器

+

Evaluator-Optimizer — GAN 式生成-判别循环

+
+ + + 一个 LLM 生成响应,另一个 LLM 提供评估和反馈,循环迭代。生成者与评估者角色固定——不同于自主 Agent。适用条件:有清晰评估标准 + 迭代能产生可衡量提升。 + + + +
+
+ Generator + 生成响应 +
+
+
+ Evaluator + 评分 + 反馈 +
+
↰ 迭代
+
+
+ 工程实践(Anthropic) + Agent 评估自身产出天然偏向好评;分离评估者后可独立调校严格程度 + 主观维度(originality / craft)拆成可评分项 + few-shot 示例校准 + Generator 与 Evaluator 每轮前协商"完成标准",将 spec 细化为可测试条件 + 模型越强,Evaluator 边际价值越集中在任务能力边界案例 +
+
+ + +

{"典型场景 → 文学翻译(语义细微差别)· 复杂搜索(多轮分析)· 主观设计任务"}

+
+ + +
+ → Harness Engineering · Feature Tracking · Agentic Systems + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/falsificationism.mdx b/site/src/content/cards/zh/concepts/falsificationism.mdx new file mode 100644 index 0000000..afb0b7c --- /dev/null +++ b/site/src/content/cards/zh/concepts/falsificationism.mdx @@ -0,0 +1,91 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 证伪主义 +titleAlt: Falsificationism +tagline: 大胆猜想 · 试图证伪 · 科学不需要归纳 +refs: + - concepts/induction-problem + - concepts/bayesian-induction + - concepts/empiricism +sourceLine: Karl Popper 1935 · SEP Induction Problem +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + +
+ 概念 · FALSIFICATIONISM · Popper + +
+
+

证伪主义

+

Falsificationism — 科学不通过确认积累,而通过证伪推进

+
+
+ + + 大胆猜想(bold conjectures)+ 试图证伪(falsification)。逻辑:H → P,且 ¬P,则 ¬H——纯演绎,无需归纳。Popper 绕过归纳问题:科学根本不需要从观察归纳到理论。 + + + +
+
+ 传统观点 +
+ 观察 + 归纳 + 理论 + 预测 +
+
+
+
+ Popper +
+ 猜想 + 推导预测 + 实验检验 + 证伪 / 暂存 +
+
+
+
+ 佐证困境 + 多个未证伪理论互相矛盾时如何选择? + 佐证(corroboration)—— 经受更严格检验者更可信 + 这正是齐一性原则的变体——"过去严格→未来可靠"是隐性归纳 +
+
+ + +

{"工程映射 → TDD(试图证伪代码)· 混沌工程(主动注入故障)· Benchmark(尚未失败≠可靠)"}

+
+ + +
+ → 归纳问题 · 贝叶斯归纳 · 经验主义 · 混沌工程 + Popper (1935) · Salmon (1981) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/feature-tracking.mdx b/site/src/content/cards/zh/concepts/feature-tracking.mdx new file mode 100644 index 0000000..38f351c --- /dev/null +++ b/site/src/content/cards/zh/concepts/feature-tracking.mdx @@ -0,0 +1,89 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 特性追踪 +titleAlt: Feature Tracking +tagline: 外部化的 machine-readable 任务清单 · 防止 one-shotting 和虚假胜利 +refs: + - concepts/long-running-agents + - concepts/harness-engineering + - concepts/context-management +sourceLine: Anthropic Effective Harnesses Long-Running Agents +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · FEATURE TRACKING · 长时 Agent 状态管理 + + + +

特性追踪

+

Feature Tracking — 外部化任务清单,防止两类失败模式

+
+ + + 一份外部化的、machine-readable 的任务清单——JSON 格式 feature list,agent 可读取全局进展,可更新完成状态。同时防止"one-shotting"(一次性做完)和"premature victory"(提前宣布完成)两类失败。 + + + +
+ JSON 结构 + + + + +
+
+ 关键约束 + Agent 只能将 passes 改为 true,不得删除或编辑描述 + 模型不容易"顺手"修改 JSON 结构,比 Markdown 更安全 + 必须经端到端测试验证才能标记通过,禁止自我判断 +
+
+ + +
+ → Long-Running Agents · Harness Engineering · Context Management + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/fork-explore-commit.mdx b/site/src/content/cards/zh/concepts/fork-explore-commit.mdx new file mode 100644 index 0000000..d221ad9 --- /dev/null +++ b/site/src/content/cards/zh/concepts/fork-explore-commit.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 分叉-探索-提交 +titleAlt: Fork-Explore-Commit +tagline: OS 级探索原语 · git 语义下沉到执行层 · 并行路径择优 +refs: + - concepts/agent-os + - concepts/evaluator-optimizer + - concepts/error-cascade +sourceLine: AgenticOS Workshop ASPLOS 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + + 概念 · FORK-EXPLORE-COMMIT · AgenticOS 执行原语 + + + +

分叉-探索-提交

+

Fork-Explore-Commit — 将 git 分支语义下沉到 OS 执行层

+
+ + + 在 OS 级 fork 执行状态为多条探索路径,各路径独立推进,最终选择最优路径 commit,丢弃其余。不是代码版本控制的分支——是运行时 agent 执行状态的分支。 + + + +
+
+ + Fork + 在决策点 fork 执行状态;copy-on-write 实现近零开销快照 +
+
+ + Explore + 各分支独立推进;OS 级隔离,副作用不跨分支泄漏 +
+
+ + Commit + 选中路径的副作用原子性生效;其余分支丢弃 +
+
+ + 时间维度探索 vs 空间维度探索;互补——每条 fork 内可运行 eval-opt 循环 + Fork 是系统级对抗:错误只影响所在分支,不污染全局状态 + 并行是为了竞争择优(同问题多路径),不是任务分发(不同子任务) + 应用层 checkpoint 脆弱;进程级资源隔离无法被 harness 强制 + +
+ + +
+ → Agent OS · Evaluator-Optimizer · Error Cascade · Parallelization + Wang & Zheng, ASPLOS (2026) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/four-causes.mdx b/site/src/content/cards/zh/concepts/four-causes.mdx new file mode 100644 index 0000000..134a8fe --- /dev/null +++ b/site/src/content/cards/zh/concepts/four-causes.mdx @@ -0,0 +1,63 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 四因说 +titleAlt: Four Causes +tagline: 质料因 · 形式因 · 动力因 · 目的因 · 因果多元主义起点 +refs: + - concepts/aitia + - concepts/causal-models + - concepts/hierarchical-systems +sourceLine: SEP Aristotle on Causality · Pearl 2010 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import PillarGrid from '~/components/card/blocks/PillarGrid.astro'; +import Pillar from '~/components/card/blocks/Pillar.astro'; + + +
+ 概念 · FOUR CAUSES · 亚里士多德 + +
+
+

四因说

+

四种不可还原的"为什么"——解释框架,非本体分类

+
+
+ + + 四因不是竞争性的替代解释,而是同一事物的四个解释维度。完整的科学解释需要(至多)全部四种原因的协同。形式因与目的因常合一;动力因与形式/目的因"形式同一"。 + + + + + 它由什么构成?变化的承受者 (hupokeimenon)。在自然哲学中重新理解为假设必然性——达成目的所必需的物质条件 + 它是什么?事物的本质 (to ti ên einai)、定义、内在结构原理。不是外在形状——是使事物成其所是 + 变化从何而来?最精确的动力因是铸铜术本身而非工匠——知识而非持有者。追求非心理学的解释模式 + 它的善是什么?只有"最善的那个"才够格。在有机体中:有机体不能没有它而存续 + 有了它更繁荣 + +
+ Pearl SCM 的边界 +

SCM 结构方程精确形式化了动力因——"变化从何而来"。目的因、形式因在现代因果模型中无直接对应。这既是 Pearl 框架的聚焦,也是其边界。

+
+
+ + +
+ → Aitia · Causal Models · 层级系统 · 反事实理论 + Aristotle · SEP (2023) · Pearl (2010) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/fractal-architecture.mdx b/site/src/content/cards/zh/concepts/fractal-architecture.mdx new file mode 100644 index 0000000..470156a --- /dev/null +++ b/site/src/content/cards/zh/concepts/fractal-architecture.mdx @@ -0,0 +1,92 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 分形架构 +titleAlt: Fractal Architecture +tagline: 自相似性 · 四条规则 · 任何子树是有效的树 +refs: + - concepts/compositionality + - concepts/implicit-loop-architecture + - concepts/agent-skills +sourceLine: Anton Telesh 2016 · Cycle.js +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · FRACTAL ARCHITECTURE · 软件组织模式 + + + +

分形架构

+

Fractal Architecture — 自相似性:任何子树是有效的树

+
+ + + 系统中每个组件与整体具有相同结构和接口。可组合性不来自"组件很小",而来自接口的一致性——接口同构时,组合结果仍满足相同的 API 契约,递归可组合。 + + + +
+ 四条规则(Telesh 2016,归纳自 React / Angular / Elm / Cycle.js) +
+ +
+ 统一接口 + 应用是由相同 API 的组件组成的树 +
+
+
+ +
+ 递归组合 + 每个组件可以包含其他组件 +
+
+
+ +
+ 无特权根节点 + 顶层组件与叶子组件没有本质区别 +
+
+
+ +
+ 胶水与逻辑分离 + 引导/装配代码在组件体系之外完成;组件不知道自己在树中的位置 +
+
+
+
+ 每个技能是相同接口的目录(SKILL.md + 统一协议)— 规则①② + Agent 不知道全局路径,行为由约束塑造 — 规则③④的结构同构 +
+
+ + +

哲学先驱:华严经因陀罗网——每颗宝珠映照所有其他宝珠,自相似性比曼德布罗早约 1300 年

+
+ + +
+ → Compositionality · Implicit Loop · Agent Skills · Indra Net + Telesh (2016) · Cycle.js +
+
+ + diff --git a/site/src/content/cards/zh/concepts/fractal-dimension.mdx b/site/src/content/cards/zh/concepts/fractal-dimension.mdx new file mode 100644 index 0000000..9e0adb3 --- /dev/null +++ b/site/src/content/cards/zh/concepts/fractal-dimension.mdx @@ -0,0 +1,103 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 分形维数 +titleAlt: Fractal Dimension +tagline: 量化空间填充程度 · 非整数维度 · Richardson 公式的指数 +refs: + - concepts/coastline-paradox + - concepts/fractal-architecture +sourceLine: Wikipedia Coastline Paradox · Mandelbrot 1967 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · FRACTAL DIMENSION · 分形几何 + + + +

分形维数

+

Fractal Dimension — 不规则几何的"空间填充程度"量化

+
+ + + 对欧氏整数维度的扩展:一条光滑线是 1 维,平面是 2 维,海岸线落在 1 到 2 之间。用边长 ε 的方格覆盖几何对象,方格数 ∝ ε⁻ᴰ,D 就是分形维数。 + + + +
+ Richardson 公式中的角色:L(ε) ~ F·ε^(1-D) +
+ 直线段 +
+ D = 1.00 + 收敛到确定值 +
+
+ 南非海岸 +
+ D ≈ 1.02 + 几乎光滑 +
+
+ Koch 雪花 +
+ D ≈ 1.26 + 显著增长 +
+
+ 英国西海岸 +
+ D ≈ 1.25 + 显著增长 +
+
+ Peano 曲线 +
+ D = 2.00 + 填满平面 +
+
+
+
+ Hausdorff 维数 + 最优覆盖集的测度理论定义;最基本 +
+
+ Minkowski-Bouligand(盒计数) + 固定尺寸方格覆盖;可操作,实际测量最常用 +
+
+
+ + +
+ → 海岸线悖论 · Richardson 效应 · 统计自相似性 + Mandelbrot (1967) · Wikipedia +
+
+ + diff --git a/site/src/content/cards/zh/concepts/frontdoor-criterion.mdx b/site/src/content/cards/zh/concepts/frontdoor-criterion.mdx new file mode 100644 index 0000000..71d4b91 --- /dev/null +++ b/site/src/content/cards/zh/concepts/frontdoor-criterion.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 前门准则 +titleAlt: Frontdoor Criterion +tagline: 不可测混淆变量时通过中介变量识别因果效应 +refs: + - concepts/backdoor-criterion + - concepts/causal-dag + - concepts/do-calculus +sourceLine: Pearl 2010 · Tian & Pearl 2002 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · FRONTDOOR CRITERION · 因果识别 + + + +

前门准则

+

Frontdoor Criterion — 后门失败时的中介变量路线

+
+ + + 后门准则处理可测混淆变量;前门准则处理不可测混淆但存在可观测中介变量的情形。两步估计:先估 X→Z(无后门),再估 Z→Y(X 作为后门调整),最终组合。 + + + +
+ + + U + + X + + Z + + Y + + + + + + + + + + + + + +

U 不可测(虚线) · Z 是可观测中介 · 两步估计绕过 U

+
+ 经典应用:吸烟与肺癌 + 不可测混淆 U = 基因易感性(后门调整失败) + 满足前门条件 → 两步估计得到因果效应 +
+ 识别公式 + {"P(y|do(x)) = Σ_z P(z|x) · Σ_x' P(y|x',z)·P(x')"} +
+
+ + +
+ → 后门准则 · Causal DAG · do 演算 · 中介分析 + Pearl (2009) · Tian & Pearl (2002) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/generation-verification-loop.mdx b/site/src/content/cards/zh/concepts/generation-verification-loop.mdx new file mode 100644 index 0000000..0420929 --- /dev/null +++ b/site/src/content/cards/zh/concepts/generation-verification-loop.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 生成-验证循环 +titleAlt: Generation-Verification Loop +tagline: AI 生成 · 人类验证 · 优化速度决定效率 · 人是瓶颈 +refs: + - concepts/evaluator-optimizer + - concepts/autonomy-slider + - concepts/harness-engineering +sourceLine: Karpathy 2025 YC Talk +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · GENERATION-VERIFICATION LOOP · 人-AI 协作核心 + + + +

生成-验证循环

+

Generation-Verification Loop — 人类是瓶颈,优化验证速度

+
+ + + AI 负责生成,人类负责验证。区别于 Evaluator-Optimizer(全自动)——这里验证者是人类,这是根本性区别。优化这个循环的速度决定了人-AI 协作的效率上限。 + + + +
+
+ 方向 1:加速验证 + 红绿 diff 一眼看完;Cmd+Y / Cmd+N 比输入文字快 10× + 人类视觉皮层并行处理远超文本阅读;图形化反馈是"高速公路" +
+
+ 方向 2:约束生成(Keep on Leash) + AI 瞬间生成没有意义——人类仍是验证瓶颈 + 模糊 prompt → 验证失败 → 旋转循环;具体 prompt → 高通过率 + 在 AI 和最终产出之间插入人类可审计的中间产物,防止 AI 迷失 +
+
+
+ vs Evaluator-Optimizer + 后者的评估者也是 LLM,是全自动循环;本循环中验证者是人类,AI 生成的 scope 必须配合人类验证能力 +
+
+ + +
+ → Evaluator-Optimizer · Autonomy Slider · Harness Engineering + Karpathy (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/grue-problem.mdx b/site/src/content/cards/zh/concepts/grue-problem.mdx new file mode 100644 index 0000000..64b6ba4 --- /dev/null +++ b/site/src/content/cards/zh/concepts/grue-problem.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Grue 问题 +titleAlt: Grue Problem +tagline: 新归纳之谜 · 同一数据支持矛盾结论 · 谓词可投射性 +refs: + - concepts/induction-problem + - concepts/empiricism + - concepts/bayesian-induction +sourceLine: Nelson Goodman 1955 · SEP Induction Problem +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · GRUE PROBLEM · 新归纳之谜 · Goodman 1955 + + + +

Grue 问题

+

New Riddle of Induction — 从"能否归纳"到"如何归纳"

+
+ + + Grue = 在时间 t 前观察到且为绿色,或在 t 后观察到且为蓝色。同样的翡翠观察 + 同样的归纳模式:用"绿色"→预测绿,用"grue"→预测蓝。归纳有效时,谁有资格被投射? + + + +
+
+ 谓词观察支持t 后预测 +
+
+ 绿色 (green) + t 前翡翠全为绿 + 绿色 ✓ +
+
+ grue + t 前翡翠全为 grue + 蓝色 ✗ +
+

同一数据,同一推理模式,结论矛盾

+
+
+ 可投射性(Projectibility) + 习惯化(entrenchment)——过去成功归纳中频繁使用的谓词更可投射 + 这将归纳辩护建立在语言惯例而非客观世界结构上 +
+
+ 机器学习映射 +

过拟合 = 学到了 grue 式谓词——训练段完美,部署后失效。分布偏移中的时间依赖性正是 grue 的核心特征。

+
+
+ + +
+ → 归纳问题 · 齐一性原则 · 经验主义 · 贝叶斯归纳 + Goodman (1955) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/guardrails.mdx b/site/src/content/cards/zh/concepts/guardrails.mdx new file mode 100644 index 0000000..bb20779 --- /dev/null +++ b/site/src/content/cards/zh/concepts/guardrails.mdx @@ -0,0 +1,96 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 护栏 +titleAlt: Guardrails +tagline: 分层防御 · 运行时安全监控 · 乐观执行模式 +refs: + - concepts/harness-engineering + - concepts/aci + - concepts/chaos-engineering-for-agents +sourceLine: OpenAI Practical Guide Building Agents +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · GUARDRAILS · 运行时安全防护 + + + +

护栏

+

Guardrails — 运行时持续监控,单层不足,多层组合形成韧性

+
+ + + 在 Agent 运行中持续监控输入、输出和操作,防止越界。Harness 的架构约束在编译时生效;Guardrails 在运行时生效。乐观执行模式:Agent 正常推进,Guardrails 并发检查,违规时触发异常中断。 + + + +
+ 分层防御模型(OpenAI) +
+ 输入侧 +
+ Relevance classifier + Safety classifier (jailbreak) + PII filter + Moderation +
+
+
+ 执行侧 +
+ Tool safeguards(读/写/可逆性/金额分级) + Rules-based(blocklist / regex / 长度限制) +
+
+
+ 输出侧 +
+ Output validation(品牌一致性 / 内容质量) +
+
+
+ 人类 +
+ 失败超阈值 · 高风险不可逆操作 · 敏感数据 +
+
+
+
+ MOP:行为崩溃检测 + 滑动窗口(w=5)统计工具调用分布熵,熵飙升 → 行为无序化信号 → 触发 context reset +
+
+ + +
+ → Harness Engineering · ACI · Chaos Engineering · LLM Security + OpenAI (2024) · Beyond Pass@1 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/harness-engineering.mdx b/site/src/content/cards/zh/concepts/harness-engineering.mdx new file mode 100644 index 0000000..12d31ed --- /dev/null +++ b/site/src/content/cards/zh/concepts/harness-engineering.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Harness 工程 +titleAlt: Harness Engineering +tagline: 包裹 LLM 的控制系统 · 不是限制而是让能力可靠发挥 +refs: + - concepts/agentic-systems + - concepts/feature-tracking + - concepts/context-management +sourceLine: Anthropic Building Effective Agents · OpenAI Harness Engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · HARNESS ENGINEERING · Agent 控制系统设计 + + + +

Harness 工程

+

Harness Engineering — system prompt + 工具 + 编排 + 状态 + 权限 + 反馈的总和

+
+ + + Harness 不是"调用 API 的胶水代码"——是完整的控制系统。不是限制 Agent,而是让 Agent 的能力可靠地发挥。Agent 失败 = 环境不足的信号,不是模型能力上限。正确的响应:更好的 harness。 + + + +
+
System Prompt全局约束 · 角色定义 · 低频组件
+
工具定义局部能力边界 · ACI 设计 · 声明式接口
+
权限系统边界控制 · 高频执行 · 按风险分级
+
反馈回路端到端测试 · Evaluator-Optimizer · MOP 检测
+
状态管理Feature tracking · 外部化进度 · 跨 session 连续
+
终止机制上限约束 · 失败检测 · 人类介入触发条件
+
+
+ Harness 每个组件编码了"模型做不到什么"的假设——随模型升级持续检验,问"我可以停止做什么?" + Enforce invariants, not implementations — 机械化执行架构边界,允许边界内自由 +
+
+ + +

{"SWE-EVO 硬证据:harness 框架差异使同一模型成功率差距达 4× (GLM-5: SWE-agent 37.5% vs OpenHands 8.33%)"}

+
+ + +
+ → Hierarchical Systems · Feature Tracking · Evaluator-Optimizer · Meta-Harness + Anthropic · OpenAI (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/heuristic-search.mdx b/site/src/content/cards/zh/concepts/heuristic-search.mdx new file mode 100644 index 0000000..f606720 --- /dev/null +++ b/site/src/content/cards/zh/concepts/heuristic-search.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 启发式搜索 +titleAlt: Heuristic Search +tagline: 物理符号系统的求解方式 · 搜索量不等于智能量 +refs: + - concepts/physical-symbol-system + - concepts/means-ends-analysis +sourceLine: Newell & Simon 1976 CACM +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · HEURISTIC SEARCH · 物理符号系统求解机制 + + + +

启发式搜索

+

Heuristic Search — 生成-测试框架 · 搜索量 ≠ 智能量

+
+ + + 问题的解被表示为符号结构,通过生成并递进修改符号结构直至产生满足条件的解。"启发式"意味着:不是穷举或随机,而是由信息引导的有选择性生成。已知测试条件不等于已知如何生成解。 + + + +
+ {"B = 10, D = 10 → 10¹⁰ 候选 | 象棋 B≈35, D≈40 → 天文数字"} + 暴力搜索的根本瓶颈:计算资源有限,串行搜索必须有选择性 +
+
+ 弱方法 vs 强方法 +
弱方法领域知识不足时,通用启发式控制指数爆炸
+
手段-目的分析检测差距 → 选消弭差距的动作(GPS 1957)
+
最优先搜索从最近目标的节点继续搜索
+
Alpha-beta 剪枝剪去不影响最终评估的分支
+
强方法丰富领域知识,减少甚至避免搜索
+
语义识别系统国际象棋大师存储 50,000+ 棋盘模式,直接识别
+
表示变换残缺棋盘问题 → 颜色对称性让答案无需搜索
+
+ 程序搜索数百万节点,大师不超过 100 分支却下得更好。智能在于从问题空间提取信息引导搜索 +
+ + +
+ → Physical Symbol System · Means-Ends Analysis · 层级系统 + Newell & Simon (1976) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/hierarchical-systems.mdx b/site/src/content/cards/zh/concepts/hierarchical-systems.mdx new file mode 100644 index 0000000..765f99c --- /dev/null +++ b/site/src/content/cards/zh/concepts/hierarchical-systems.mdx @@ -0,0 +1,82 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 层级系统 +titleAlt: Hierarchical Systems +tagline: 交互强度驱动的嵌套结构 · 钟表匠寓言 · 演化的必然结果 +refs: + - concepts/near-decomposability + - concepts/harness-engineering + - concepts/context-engineering +sourceLine: Herbert Simon 1962 Architecture of Complexity +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + +
+ 概念 · HIERARCHICAL SYSTEMS · Simon + +
+
+

层级系统

+

交互强度驱动的嵌套结构,复杂系统最普遍的组织形式

+
+
+ + + 层级 = 交互强度不均:子系统内部强耦合,子系统之间弱耦合。社会、生物、物理、符号系统都呈现层级结构——这不是巧合,是演化压力的必然结果。 + + + +
+ 钟表匠寓言(Watchmaker Parable) +
+
+ Hora ✓ + 先做稳定子组件,再组装;被打断只失去最后一个子组件 +
+
+ Tempus ✗ + 一次性组装;每次被打断从头来过 +
+
+

推论:有稳定中间形态的复杂系统,通过演化涌现的速度远快于没有中间形态的系统

+
+
+ 频率分离 + 子系统内部动态(短期内各子系统近似独立) + 子系统间聚合交互涌现为系统整体行为 +
+
+ system prompt(全局/低频)→ 工具定义(局部/中频)→ 权限(边界/高频) + 没有守恒定律要求复杂系统的描述与其一样庞大——正确层级表示可压缩 +
+
+ + +
+ → Near-Decomposability · Harness Engineering · Context Engineering · 四因说 + Simon (1962) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/implicit-loop-architecture.mdx b/site/src/content/cards/zh/concepts/implicit-loop-architecture.mdx new file mode 100644 index 0000000..edb1582 --- /dev/null +++ b/site/src/content/cards/zh/concepts/implicit-loop-architecture.mdx @@ -0,0 +1,86 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 隐式循环架构 +titleAlt: Implicit Loop Architecture +tagline: gather context · take action · verify work · repeat · 行为由约束塑造 +refs: + - concepts/agentic-systems + - concepts/harness-engineering + - concepts/fork-explore-commit +sourceLine: Anthropic Building Agents · Karpathy LLM-OS +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · IMPLICIT LOOP ARCHITECTURE · Agent 架构范式 + + + +

隐式循环架构

+

Implicit Loop — 无预定义路径,行为由工具+Prompt+权限+反馈间接约束

+
+ + + Agent 在开放的反馈循环中运行:gather context → take action → verify work → repeat。每一步由模型自主决定,不存在"第一步做 X"的硬编码。OS Kernel 同构:事件驱动而非流程驱动。 + + + +
+
Gather Context
+
+
Take Action
+
+
Verify Work
+
↺ repeat
+
+
+ 隐式循环 vs 显式图(LangGraph) +
+ 隐式循环显式图 +
+
+ 可预测性 + 低(模型自主) + 高(编译时确定) +
+
+ 灵活性 + 高(未预见情况) + 受拓扑限制 +
+
+ 调试难度 + 高(推理决策链) + 低(状态转换可视) +
+
+ 接收中断 → 调度处理 → 执行 → 等待下一中断。差异:Agent 的 CPU 是统计性的,每步结果不确定 + OS 级分叉原语将串行试错变为并行多路探索,不改变循环内部结构 +
+ + +
+ → Harness Engineering · Fork-Explore-Commit · LangGraph · Meta-Harness + Anthropic · Karpathy (2024) +
+
+ + From c965b36be3b13ccfd922845bd9e1f10310b96d6c Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:36:35 +0800 Subject: [PATCH 27/48] =?UTF-8?q?feat(cards):=20batch=205/18=20=E2=80=94?= =?UTF-8?q?=20concepts/indra-net=E2=86=92long-running-agents=20(15=20cards?= =?UTF-8?q?)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../content/cards/zh/concepts/indra-net.mdx | 74 +++++++++++++ .../cards/zh/concepts/induction-problem.mdx | 77 +++++++++++++ .../inferential-theories-of-causation.mdx | 75 +++++++++++++ .../zh/concepts/interventionist-theory.mdx | 82 ++++++++++++++ .../cards/zh/concepts/inus-conditions.mdx | 72 ++++++++++++ .../knowledge-extraction-fidelity.mdx | 77 +++++++++++++ .../cards/zh/concepts/ladder-of-causation.mdx | 104 ++++++++++++++++++ .../cards/zh/concepts/language-of-thought.mdx | 73 ++++++++++++ .../linear-representation-hypothesis.mdx | 80 ++++++++++++++ .../cards/zh/concepts/llm-os-analogy.mdx | 82 ++++++++++++++ site/src/content/cards/zh/concepts/llm-os.mdx | 69 ++++++++++++ .../cards/zh/concepts/llm-security.mdx | 80 ++++++++++++++ .../zh/concepts/llm-training-pipeline.mdx | 92 ++++++++++++++++ .../content/cards/zh/concepts/llms-txt.mdx | 75 +++++++++++++ .../cards/zh/concepts/long-running-agents.mdx | 70 ++++++++++++ 15 files changed, 1182 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/indra-net.mdx create mode 100644 site/src/content/cards/zh/concepts/induction-problem.mdx create mode 100644 site/src/content/cards/zh/concepts/inferential-theories-of-causation.mdx create mode 100644 site/src/content/cards/zh/concepts/interventionist-theory.mdx create mode 100644 site/src/content/cards/zh/concepts/inus-conditions.mdx create mode 100644 site/src/content/cards/zh/concepts/knowledge-extraction-fidelity.mdx create mode 100644 site/src/content/cards/zh/concepts/ladder-of-causation.mdx create mode 100644 site/src/content/cards/zh/concepts/language-of-thought.mdx create mode 100644 site/src/content/cards/zh/concepts/linear-representation-hypothesis.mdx create mode 100644 site/src/content/cards/zh/concepts/llm-os-analogy.mdx create mode 100644 site/src/content/cards/zh/concepts/llm-os.mdx create mode 100644 site/src/content/cards/zh/concepts/llm-security.mdx create mode 100644 site/src/content/cards/zh/concepts/llm-training-pipeline.mdx create mode 100644 site/src/content/cards/zh/concepts/llms-txt.mdx create mode 100644 site/src/content/cards/zh/concepts/long-running-agents.mdx diff --git a/site/src/content/cards/zh/concepts/indra-net.mdx b/site/src/content/cards/zh/concepts/indra-net.mdx new file mode 100644 index 0000000..323473c --- /dev/null +++ b/site/src/content/cards/zh/concepts/indra-net.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因陀罗网 +titleAlt: Indra's Net +tagline: 全息互映 · 每个节点包含全局信息 · 自相似性的哲学发现 +refs: + - concepts/fractal-architecture + - concepts/fractal-dimension +sourceLine: Avatamsaka Sutra · Cook 1973 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import HeroHan from '~/components/card/blocks/HeroHan.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Quote from '~/components/card/blocks/Quote.astro'; + + +
+ 概念 · INDRA'S NET · 华严经 + +
+
+

因陀罗网

+

Indra's Net — 全息互映,每颗宝珠映照所有其他宝珠

+
+
+ + + 帝释天宫殿中无限延伸的珠网,每颗宝珠映照所有其他宝珠(递归无限层)。局部修改即全局修改——改变一颗,所有映像同步。比曼德布罗提出分形概念早约 1300 年。 + + + + 每个网眼中镶嵌一颗宝珠,宝珠数量无限。任选一颗仔细观看,会发现它的表面映照着网中所有其他宝珠——这颗宝珠中映照出的每一颗宝珠,也在映照着所有其他宝珠,产生无限的映照过程……所有成员之间存在无限重复的相互关系。 +
+
+ 全息性 + 每个节点包含全局信息——分形的定义特征 +
+
+ 同时性 + 所有映照同时发生,不是序列递归而是瞬时全局状态 +
+
+ 无碍互入 + 华严经术语:一切法互相含摄,A 完整存在于 B 之中 +
+
+
+ 分形类比 + 分形架构四规则在因陀罗网中的对应:统一接口 = 每颗宝珠相同;无特权根节点 = 任选一颗都能看到整张网;递归组合 = 映像中的映像 +
+
+ + +
+ → 分形架构 · 分形维数 · 须弥芥子 + 华严经 · Cook (1973) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/induction-problem.mdx b/site/src/content/cards/zh/concepts/induction-problem.mdx new file mode 100644 index 0000000..59c8b59 --- /dev/null +++ b/site/src/content/cards/zh/concepts/induction-problem.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 归纳问题 +titleAlt: Problem of Induction +tagline: 从"过去如此"到"未来如此"没有理性基础 · 休谟之叉 +refs: + - concepts/causation-hume + - concepts/custom-and-habit + - concepts/falsificationism +sourceLine: Hume Enquiry 1748 · SEP Problem of Induction +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROBLEM OF INDUCTION · 休谟 · 认识论核心难题 + + + +

归纳问题

+

Problem of Induction — 从 P1 到 P2 的鸿沟没有理性桥接

+
+ + + 从"阿司匹林过去总能缓解头痛"到"这次也会"——这个推理似乎自然,但每条理性路径都失败了。演绎推理无法弥合过去与未来;概率推理预设了它试图证明的齐一性原则(恶性循环)。 + + + +
+ 休谟之叉:所有论证只有两类 +
+
+ 演示性(演绎) + ✗ 失败 +

UP 的否定不构成矛盾——自然进程发生变化在逻辑上可想象

+
+
+ 概率性(归纳) + ✗ 循环 +

概率论证本身需要援引 UP("过去概率可外推")——预设了 UP

+
+
+
+
+ 主要回应方案 + 接受不可解,论证科学根本不需要归纳 + 用概率更新框架重新表述,提供最精确的数学处理 + 不直接辩护归纳,证明"追随当前最成功方法"的元策略是先验最优的 + 习惯(custom & habit)——这是归纳的实际基础,不需要理性辩护 +
+
+ + +
+ → 习惯 · 证伪主义 · 贝叶斯归纳 · Grue 问题 · No Free Lunch + Hume (1748) · SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/inferential-theories-of-causation.mdx b/site/src/content/cards/zh/concepts/inferential-theories-of-causation.mdx new file mode 100644 index 0000000..c7e63e2 --- /dev/null +++ b/site/src/content/cards/zh/concepts/inferential-theories-of-causation.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 推断性因果理论 +titleAlt: Inferential Theories of Causation +tagline: 从规律到推断路径 · 因果关系的推理结构刻画 +refs: + - concepts/inus-conditions + - concepts/causal-models + - concepts/difference-making +sourceLine: SEP Regularity and Inferential Theories · Hempel & Oppenheim 1948 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · INFERENTIAL THEORIES · 因果理论 · 规则性传统的精炼 + + + +

推断性因果理论

+

Inferential Theories of Causation — C 是 E 的原因 iff E 可从 C 推断

+
+ + + 规则性理论的继承者:因果关系的标志不在于事件类型的恒常伴随,而在于从原因到结果的推断路径——通过适当的背景知识(法则、事实)和推理规则。方向性是推断路径携带的。 + + + +
+ 四个主要推断性理论 +
+ DN 模型(Hempel 1948) + 效应从法则+前件逻辑推出。对称性问题:塔高↔影长,两个方向都可推 +
+
+ 排名函数(Spohn 2012) + 认知状态的不信任度排名。C 是原因 iff C 提升 E 的认识地位(条件化) +
+
+ 加强版 Ramsey 测试 + 演绎不可冗余性排除虚假因果:真正推断路径上的法则不可从更基本法则推导出 +
+
+ Kairetic 账户(Strevens) + 解释核心的每个成员对效应构成差异——差异制造 + 推断性结合 +
+
+
+ 推断关系可非单调(允许例外);携带方向性;区分基本法则与派生法则 + 即使无对应普遍规律,也可从丰富背景理论推断个例(恐龙灭绝) +
+
+ + +
+ → INUS 条件 · 因果模型 · 差异制造 · 反事实理论 + Hempel (1948) · Spohn (2012) · Strevens (2008) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/interventionist-theory.mdx b/site/src/content/cards/zh/concepts/interventionist-theory.mdx new file mode 100644 index 0000000..1872894 --- /dev/null +++ b/site/src/content/cards/zh/concepts/interventionist-theory.mdx @@ -0,0 +1,82 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 干预主义理论 +titleAlt: Interventionist Theory of Causation +tagline: 因果关系 = 主动操控的系统性回答 · Woodward 2003 +refs: + - concepts/causal-models + - concepts/causal-intervention + - concepts/counterfactual-theory +sourceLine: Woodward Making Things Happen 2003 · Pearl Causality 2000 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · INTERVENTIONIST THEORY · 因果理论 · Woodward + + + +

干预主义理论

+

Interventionist Theory — X 对 Y 有因果影响 iff 存在对 X 的干预能改变 Y

+
+ + + 因果不是静态关系,而是"如果你操控 X 会怎样"的系统性回答。与 Lewis 反事实理论的区别:反事实通过最近可能世界评估;干预主义通过固定因果无关因素后的实际操控评估。 + + + +
+ Woodward 定义链(非恶性循环) +
+ 1 +
+ 干预变量 I + I 影响 X;I 使 X 不受其他变量控制;I→Y 的所有路径经过 X;I 与 Y 的非 X 路径影响因素独立 +
+
+
+ 2 +
+ 直接影响 + 存在对 X 的干预,固定其他变量后改变 Y +
+
+
+
+ 结构方程形式化 + D := C 表达 C 对 D 的因果方向,不同于对称的相关关系 + 每个方程可独立被干预破坏,不影响其他方程 + 固定其他变量,改变一个变量——这就是干预的工程实现 +
+
+ 因果优先 vs 反事实优先 + Pearl/Woodward:结构方程表示因果依赖,由此推导反事实 | Lewis 路线:结构方程表示反事实依赖 +
+
+ + +
+ → 因果干预 · 反事实理论 · 因果模型 · do 演算 + Woodward (2003) · Pearl (2000) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/inus-conditions.mdx b/site/src/content/cards/zh/concepts/inus-conditions.mdx new file mode 100644 index 0000000..55d26e9 --- /dev/null +++ b/site/src/content/cards/zh/concepts/inus-conditions.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: INUS 条件 +titleAlt: INUS Conditions +tagline: 不充分但非冗余的不必要但充分条件的部分 · Mackie 1965 +refs: + - concepts/difference-making + - concepts/causal-models + - concepts/constant-conjunction +sourceLine: Mackie Causes and Conditions 1965 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · INUS CONDITIONS · 规则性因果理论 · Mackie 1965 + + + +

INUS 条件

+

Insufficient but Non-redundant part of an Unnecessary but Sufficient condition

+
+ + + 日常所说的"原因"通常既不是结果的充分条件也不是必要条件,而是某个充分条件簇中不可缺少的因子。允许多条因果路径并行(析取),每条路径是合取的最小充分条件簇。 + + + +
+ 复杂规律的析取-合取结构 +
+ (C₁₁ ∧ C₁₂ ∧ …) ∨ (C₂₁ ∧ C₂₂ ∧ …) ∨ … ↔ E +
+

每个合取项 = 最小充分条件簇;每个因子 = INUS 条件(不可从所属簇中移除)

+
+
+
IInsufficient单独不足以导致 E
+
NNon-redundant不可从所属簇中移除(差异制造的规则性版本)
+
UUnnecessary所属簇不是 E 的必要条件(其他簇也能产生 E)
+
SSufficient所属簇整体足以导致 E
+
+
+ 汽笛→伦敦工人下班,两者共因是 5 点钟——INUS 无法排除共因联合效应 + 因果充分性的必要元素,已成为法律因果理论的重要工具 +
+
+ + +
+ → 差异制造 · 恒常连结 · 因果模型 · 推断性理论 + Mackie (1965, 1974) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/knowledge-extraction-fidelity.mdx b/site/src/content/cards/zh/concepts/knowledge-extraction-fidelity.mdx new file mode 100644 index 0000000..caa91d1 --- /dev/null +++ b/site/src/content/cards/zh/concepts/knowledge-extraction-fidelity.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 知识提取与忠实性 +titleAlt: Knowledge Extraction and Fidelity +tagline: 忠实性 ≠ 准确率 · 描述的是网络实际做什么 +refs: + - concepts/mechanistic-interpretability + - concepts/activation-intervention +sourceLine: Garcez & Lamb 2020 Neurosymbolic AI 3rd Wave +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · KNOWLEDGE EXTRACTION FIDELITY · XAI 核心标准 + + + +

知识提取与忠实性

+

Fidelity — 提取的符号描述与网络行为的一致性,不是拟合度

+
+ + + 知识提取 = 从神经网络导出可读符号描述(规则、决策树)。忠实性 = 提取结果与网络实际行为的一致性,不是与训练数据的拟合度。LIME 类方法忠实性极低——给出看似合理但实则无关的解释。 + + + +
+
+ 高忠实性 +

student-teacher 框架:提取知识对网络预测的复现率

+

可证明正确性(soundness):形式化保证描述精度

+
+
+ 低忠实性(问题) +

LIME 的局部线性近似行为可能与原始网络在同一区域大相径庭

+

事后解释叠加层无法保证对原始模型的忠实描述

+
+
+
+ 知识提取的用途 + GDPR 合规——发现网络实际利用了哪些保护变量的代理 + 发现网络依赖了不应依赖的特征(捷径学习) + 提取的符号知识反馈给下一轮学习作为约束 +
+
+ vs 机制可解释性 + 知识提取:映射为符号规则;机制可解释性:在激活层面追踪信息流动。两者都要求因果准确 +
+
+ + +
+ → 机制可解释性 · 激活干预 · 神经符号 AI + Garcez & Lamb (2020) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/ladder-of-causation.mdx b/site/src/content/cards/zh/concepts/ladder-of-causation.mdx new file mode 100644 index 0000000..e68f242 --- /dev/null +++ b/site/src/content/cards/zh/concepts/ladder-of-causation.mdx @@ -0,0 +1,104 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果之梯 +titleAlt: Ladder of Causation +tagline: 关联 · 干预 · 反事实 · 三级不可还原 +refs: + - concepts/causal-intervention + - concepts/do-calculus + - concepts/causal-dag +sourceLine: Pearl & Mackenzie The Book of Why 2018 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · LADDER OF CAUSATION · Pearl 因果三层级 + + + +

因果之梯

+

Ladder of Causation — 从观察到干预到想象,每级回答前级无法回答的问题

+
+ + + 三级不可还原:第一级(关联/P(Y|X))无法回答第二级(干预/P(Y|do(X)));第二级无法回答第三级(反事实)。仅靠更多数据或更大模型无法从关联跃迁到干预——需要因果结构知识。 + + + +
+
+
+ + 关联 +
+
+ P(Y | X) + Seeing · 观察 + "观察到 X 时,Y 的概率?" + 大多数 ML 仅在此层。冰淇淋≠溺水 +
+
+
+
+ + 干预 +
+
+ P(Y | do(X)) + Doing · 行动 + "如果我做了 X,Y 会怎样?" + 随机对照试验 / 因果 DAG + do 演算 +
+
+
+
+ + 反事实 +
+
+ {"P(Y_x(u))"} + Imagining · 想象 + "如果当初 X 不同,Y 是否会不同?" + 需要完整 SCM 规格;溯因→行动→预测 +
+
+
+
+ 神经符号视角 + 纯深度学习停留在第一级(关联)。神经符号系统可跨越三级:一旦网络编码符号描述(A→B),干预和反事实查询即成为可能 +
+
+ + +
+ → 因果干预 · do 演算 · 因果 DAG · 中介分析 · 因果概率 + Pearl & Mackenzie (2018) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/language-of-thought.mdx b/site/src/content/cards/zh/concepts/language-of-thought.mdx new file mode 100644 index 0000000..223fc37 --- /dev/null +++ b/site/src/content/cards/zh/concepts/language-of-thought.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 思维语言 +titleAlt: Language of Thought +tagline: Mentalese · 句法结构化的心理表征 · 系统性的结构保证 +refs: + - concepts/compositionality + - concepts/physical-symbol-system + - concepts/linear-representation-hypothesis +sourceLine: Fodor 1975 Language of Thought · Fodor & Pylyshyn 1988 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LANGUAGE OF THOUGHT · Fodor 1975 · LOTH + + + +

思维语言

+

Language of Thought Hypothesis — 思维是 Mentalese 上的计算

+
+ + + 思维是对句法结构化符号表达式的计算。心理表征像句子一样有组成部分;心理计算过程对句法形式(而非语义内容)直接作用;复杂表征的语义由组合性确定。 + + + +
+ 三个核心承诺 + 概念 = Mentalese 词汇;命题 = Mentalese 句子 + 计算作用于形式而非语义——形式性原则(Formality Condition) + 复杂表征的意义由部分意义 + 组合方式系统性确定 +
+
+ 最强论据:系统性 +
+ 能思考"John loves Mary" + → 必然能思考 + "Mary loves John" +
+

在 LOTH 框架下这是必然的——两个思想共享相同 Mentalese 部分,只是排列不同。不是偶然,是架构保证。

+
+
+ 高维激活向量是"连续 Mentalese"?线性表征假说的实证表明 LLM 内部存在线性可分离的结构表征 + 联结主义通过训练偶然获得组合性,无法解释系统性的必然性——架构保证 vs 训练偶然 +
+
+ + +
+ → 组合性 · 物理符号系统 · 线性表征假说 · 神经符号 AI + Fodor (1975) · Fodor & Pylyshyn (1988) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/linear-representation-hypothesis.mdx b/site/src/content/cards/zh/concepts/linear-representation-hypothesis.mdx new file mode 100644 index 0000000..fe2e3e3 --- /dev/null +++ b/site/src/content/cards/zh/concepts/linear-representation-hypothesis.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 线性表征假说 +titleAlt: Linear Representation Hypothesis +tagline: 特征以线性方式编码在激活空间中 · 机制可解释性的方法论基础 +refs: + - concepts/mechanistic-interpretability + - concepts/causal-inner-product + - concepts/activation-intervention +sourceLine: Park Choe Veitch 2023 ICML · Gurnee Tegmark 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LINEAR REPRESENTATION HYPOTHESIS · LRH · 可解释性基础 + + + +

线性表征假说

+

LRH — 特征 f 存在方向向量 w,使得 f(x) ≈ a(x)·w

+
+ + + 神经网络内部的特征以线性方式编码在激活空间中——某特征的存在或强度可通过将激活向量投影到特征方向向量上读取。网络全局非线性,但特定特征在局部占据线性可分离方向。 + + + +
+ 三种等价直觉(Park et al. 2023 统一形式化) +
+ 非嵌入表征 + "king - man + woman = queen"——词对差值共线 +
+
+ 测量表征 + 线性探针可预测概念(logit-linear 可预测) +
+
+ 嵌入表征 + 方向向量可定向修改输出(Steering Vector) +
+

在因果内积下,三种表征统一到同一方向(Riesz 同构)——同一向量既可作线性探针又可作 steering vector

+
+
+ Othello-GPT:相对颜色坐标(Mine/Yours/Empty)线性探针 75% → 99% + 经纬度、历史时间戳:线性探针 vs 非线性 MLP 差距 R² < 0.02 +
+
+ 叠加 + n 个神经元表征 > n 个特征(near-orthogonal 方向)。个体神经元多义,特征在激活的线性组合方向上——SAE 从叠加中恢复 +
+
+ + +
+ → 机制可解释性 · 因果内积 · 激活干预 · 时空世界模型 + Park et al. (ICML 2024) · Gurnee & Tegmark (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/llm-os-analogy.mdx b/site/src/content/cards/zh/concepts/llm-os-analogy.mdx new file mode 100644 index 0000000..b52109d --- /dev/null +++ b/site/src/content/cards/zh/concepts/llm-os-analogy.mdx @@ -0,0 +1,82 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LLM-OS 类比 +titleAlt: LLM-OS Analogy +tagline: LLM = CPU · Agent = OS Kernel · Context = RAM · 结构性同构 +refs: + - concepts/implicit-loop-architecture + - concepts/context-management + - concepts/harness-engineering +sourceLine: Karpathy 2023 Intro to LLMs · 2026 Tweet +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 概念 · LLM-OS ANALOGY · Karpathy · 结构性类比 + + + +

LLM-OS 类比

+

LLM = CPU,Agent = OS Kernel — 不是修辞,是结构性同构

+
+ + + LLM 是"正在涌现的操作系统的内核进程"(Karpathy 2023)。不是聊天机器人,不是单词生成器。核心差异:OS 建立在确定性硬件上,Agent 建立在统计性 LLM 上——需要为不确定性做设计。 + + + +
+
+ 传统 OSAgent 系统同构本质 +
+
+ CPULLM原始计算/推理能力 +
+
+ OS KernelAgent资源调度、任务编排 +
+
+ RAMContext Window有限即时工作记忆 +
+
+ SyscallTool Call (ACI)受控的特权操作接口 +
+
+ Virtual MemoryContext Management有限资源上的无限幻觉 +
+
+ Device DriverMCP/工具适配器标准化外设接口 +
+
+
+ 类比边界(不对称点) + CPU 确定性 → LLM 统计性;CPU 不理解自己执行的内容 → LLM 可(在某种程度上)反思;指令集固定 → LLM 能力随 prompt 动态变化 +
+
+ + +
+ → 隐式循环架构 · Context Management · Harness Engineering · AIOS + Karpathy (2023, 2026) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/llm-os.mdx b/site/src/content/cards/zh/concepts/llm-os.mdx new file mode 100644 index 0000000..dfa22b1 --- /dev/null +++ b/site/src/content/cards/zh/concepts/llm-os.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LLM 操作系统 +titleAlt: LLM OS +tagline: LLM 不是公用事业 · 是软件生态系统 · 我们在 1960 年代 +refs: + - concepts/llm-os-analogy + - concepts/context-management + - concepts/implicit-loop-architecture +sourceLine: Karpathy 2025 YC Talk Software Is Changing Again +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LLM OS · Karpathy · 软件生态系统类比 + + + +

LLM 操作系统

+

LLM OS — 不是电力/晶圆厂,是日益复杂的软件生态系统

+
+ + + LLM 最贴切的类比是操作系统——不是 commodity,不是 utility,而是下游生态系统的平台。Karpathy:我们处于 LLM 计算的 1960 年代,中心化云端计算,个人计算革命尚未到来,通用 GUI 尚未被发明(ChatGPT = 终端)。 + + + +
+
闭源 OS(Windows/macOS)GPT / Claude / Gemini
+
Linux(开源)LLaMA 生态
+
终端(Terminal)ChatGPT 文本界面
+
应用程序(App)Cursor / Perplexity 等
+
Time Sharing多用户共享批次维度
+
+
+ 技术扩散的逆转 + 政府/军方 → 企业 → 消费者(新技术下行扩散) + 消费者最先采用("帮我煮鸡蛋"),企业和政府反而落后 + LLM 是纯软件——ChatGPT 一夜触达数十亿人,无需硬件购买 +
+
+ + +

{"1960s 预测 → 个人计算革命(Mac Mini batch-1 推理是早期迹象) · 通用 GUI 尚待发明"}

+
+ + +
+ → LLM-OS Analogy · Context Management · Software 3.0 + Karpathy (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/llm-security.mdx b/site/src/content/cards/zh/concepts/llm-security.mdx new file mode 100644 index 0000000..6999c20 --- /dev/null +++ b/site/src/content/cards/zh/concepts/llm-security.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LLM 安全 +titleAlt: LLM Security +tagline: 越狱 · 提示注入 · 数据投毒 · 猫鼠游戏永不终止 +refs: + - concepts/guardrails + - concepts/llm-os-analogy + - concepts/harness-engineering +sourceLine: Karpathy 2023 Intro to Large Language Models +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LLM SECURITY · 攻击类型 · 猫鼠博弈 + + + +

LLM 安全

+

LLM Security — 新计算栈必然带来新攻击面(Karpathy 2023)

+
+ + + 安全对齐在高维空间中划定"拒绝边界"——攻击者可从无数方向绕过。这是一场持续的猫鼠游戏,与传统信息安全动态完全一致。不能追求一次性解决,需要持续的监控-检测-修补循环。 + + + +
+
+ 攻击类型传统 OS 对应核心难点 +
+
+ 越狱 Jailbreak + 缓冲区溢出 + 角色扮演/编码绕过/对抗后缀——边界可从无数方向攻破 +
+
+ 提示注入 Prompt Injection + SQL 注入 + 模型无法可靠区分"用户指令"与"数据中的指令样文本" +
+
+ 数据投毒 Data Poisoning + 供应链攻击 + 训练数据中植入触发词,"满洲候选人"式潜伏后门 +
+
+
+ 杀毒软件/防火墙——运行时检测与防御层 + 权限控制 + 沙箱执行是防御 prompt injection 的工程手段 +
+
+ + +
+ → Guardrails · LLM-OS Analogy · Harness Engineering + Karpathy (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/llm-training-pipeline.mdx b/site/src/content/cards/zh/concepts/llm-training-pipeline.mdx new file mode 100644 index 0000000..9a678a1 --- /dev/null +++ b/site/src/content/cards/zh/concepts/llm-training-pipeline.mdx @@ -0,0 +1,92 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LLM 训练流水线 +titleAlt: LLM Training Pipeline +tagline: 预训练 → 微调 → RLHF · 三阶段标准心智模型 +refs: + - concepts/bitter-lesson + - concepts/augmented-llm + - concepts/llm-os-analogy +sourceLine: Karpathy 2023 Intro to Large Language Models +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LLM TRAINING PIPELINE · 三阶段架构 + + + +

LLM 训练流水线

+

原始互联网文本 → 可用对话助手的多阶段转化

+
+ + + 预训练不是简单信息存储——通过预测任务被迫学习世界知识。微调改变格式而非知识。两者的核心区别:量(海量低质)vs 质(少量高质),训练量:预训练 10TB + 12天 vs 微调 100K 对话 + 1天。 + + + +
+
+ 01 +
+ 预训练 +
+ 输入:~10TB 互联网文本 + 目标:下一词预测(NTP) + 计算:~6000 GPU × 12 天 + 产出:Base model(100× 有损压缩) +
+
+
+
+ 02 +
+ 微调(Fine-tuning) +
+ 输入:~100K 人工标注 Q&A + 目标:仍是下一词预测,但数据换为高质量对话 + 产出:Assistant model(文档生成器 → 问答助手) +
+
+
+
+ 03 +
+ RLHF(可选) +
+ 输入:人工比较标签(A 好于 B) + 优势:判断哪个好比自己写一个好答案更容易 +
+
+
+
+ 人工标注被人机协作替代:模型采样候选 → 人工挑选 → 训练数据。模型越强,人类角色从"创作者"→"审核者" +
+ + +
+ → Scaling Laws · Augmented LLM · Bitter Lesson + Karpathy (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/llms-txt.mdx b/site/src/content/cards/zh/concepts/llms-txt.mdx new file mode 100644 index 0000000..750c40b --- /dev/null +++ b/site/src/content/cards/zh/concepts/llms-txt.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: llms.txt +titleAlt: llms.txt +tagline: 网站根路径的 Markdown 文件 · 告诉 LLM 这个网站是什么 +refs: + - concepts/aci + - concepts/context-engineering + - concepts/agent-skills +sourceLine: Jeremy Howard Answer.AI 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LLMS.TXT · ACI 基础设施层 · Jeremy Howard 2024 + + + +

llms.txt

+

robots.txt 告诉爬虫可以爬什么;llms.txt 告诉 LLM 网站是什么

+
+ + + 放置于网站 /llms.txt 的 Markdown 文件——主要用于推理时(用户向 LLM 询问时),而非训练时。网站主动提供 LLM 可解析格式,而非等待 LLM 自行抓取解析 HTML。 + + + +
+ 格式规范 +
必填H1项目或站点名称
+
可选Blockquote一句话摘要(理解其余内容所必需)
+
可选Markdown 段落补充背景,不含标题
+
可选H2 分节带说明的超链接列表
+
特殊Optional 节context 紧张时可跳过,放次要资源
+
+
+ 与现有标准的关系 +
标准面向对象使用时机
+
robots.txt搜索爬虫索引时
+
sitemap.xml搜索引擎索引时
+
llms.txtLLM推理时(用户请求时)
+
+ URL + .md 提供 Markdown 版内容,让 LLM 获取干净文档无需解析 HTML +
+ + +
+ → ACI · Context Engineering · Agent Skills · MCP + Jeremy Howard (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/long-running-agents.mdx b/site/src/content/cards/zh/concepts/long-running-agents.mdx new file mode 100644 index 0000000..302b5d0 --- /dev/null +++ b/site/src/content/cards/zh/concepts/long-running-agents.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 长时运行 Agent +titleAlt: Long-Running Agents +tagline: 跨 session 持续工作 · 每个新 session 天然失忆 · 轮班工程师比喻 +refs: + - concepts/harness-engineering + - concepts/feature-tracking + - concepts/context-management +sourceLine: Anthropic Effective Harnesses Long-Running Agents +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · LONG-RUNNING AGENTS · 跨 Session 架构挑战 + + + +

长时运行 Agent

+

Long-Running Agents — 轮班工程师:上班时对前一班发生的事毫无记忆

+
+ + + 任务复杂度超出单个 context window,需要跨多 session 持续工作。核心挑战不是"时间长",是每个新 session 天然失忆。仅靠 context management(compaction)不足——需要外部化的持久进度追踪。 + + + +
+ 三类失败模式 +
One-shotting试图在单 session 内完成全部工作,context 耗尽留下半成品
+
Premature victory看到已有进展过早宣布完成——没有客观的完成度证据
+
状态断裂compaction 丢失关键上下文,下一 session 误解前序状态
+
+
+ Initializer-Coder 双 Agent 架构 + 首次运行:环境搭建 + feature list 生成(200+ 条)+ 进度文件初始化 + 后续运行:每次只做一个 feature,保持代码库可合并,端到端验证后标记 passes=true + 外部文件(progress file + git history)而非 context window——防止失忆 +
+
+ SWE-EVO 证据 + 单步 72.8% → 多步 25%。增量推进策略的量化理由——不是保守,是在误差级联面前的必要手段 +
+
+ + +
+ → Harness Engineering · Feature Tracking · Context Management · Error Cascade + Anthropic (2024) · SWE-EVO (2025) +
+
+ + From a1b5aacc33a8a2cd0403b9ade6734fa4a99b0a26 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:43:58 +0800 Subject: [PATCH 28/48] =?UTF-8?q?feat(cards):=20batch=206/18=20=E2=80=94?= =?UTF-8?q?=20concepts/means-ends-analysis=E2=86=92permission-modes=20(15?= =?UTF-8?q?=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/concepts/means-ends-analysis.mdx | 87 +++++++++++++++++++ .../concepts/mechanistic-interpretability.mdx | 78 +++++++++++++++++ .../cards/zh/concepts/mediation-analysis.mdx | 68 +++++++++++++++ .../cards/zh/concepts/meta-cognition-ai.mdx | 80 +++++++++++++++++ .../cards/zh/concepts/meta-harness.mdx | 83 ++++++++++++++++++ .../cards/zh/concepts/meta-induction.mdx | 80 +++++++++++++++++ .../zh/concepts/near-decomposability.mdx | 76 ++++++++++++++++ .../zh/concepts/necessary-connection.mdx | 83 ++++++++++++++++++ .../zh/concepts/neurosymbolic-ai-taxonomy.mdx | 71 +++++++++++++++ .../cards/zh/concepts/neurosymbolic-ai.mdx | 83 ++++++++++++++++++ .../cards/zh/concepts/no-free-lunch.mdx | 76 ++++++++++++++++ .../zh/concepts/orchestrator-workers.mdx | 67 ++++++++++++++ .../othello-world-model-hypothesis.mdx | 75 ++++++++++++++++ .../cards/zh/concepts/parallelization.mdx | 78 +++++++++++++++++ .../cards/zh/concepts/permission-modes.mdx | 72 +++++++++++++++ 15 files changed, 1157 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/means-ends-analysis.mdx create mode 100644 site/src/content/cards/zh/concepts/mechanistic-interpretability.mdx create mode 100644 site/src/content/cards/zh/concepts/mediation-analysis.mdx create mode 100644 site/src/content/cards/zh/concepts/meta-cognition-ai.mdx create mode 100644 site/src/content/cards/zh/concepts/meta-harness.mdx create mode 100644 site/src/content/cards/zh/concepts/meta-induction.mdx create mode 100644 site/src/content/cards/zh/concepts/near-decomposability.mdx create mode 100644 site/src/content/cards/zh/concepts/necessary-connection.mdx create mode 100644 site/src/content/cards/zh/concepts/neurosymbolic-ai-taxonomy.mdx create mode 100644 site/src/content/cards/zh/concepts/neurosymbolic-ai.mdx create mode 100644 site/src/content/cards/zh/concepts/no-free-lunch.mdx create mode 100644 site/src/content/cards/zh/concepts/orchestrator-workers.mdx create mode 100644 site/src/content/cards/zh/concepts/othello-world-model-hypothesis.mdx create mode 100644 site/src/content/cards/zh/concepts/parallelization.mdx create mode 100644 site/src/content/cards/zh/concepts/permission-modes.mdx diff --git a/site/src/content/cards/zh/concepts/means-ends-analysis.mdx b/site/src/content/cards/zh/concepts/means-ends-analysis.mdx new file mode 100644 index 0000000..6fc9559 --- /dev/null +++ b/site/src/content/cards/zh/concepts/means-ends-analysis.mdx @@ -0,0 +1,87 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 手段-目的分析 +titleAlt: Means-Ends Analysis +tagline: GPS 差异驱动搜索 · 子目标递归 · CoT/ReAct 的历史前身 +refs: + - concepts/heuristic-search + - concepts/agentic-systems + - concepts/implicit-loop-architecture +sourceLine: Newell & Simon 1972 Human Problem Solving +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · MEANS-ENDS ANALYSIS · GPS · 差异驱动搜索 + + + +

手段-目的分析

+

Means-Ends Analysis — 比较当前状态与目标,用算子消除差异

+
+ + + GPS(General Problem Solver)的核心启发式:识别当前状态与目标状态的差异,选择能消除该差异的算子,递归处理前置条件。不是盲目搜索,是差异驱动的目标分解。Newell & Simon 1972。 + + + +
+ MEA 三步循环 +
+ +
+ 比较 + 当前状态 S vs 目标状态 G → 识别差异 D +
+
+
+ +
+ 选择 + 找到能消除差异 D 的算子 O +
+
+
+ +
+ 递归 + 若 O 的前置条件不满足 → 以满足前置为新子目标 → 递归 MEA +
+
+
+
+ 现代 AI 对应 + {"显式子目标分解 = MEA 的语言化实现"} + {"差异检测 (Reason) + 算子执行 (Act) + 状态更新循环"} + {"算子库 = 工具集;前置条件 = 工具参数约束"} + {"领域无关但不总是高效——须配合领域知识剪枝"} +
+
+ + +
+ → Heuristic Search · Agentic Systems · Implicit Loop + Newell & Simon (1972) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/mechanistic-interpretability.mdx b/site/src/content/cards/zh/concepts/mechanistic-interpretability.mdx new file mode 100644 index 0000000..283fa59 --- /dev/null +++ b/site/src/content/cards/zh/concepts/mechanistic-interpretability.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 机制可解释性 +titleAlt: Mechanistic Interpretability +tagline: 特征 · 归因图 · CLT · 幻觉机制 · CoT 不忠实 +refs: + - concepts/linear-representation-hypothesis + - concepts/othello-world-model-hypothesis + - concepts/neurosymbolic-ai +sourceLine: Anthropic 2024 Mapping the Mind of an LLM +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · MECHANISTIC INTERPRETABILITY · 电路级理解 · Anthropic 2024 + + + +

机制可解释性

+

Mechanistic Interpretability — 不是黑盒行为观测,是内部计算机制的逆向工程

+
+ + + 逆向工程神经网络的具体计算——不是"模型做了什么",而是"模型怎么算的"。核心工具:特征(单语义方向)→ 归因图(特征因果链)→ 电路(跨层子图)。Anthropic 2024 对 Claude 3 Sonnet 的解剖。 + + + +
+ 三层工具栈 +
特征 Features激活空间中单一语义方向;叠加假说:一个神经元 = 多个特征线性叠加(超完备基)
+
归因图 Attribution Graphs反向追踪哪些特征激活导致输出——因果链而非相关
+
CLT Cross-Layer Transcoder用稀疏自编码器将 MLP 分解为可解释特征;实现层间电路连接
+
+
+ 关键发现 +
+ 幻觉机制 + 错误自信特征与"知识不足"特征并存——幻觉是特征竞争的失败,非随机 +
+
+ CoT 不忠实 + 推理链不总是计划的真实执行;模型可能先决定答案再补充理由 +
+
+ 越狱张力 + 安全特征与功能特征相互干扰;攻击可绕过特定安全方向而不影响其他功能 +
+
+
+ + +
+ → Linear Repr. Hypothesis · Othello World Model · Neurosymbolic AI + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/mediation-analysis.mdx b/site/src/content/cards/zh/concepts/mediation-analysis.mdx new file mode 100644 index 0000000..f43a881 --- /dev/null +++ b/site/src/content/cards/zh/concepts/mediation-analysis.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 中介分析 +titleAlt: Mediation Analysis +tagline: TE · CDE · NDE · NIE · 直接效应与间接效应的分解 +refs: + - concepts/ladder-of-causation + - concepts/frontdoor-criterion + - concepts/interventionist-theory +sourceLine: Pearl 2001 Direct and Indirect Effects +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · MEDIATION ANALYSIS · 效应分解 · 因果之梯第三级 + + + +

中介分析

+

Mediation Analysis — X 影响 Y 的路径:X→Y(直接)vs X→M→Y(中介间接)

+
+ + + {"当 X 既直接影响 Y、又通过中介变量 M 间接影响 Y 时,如何分解两条路径?TE = 总效应;NDE = 自然直接效应(锁定 M 的反事实值);NIE = 自然间接效应;TE = NDE + NIE。NDE 不能用 do-operator——须调用反事实。"} + + + +
+ 四类效应 +
TE总效应 Total Effect{"E[Y|do(X=1)] - E[Y|do(X=0)]"}
+
CDE受控直接效应{"do(X=1,M=m) vs do(X=0,M=m),人为固定 M"}
+
NDE自然直接效应{"M 取 X=0 时自然值;只能用反事实表达"}
+
NIE自然间接效应{"X 固定 = 1,M 从 X=0 值变到 X=1 值的效果"}
+
+
+ {"P(y|do(x)) = Σ_m P(y|x,m)·P(m|x₀) — 识别 NDE 的关键"} + {"NDE 要求:X 实际为 1,同时 M 处于若 X=0 的假设值——因果之梯第三级"} + {"M 与 Y 共同混淆因子使 NDE 无法识别;需额外假设"} +
+
+ + +
+ → Ladder of Causation · Frontdoor Criterion · Interventionist Theory + Pearl (2001) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/meta-cognition-ai.mdx b/site/src/content/cards/zh/concepts/meta-cognition-ai.mdx new file mode 100644 index 0000000..fdfff0b --- /dev/null +++ b/site/src/content/cards/zh/concepts/meta-cognition-ai.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AI 元认知 +titleAlt: Meta-Cognition in AI +tagline: 监控 · 评估 · 调整 · NSAI 5% 盲区 · AlphaGeometry 唯一覆盖 +refs: + - concepts/neurosymbolic-ai + - concepts/mechanistic-interpretability + - concepts/meta-harness +sourceLine: arXiv 2501.05435 Neurosymbolic AI 2024 Systematic Review +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · META-COGNITION AI · 推理自监控 · NSAI 关键缺口 + + + +

AI 元认知

+

Meta-Cognition — 系统监控、评估并调整自身推理过程的能力

+
+ + + 认知科学定义:对认知过程的认知。AI 语境:系统检测自身推理错误、评估不确定性、并据此调整策略的能力。三要素:监控(检测错误信号)、评估(量化不确定性)、调整(选择新策略)。 + + + +
+
+ 监控 Monitor + 实时检测推理过程中的错误信号与一致性违反 +
+
+ 评估 Evaluate + 量化当前推理路径的不确定性与置信度 +
+
+ 调整 Adjust + 基于评估结果切换策略、回退或引入验证步骤 +
+
+
+ NSAI 系统综述发现(2020–2024) +
+ 5% + 元认知研究在 167 篇 NSAI 论文中的占比——最严重的研究缺口,被标注为"通往 AGI 的关键障碍" +
+ 唯一同时覆盖全四个研究维度的系统:神经语言模型生成候选 + 符号演绎验证 + 内置推理监控 + Agent 的自我检查循环(evaluator-optimizer)、不确定性声明、回退策略均是元认知的工程实现 +
+
+ + +
+ → Neurosymbolic AI · Mechanistic Interpretability · Meta-Harness + arXiv:2501.05435 (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/meta-harness.mdx b/site/src/content/cards/zh/concepts/meta-harness.mdx new file mode 100644 index 0000000..0754868 --- /dev/null +++ b/site/src/content/cards/zh/concepts/meta-harness.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 元 Harness +titleAlt: Meta-Harness +tagline: Session · Harness · Sandbox 三层接口 · 脑-手解耦 · OS 虚拟化类比 +refs: + - concepts/harness-engineering + - concepts/permission-modes + - concepts/long-running-agents +sourceLine: Anthropic Claude Code Architecture +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · META-HARNESS · 三层接口架构 · 脑-手解耦 + + + +

元 Harness

+

Meta-Harness — Agent 大脑与执行环境之间的标准化接口层

+
+ + + 元 Harness 是 agent 认知层(Session)与执行层(Sandbox)之间的解耦接口。类比操作系统虚拟化:Session 是进程,Harness 是 syscall 接口,Sandbox 是硬件资源池。解耦使同一 agent 逻辑可在不同执行环境中运行。 + + + +
+ 三层接口栈 +
+ Session 层 + Agent 认知逻辑:目标、规划、工具选择 + OS 类比 → 用户进程 +
+
↕ Harness 接口
+
+ Harness 层 + 工具路由、权限检查、状态持久化 + OS 类比 → 系统调用接口 +
+
↕ Sandbox 接口
+
+ Sandbox 层 + 实际执行:文件系统、网络、进程 + OS 类比 → 硬件/内核资源 +
+
+
+ 解耦收益 + 同一 Session 逻辑可切换本地/远程/容器沙箱 + Harness 是权限执行点——Session 无法绕过 + 所有工具调用经 Harness,天然形成审计日志 + 跨 session 状态存在 Harness/Sandbox 而非 context window +
+
+ + +
+ → Harness Engineering · Permission Modes · Long-Running Agents + Anthropic Claude Code +
+
+ + diff --git a/site/src/content/cards/zh/concepts/meta-induction.mdx b/site/src/content/cards/zh/concepts/meta-induction.mdx new file mode 100644 index 0000000..c4b7014 --- /dev/null +++ b/site/src/content/cards/zh/concepts/meta-induction.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 元归纳 +titleAlt: Meta-Induction +tagline: wMI 策略 · 对象-元归纳层 · 遗憾学习 · Bandit 类比 +refs: + - concepts/induction-problem + - concepts/no-free-lunch + - concepts/bayesian-induction +sourceLine: Schurz 2008 The Meta-Inductivist +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · META-INDUCTION · 归纳策略的归纳 · Schurz 2008 + + + +

元归纳

+

Meta-Induction — 不直接预测世界,而是追踪哪个归纳策略更准确

+
+ + + 对象归纳预测事件;元归纳追踪和组合多个对象归纳策略的过去表现。wMI(加权元归纳)根据历史预测精度动态分配权重——即使无法回答"归纳为何有效",也能保证相对于最佳可用策略的低遗憾。 + + + +
+ 两层结构 +
+
+ 对象层归纳 + 直接从数据预测:贝叶斯、神经网络、领域模型…… + 各有优劣,无普遍最优(NFL) +
+
+ 元归纳层 + 追踪各对象策略表现 → 动态加权组合 + wMI:权重 ∝ 历史精度 +
+
+
+
+ wMI 三项保证 +
长期遗憾有界:不会持续落后于最佳已知策略
+
无需假设哪个对象策略"正确"——环境变化时自动重新分配权重
+
Bandit 等价:每个对象策略是一条臂;wMI = 自适应多臂 Bandit
+
+ 不证明归纳的绝对可靠,证明元归纳相对于现有最佳策略的优越性——休谟问题的工程级部分解 +
+ + +
+ → Induction Problem · No Free Lunch · Bayesian Induction + Schurz (2008) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/near-decomposability.mdx b/site/src/content/cards/zh/concepts/near-decomposability.mdx new file mode 100644 index 0000000..5fb19a8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/near-decomposability.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 准可分解性 +titleAlt: Near-Decomposability +tagline: 短期独立 · 长期聚合耦合 · 频率分离 · Simon 1962 钟表匠 +refs: + - concepts/hierarchical-systems + - concepts/fractal-architecture + - concepts/context-management +sourceLine: Simon 1962 The Architecture of Complexity +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · NEAR-DECOMPOSABILITY · Simon 1962 · 复杂性架构 + + + +

准可分解性

+

Near-Decomposability — 子系统短期近似独立,长期通过聚合量相互耦合

+
+ + + {"Simon(1962)的核心洞见:复杂系统可以被近似分解为层级子模块——子模块内部交互频繁(高频),子模块之间交互稀疏(低频)。频率分离使分析和设计可以分层进行,而不是一次性处理所有耦合。"} + + + +
+
+ 短期行为 + 子系统近似独立——可独立分析每个子系统而不失真 + 细胞内部代谢 vs 细胞间信号传导 +
+
+ 长期行为 + 子系统聚合量相互耦合——整体行为由跨模块慢变量决定 + 器官系统 vs 单细胞机制 +
+
+
+ 频率分离 / Pace Layers +
快 →组件内机制:高频交互,局部优化
+
中 →模块接口:周期性同步,聚合状态传递
+
慢 →系统约束:低频演化,塑造整体结构
+
+ 工具执行(快)vs session 状态(中)vs harness 接口(慢)——三层可分别设计和优化 +
+ + +
+ → Hierarchical Systems · Fractal Architecture · Context Management + Simon (1962) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/necessary-connection.mdx b/site/src/content/cards/zh/concepts/necessary-connection.mdx new file mode 100644 index 0000000..71d1d5a --- /dev/null +++ b/site/src/content/cards/zh/concepts/necessary-connection.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 必然联系 +titleAlt: Necessary Connection +tagline: 休谟批判 · 三来源逐一排除 · 心灵的决定感 · 康德回应 +refs: + - concepts/causation-hume + - concepts/constant-conjunction + - concepts/regularity-theory +sourceLine: Hume 1748 Enquiry Concerning Human Understanding +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · NECESSARY CONNECTION · 休谟 · 因果联系的来源问题 + + + +

必然联系

+

Necessary Connection — 给定原因,结果必然发生——这种"必然"从何而来?

+
+ + + 传统哲学视因果为外部世界中的客观必然联系。休谟彻底批判:外部观察只有恒常连结,从未见到任何"联系"本身。排除三个候选来源后,必然联系的来源被重新定位到人类心灵内部。 + + + +
+ 休谟的三步排除法 +
+ 外部印象(洛克) + ✗ 排除 + 台球碰撞只见到先后相继——从未观察到任何"联系"本身 +
+
+ 内部印象(意志) + ✗ 排除 + 移动手指:意愿在先动作在后,但内部机制完全不透明 +
+
+ 神意(马勒伯朗士) + ✗ 排除 + 超越任何可能经验——带入"仙境" +
+
+ 心灵的决定感 + ✓ 来源 + 习惯性期望产生的"从一联想到另一"的内在感受 +
+
+
+ 先验综合判断:因果性是使经验成为可能的先天知性范畴,既非来自经验也非来自习惯 + 忠实继承休谟:因果 = 恒常连结,拒绝任何形而上学厚实的"必然联系" +
+
+ + +
+ → Causation Hume · Constant Conjunction · Regularity Theory + Hume (1748) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/neurosymbolic-ai-taxonomy.mdx b/site/src/content/cards/zh/concepts/neurosymbolic-ai-taxonomy.mdx new file mode 100644 index 0000000..f295bf6 --- /dev/null +++ b/site/src/content/cards/zh/concepts/neurosymbolic-ai-taxonomy.mdx @@ -0,0 +1,71 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 神经符号 AI 分类法 +titleAlt: Neurosymbolic AI Taxonomy +tagline: Kautz 六类 · 耦合谱 · 从 Symbolic_Neuro 到 Neuro[Symbolic] +refs: + - concepts/neurosymbolic-ai + - concepts/system-1-vs-system-2 + - concepts/constrained-decoding +sourceLine: Kautz 2022 The Third AI Summer AI Magazine +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · NEUROSYMBOLIC AI TAXONOMY · Kautz 六类 · AAAI 2020 + + + +

神经符号 AI 分类法

+

Kautz 六类——从最松到最紧耦合的神经符号集成架构谱系

+
+ + + Henry Kautz(AAAI 2020)提出迄今最具影响力的神经符号架构分类。命名约定:方括号表示内嵌,下划线表示包裹。核心权衡:耦合越紧 = 可验证性越强 + 训练越难。 + + + +
+
Type 1Symbolic_Neuro_SymbolicTransformer NLP符号边界内嵌神经处理——标准 NLP 范式
+
Type 2Symbolic[Neuro]AlphaGo符号框架(MCTS)调用神经子组件
+
Type 3Neuro;SymbolicNS-CL神经感知 + 符号推理并行协作
+
Type 4Neuro:Symbolic→NeuroLNN符号知识编译进神经权重;推理时纯神经
+
Type 5Neuro_SymbolicLTN逻辑规则作损失约束;可微融合
+
Type 6Neuro[Symbolic]目标尚未实现符号推理嵌入神经内部——System 1+2 完全集成
+
+
+ Type 1(最松,易训练)→ Type 6(最紧,可验证性强) + 约束解码 ≈ Type 1/4;LLM + 知识图谱 ≈ Type 2/3;LIME 后验解释 ≠ 任何类型 +
+
+ + +
+ → Neurosymbolic AI · System 1/2 · Constrained Decoding + Kautz (2022) AI Magazine +
+
+ + diff --git a/site/src/content/cards/zh/concepts/neurosymbolic-ai.mdx b/site/src/content/cards/zh/concepts/neurosymbolic-ai.mdx new file mode 100644 index 0000000..a238d9b --- /dev/null +++ b/site/src/content/cards/zh/concepts/neurosymbolic-ai.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 神经符号 AI +titleAlt: Neurosymbolic AI +tagline: System 1+2 集成 · 存在/全称量化互补 · Fodor-Pylyshyn 挑战 +refs: + - concepts/neurosymbolic-ai-taxonomy + - concepts/system-1-vs-system-2 + - concepts/knowledge-extraction-fidelity +sourceLine: Garcez & Lamb 2023 Neurosymbolic AI The 3rd Wave +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · NEUROSYMBOLIC AI · 第三波 · 神经+符号互补 + + + +

神经符号 AI

+

Neurosymbolic AI — 不是非此即彼,是将两种计算范式原理性地结合

+
+ + + 深度学习(分布式表示)擅长感知和学习;符号系统(局部主义)擅长推理和知识表示。两者互补的根本性:神经擅长存在量化(∃x),符号擅长全称量化(∀x)。目标是让同一系统拥有两种能力。 + + + +
+
+ 神经 Neural + System 1 · 快速并行 +
+ 感知 / 模式识别 + 从数据学习(梯度) + 存在量化 ∃x P(x) + 脆弱 · 不可解释 · 过拟合 +
+
+
+ 符号 Symbolic + System 2 · 慢速顺序 +
+ 逻辑推理 / 知识表示 + 规则泛化(形式化) + 全称量化 ∀x P(x) + 感知弱 · 知识获取贵 +
+
+
+
+ 悬而未决:Fodor-Pylyshyn 系统性挑战 + 架构保证的系统性 vs 训练涌现的系统性——LLM 展示部分但不稳定的组合性 + 唯一覆盖全四研究维度:神经候选生成 + 符号演绎验证 + 内置推理监控 +
+
+ + +
+ → NSAI Taxonomy · System 1/2 · Knowledge Extraction Fidelity + Garcez & Lamb (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/no-free-lunch.mdx b/site/src/content/cards/zh/concepts/no-free-lunch.mdx new file mode 100644 index 0000000..d701251 --- /dev/null +++ b/site/src/content/cards/zh/concepts/no-free-lunch.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: No Free Lunch 定理 +titleAlt: No Free Lunch Theorem +tagline: 均匀分布下泛化误差 1/2 · 休谟归纳问题的数学版 · 归纳偏置不可回避 +refs: + - concepts/induction-problem + - concepts/bayesian-induction + - concepts/scaling-laws +sourceLine: Wolpert 1996 Neural Computation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · NO FREE LUNCH · Wolpert 1996 · 归纳不可能性 + + + +

No Free Lunch 定理

+

No Free Lunch — 不存在在所有问题上都优于其他算法的"通用"学习算法

+
+ + + 在所有逻辑可能数据序列上取均匀分布,任何学习算法的泛化误差期望 = 1/2(等于随机猜测)。这是休谟归纳问题第一角的精确数学化身:无法先验证明任何算法的泛化能力。Wolpert 1992/1996。 + + + +
+ NFL ↔ 休谟归纳问题 +
+
+ 休谟第一角 + 归纳结论的否定不构成矛盾——存在自然进程改变的可能世界 +
+
+
+ NFL 定理 + 存在算法失败的数据序列——无法先验论证任何算法的泛化能力 +
+
+
+
+ 直接推论:归纳偏置不可回避 + 先验概率选择 = 学习算法的归纳偏置——两者结构同构 + 在特定假设类上有样本复杂度保证——模型相对辩护仍然可能 + 预测力依赖特定分布假设——NFL 提醒:这些假设可能失效 + 多步推理中归纳偏置不匹配被级联放大 +
+
+ + +
+ → Induction Problem · Bayesian Induction · Scaling Laws + Wolpert (1996) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/orchestrator-workers.mdx b/site/src/content/cards/zh/concepts/orchestrator-workers.mdx new file mode 100644 index 0000000..836c579 --- /dev/null +++ b/site/src/content/cards/zh/concepts/orchestrator-workers.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 编排器-工作者 +titleAlt: Orchestrator-Workers +tagline: 动态任务分解 · 区别于预定义并行 · A2A 跨系统扩展 +refs: + - concepts/parallelization + - concepts/agentic-systems + - concepts/harness-engineering +sourceLine: Anthropic Building Effective Agents 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · ORCHESTRATOR-WORKERS · 动态任务分解 · Agentic Workflow + + + +

编排器-工作者

+

Orchestrator-Workers — 中央 LLM 动态决定子任务,工作者 LLM 并行执行

+
+ + + 编排器根据具体输入动态决定如何分解任务并分发给工作者;与并行化的关键区别:子任务不是预定义的。适用场景:复杂任务的子任务无法提前预测——如代码修改需要改哪些文件取决于具体任务内容。 + + + +
+ 与并行化的对比 +
维度ParallelizationOrchestrator-Workers
+
子任务预定义,固定动态决定,依赖输入
+
适用可独立拆分的批量任务复杂、不可预测的任务
+
开销低(无编排调用)高(额外编排 LLM 调用)
+
灵活性
+
+
+ A2A 协议扩展 + 编排器 LLM + 工作者 LLM,共享进程和工具 + 编排器通过 Agent Card 发现能力,委派 Task,通过 SSE 接收结果 + 代码产品(改哪些文件取决于任务)/ 多源信息搜索和综合 +
+
+ + +
+ → Parallelization · Agentic Systems · Harness Engineering + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/othello-world-model-hypothesis.mdx b/site/src/content/cards/zh/concepts/othello-world-model-hypothesis.mdx new file mode 100644 index 0000000..54bbe07 --- /dev/null +++ b/site/src/content/cards/zh/concepts/othello-world-model-hypothesis.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Othello 世界模型假说 +titleAlt: Othello World Model Hypothesis +tagline: 序列训练 → 棋盘表征涌现 · 99% 精度 · 表征 ≠ 规划 +refs: + - concepts/mechanistic-interpretability + - concepts/linear-representation-hypothesis + - concepts/world-models +sourceLine: Li et al. 2022 OthelloGPT · Nanda et al. 2023 · Yuan & Søgaard 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · OTHELLO WORLD MODEL HYPOTHESIS · 涌现世界表征 · 三代研究 + + + +

Othello 世界模型假说

+

OWMH — 仅用着手序列训练的模型,内部自发涌现棋盘布局表征

+
+ + + OthelloGPT 实验:8 层 GPT 仅在着手序列上训练,无棋盘几何信息输入。内部激活中出现棋盘状态的结构化表征。联结主义涌现符号结构的小规模受控案例。Li et al. 2022 → Nanda et al. 2023 → Yuan & Søgaard 2025。 + + + +
+ 三代证据链 +
+ Li et al. 2022 + 非线性探针降错误率至 1.7%;因果干预证明表征影响输出 +
+
+ Nanda et al. 2023 + 修正坐标系(相对颜色)→ 线性探针精度从 75% 升至 99%;表征是线性的 +
+
+ Yuan & Søgaard 2025 + 跨 7 个 LLM;无监督 Procrustes 对齐精度 99%;跨架构余弦相似度 93–96% +
+
+
+ 关键约束与含义 + 2-hop 预测显著退化——高精度状态表征不自动带来多步规划能力 + MATS 分析:机制是局部启发式规则聚合而非统一棋盘追踪算法 + 不同架构收敛到相似表征——暗示与具体网络无关的表征吸引子 +
+
+ + +
+ → Mechanistic Interpretability · Linear Repr. Hypothesis · World Models + Li et al. (2022) / Nanda et al. (2023) / Yuan & Søgaard (2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/parallelization.mdx b/site/src/content/cards/zh/concepts/parallelization.mdx new file mode 100644 index 0000000..7e59c13 --- /dev/null +++ b/site/src/content/cards/zh/concepts/parallelization.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 并行化 +titleAlt: Parallelization +tagline: Sectioning 分段 · Voting 投票 · 预定义子任务 · 置信度提升 +refs: + - concepts/orchestrator-workers + - concepts/agentic-systems + - concepts/guardrails +sourceLine: Anthropic Building Effective Agents 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PARALLELIZATION · Agentic Workflow · 并发执行模式 + + + +

并行化

+

Parallelization — 多个 LLM 同时处理任务,结果程序汇聚

+
+ + + 并行化的两种变体:Sectioning 将任务拆成独立子任务同时执行;Voting 将同一任务跑多次获得多样化输出取共识。共同特征:子任务在设计时已知,不需要运行时动态决定(区别于编排器-工作者模式)。 + + + +
+
+ Sectioning 分段 + 适用:任务可无依赖拆分 + 吞吐量是瓶颈 +
+ 用户查询处理 + 内容 Guardrail 审核(同时) + 代码库多文件并行分析 +
+
+
+ Voting 投票 + 适用:需要更高置信度 + 多角度审视 +
+ 多 Prompt 从不同角度审查代码安全漏洞 + 多次采样取共识(Self-Consistency) +
+
+
+
+ 在 Agentic 系统中的定位 + 并行化子任务预定义;编排器-工作者子任务运行时动态决定 + 低开销(无额外编排调用);适合结构清晰、子任务独立的批量工作 +
+
+ + +
+ → Orchestrator-Workers · Agentic Systems · Guardrails + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/permission-modes.mdx b/site/src/content/cards/zh/concepts/permission-modes.mdx new file mode 100644 index 0000000..0bce972 --- /dev/null +++ b/site/src/content/cards/zh/concepts/permission-modes.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 权限模式 +titleAlt: Permission Modes +tagline: 六模式自主度谱 · auto 分类器 · bypassPermissions 核选项 +refs: + - concepts/harness-engineering + - concepts/guardrails + - concepts/agent-sandboxing +sourceLine: Anthropic Claude Code Permissions 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PERMISSION MODES · Claude Code · 自主度-安全性权衡 + + + +

权限模式

+

Permission Modes — 全局审批策略开关,决定工具调用的默认处理方式

+
+ + + 权限模式设定 agent 的"底色"——在此基础上叠加具体 allow/ask/deny 规则。六种模式从最保守到最激进形成自主度谱系。核心原则:deny-first 语义在所有模式下均成立。 + + + +
+
模式行为适用场景
+
dontAsk自动拒绝,仅预授权工具高安全,最小权限面
+
default首次使用时提示确认日常开发
+
plan只读分析,不可修改执行方案制定 / 代码审查
+
acceptEdits自动接受文件编辑信任文件修改场景
+
auto分类器自动验证操作意图受信任的自动化
+
bypassPermissions跳过大部分提示OS 级隔离容器(危险)
+
+
+ 读取 autoMode 配置(environment/allow/soft_deny);allow/soft_deny 替换全部默认规则 + 即使 bypass 模式,.git/.claude/.vscode 仍触发提示——防损坏 repo 状态 + 托管设置可禁用 bypassPermissions / auto 模式——作用域层次典型用例 +
+
+ + +
+ → Harness Engineering · Guardrails · Agent Sandboxing + Anthropic Claude Code (2024) +
+
+ + From ea36da48902a2c3cd0689782fb93e7cb757faf10 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:49:55 +0800 Subject: [PATCH 29/48] =?UTF-8?q?feat(cards):=20batch=207/18=20=E2=80=94?= =?UTF-8?q?=20concepts/permission-rules-hierarchy=E2=86=92reliability-deca?= =?UTF-8?q?y=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../concepts/permission-rules-hierarchy.mdx | 70 ++++++++++++++++ .../cards/zh/concepts/pets-vs-cattle.mdx | 67 ++++++++++++++++ .../zh/concepts/physical-symbol-system.mdx | 67 ++++++++++++++++ .../zh/concepts/possible-world-semantics.mdx | 72 +++++++++++++++++ .../content/cards/zh/concepts/preemption.mdx | 72 +++++++++++++++++ .../cards/zh/concepts/prefix-caching.mdx | 72 +++++++++++++++++ .../zh/concepts/probabilistic-causation.mdx | 73 +++++++++++++++++ .../zh/concepts/probability-of-causation.mdx | 79 ++++++++++++++++++ .../cards/zh/concepts/probing-classifiers.mdx | 67 ++++++++++++++++ .../cards/zh/concepts/problem-space.mdx | 74 +++++++++++++++++ .../cards/zh/concepts/process-theories.mdx | 80 +++++++++++++++++++ .../cards/zh/concepts/prompt-chaining.mdx | 76 ++++++++++++++++++ .../zh/concepts/propositional-fixation.mdx | 73 +++++++++++++++++ .../cards/zh/concepts/regularity-theory.mdx | 66 +++++++++++++++ .../cards/zh/concepts/reliability-decay.mdx | 70 ++++++++++++++++ 15 files changed, 1078 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/permission-rules-hierarchy.mdx create mode 100644 site/src/content/cards/zh/concepts/pets-vs-cattle.mdx create mode 100644 site/src/content/cards/zh/concepts/physical-symbol-system.mdx create mode 100644 site/src/content/cards/zh/concepts/possible-world-semantics.mdx create mode 100644 site/src/content/cards/zh/concepts/preemption.mdx create mode 100644 site/src/content/cards/zh/concepts/prefix-caching.mdx create mode 100644 site/src/content/cards/zh/concepts/probabilistic-causation.mdx create mode 100644 site/src/content/cards/zh/concepts/probability-of-causation.mdx create mode 100644 site/src/content/cards/zh/concepts/probing-classifiers.mdx create mode 100644 site/src/content/cards/zh/concepts/problem-space.mdx create mode 100644 site/src/content/cards/zh/concepts/process-theories.mdx create mode 100644 site/src/content/cards/zh/concepts/prompt-chaining.mdx create mode 100644 site/src/content/cards/zh/concepts/propositional-fixation.mdx create mode 100644 site/src/content/cards/zh/concepts/regularity-theory.mdx create mode 100644 site/src/content/cards/zh/concepts/reliability-decay.mdx diff --git a/site/src/content/cards/zh/concepts/permission-rules-hierarchy.mdx b/site/src/content/cards/zh/concepts/permission-rules-hierarchy.mdx new file mode 100644 index 0000000..047edd5 --- /dev/null +++ b/site/src/content/cards/zh/concepts/permission-rules-hierarchy.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Allow/Ask/Deny 规则层次 +titleAlt: Permission Rules Hierarchy +tagline: Deny-First 语义 · 评估顺序固定 · 跨层级不可覆盖 +refs: + - concepts/permission-modes + - concepts/claude-code-permission-system + - concepts/guardrails +sourceLine: Anthropic Claude Code Permissions 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PERMISSION RULES HIERARCHY · Deny-First · 工具审批机制 + + + +

Allow/Ask/Deny 规则层次

+

Deny-First 语义 — 第一个匹配的规则类别胜出,Deny 始终最先检查

+
+ + + 评估顺序固定:Deny → Ask → Allow → 默认。不是"最高优先级 wins",而是"第一个类别匹配 wins"。即使 Allow 规则排在 Deny 之前,Deny 仍先被检查。跨层级 Deny 无法被任何 Allow 覆盖。 + + + +
+ 评估流程 +
1Deny?匹配 → 阻止,终止(不可被覆盖)
+
2Ask?匹配 → 弹出确认提示,终止
+
3Allow?匹配 → 直接允许,终止
+
4默认取决于当前 Permission Mode
+
+
+ Deny-First 的三项安全保证 + 任何作用域(包括托管设置)的 Deny 无法被其他层的 Allow 覆盖 + PreToolUse hook exit 2(阻止)在规则评估之前运行,Allow 规则不能绕过 + 组织 Deny 不受命令行 --allowedTools 影响 +
+ 复杂参数级 Deny(如选项顺序变化、管道)应优先使用 PreToolUse Hooks 实现 +
+ + +
+ → Permission Modes · Permission System · Guardrails + Anthropic Claude Code (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/pets-vs-cattle.mdx b/site/src/content/cards/zh/concepts/pets-vs-cattle.mdx new file mode 100644 index 0000000..58125f8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/pets-vs-cattle.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 宠物与牲畜 +titleAlt: Pets vs Cattle +tagline: 可处置性 · 组件独立故障恢复 · 脑-手解耦使 Cattle 化成为可能 +refs: + - concepts/meta-harness + - concepts/agent-sandboxing + - concepts/reliability-decay +sourceLine: Randy Bias 2011 Cloud Computing +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PETS VS CATTLE · 基础设施模式 → Agent 架构模式 + + + +

宠物与牲畜

+

Pets vs Cattle — 可处置性是核心:组件可随时销毁替换 = 牲畜

+
+ + + 宠物:不可失去的唯一个体,故障需要特殊处理。牲畜:可随时替换的群体成员,故障只需换一个。Randy Bias(2011)从基础设施推广到 agent 架构:组件可处置性 = 故障不传播为系统故障。 + + + +
+ Agent 组件:宠物 vs 牲畜 +
场景宠物模式(单容器)牲畜模式(解耦)
+
Sandbox 故障session 丢失,无法恢复provision 新容器,session 继续
+
Harness 故障调试需进入用户数据容器wake(sessionId) 从外部恢复
+
故障隔离所有故障表现统一可定位具体故障层
+
隐私宠物容器含用户数据凭证隔离,只替换出问题的组件
+
+
+ 前提条件 + Meta-Harness 将认知层(Session)与执行层(Sandbox)分离是 Cattle 化的前提 + Session 必须独立持久化,不与 Harness/Sandbox 同生共死 +
+
+ + +
+ → Meta-Harness · Agent Sandboxing · Reliability Decay + Randy Bias (2011) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/physical-symbol-system.mdx b/site/src/content/cards/zh/concepts/physical-symbol-system.mdx new file mode 100644 index 0000000..ed37ca0 --- /dev/null +++ b/site/src/content/cards/zh/concepts/physical-symbol-system.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 物理符号系统假说 +titleAlt: Physical Symbol System Hypothesis +tagline: Newell & Simon 1976 · 通用智能充要条件 · GOFAI 理论基础 +refs: + - concepts/heuristic-search + - concepts/problem-space + - concepts/neurosymbolic-ai +sourceLine: Newell & Simon 1976 Computer Science as Empirical Inquiry +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PHYSICAL SYMBOL SYSTEM · PSSH · Newell & Simon 1976 + + + +

物理符号系统假说

+

PSSH — 物理符号系统是通用智能行为的充分必要条件

+
+ + + 物理符号系统 = 操纵符号结构(创建/修改/复制/销毁)的物理实体。两关键属性:指称(表达式与对象建立关系)+ 解释(执行被指称的过程)。PSSH:所有通用智能系统必然是物理符号系统,反之足以产生智能。 + + + +
+ 符号系统概念的五阶段进化 +
1形式逻辑(19c末)弗雷格/罗素:符号 = 无意义标记
+
2图灵机(1930s)机器可计算性,奠定物理实现基础
+
3存储程序(1940s)程序即数据,解释原理成为物理现实
+
4表处理(1956)引入真正的指称——数据结构可指称结构
+
5LISP(1959)形式化 S 表达式,与具体机器解耦
+
+
+ 核心挑战 + 纯形式符号如何在内部建立真实语义意义——PSSH 最根本的哲学挑战 + 联结主义无法保证系统性——但为 LLM 实证(Othello / 线性表征)重新开放 + 神经符号 AI 是融合两派的主流:PSSH 实现层 vs 联结主义计算基底 +
+
+ + +
+ → Heuristic Search · Problem Space · Neurosymbolic AI + Newell & Simon (1976) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/possible-world-semantics.mdx b/site/src/content/cards/zh/concepts/possible-world-semantics.mdx new file mode 100644 index 0000000..850d40a --- /dev/null +++ b/site/src/content/cards/zh/concepts/possible-world-semantics.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 可能世界语义学 +titleAlt: Possible World Semantics +tagline: 最接近世界 · 比较相似性 · 非回溯解释 · Lewis 1973 +refs: + - concepts/counterfactual-theory + - concepts/interventionist-theory + - concepts/ladder-of-causation +sourceLine: Lewis 1973 Counterfactuals +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · POSSIBLE WORLD SEMANTICS · Lewis 1973 · 反事实真值条件 + + + +

可能世界语义学

+

Possible World Semantics — 在最接近实际世界的 A 为真的世界中,C 为真

+
+ + + 反事实条件句「如果 A,则 C」为真,当且仅当:某个 A∧C 为真的世界比任何 A∧¬C 的世界更接近实际世界。接近度 = 比较相似性,由自然律匹配 + 特定事实匹配的多维权衡决定。Lewis 1973。 + + + +
+ 相似性权衡规则(Lewis) +
高权重保持自然律相似:奇迹(违背自然律)越少越接近
+
中权重大面积事实匹配:与实际世界共享更大时空区域完全匹配
+
权衡可用一个局部小奇迹换取大面积事实匹配,不能用多个大奇迹
+
+
+ 可能世界语义 vs 干预语义 +
维度可能世界(Lewis)干预语义(Pearl)
+
评估方式寻找最接近的可能世界因果模型手术干预
+
固定什么最相似的事实配置因果独立于前件的变量
+
先占处理晚期先占困难路径冻结技术可处理
+
+
+ + +
+ → Counterfactual Theory · Interventionist Theory · Ladder of Causation + Lewis (1973) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/preemption.mdx b/site/src/content/cards/zh/concepts/preemption.mdx new file mode 100644 index 0000000..ec35c22 --- /dev/null +++ b/site/src/content/cards/zh/concepts/preemption.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 先占 +titleAlt: Preemption +tagline: 早期 · 晚期 · 凌驾 · 反事实理论的核心测试场 +refs: + - concepts/counterfactual-theory + - concepts/process-theories + - concepts/causal-models +sourceLine: Hall 2004 Two Concepts of Causation · Schaffer 2000 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PREEMPTION · 先占三类型 · 因果理论测试场 + + + +

先占

+

Preemption — 有备用原因存在时,实际原因仍先占了效果的产生

+
+ + + 先占直接证明:原因不必是结果的必要条件(即使 c 不发生,e 仍会发生)。这对反事实理论构成挑战。三种类型:早期(备用链提前切断)、晚期(被先跑完成)、凌驾(备用过程完整但被凌驾)。 + + + +
+
+
早期先占 Early反事实可处理
+ 备用因果链在结果前被切断。Suzy 留在家(Billy 告诉她他来做),Billy 砸了窗。反事实理论可处理:d 不发生时 e 确实不发生。 +
+
+
晚期先占 Late反事实困难
+ Billy 和 Suzy 同时扔石头,Suzy 先到打碎瓶子,Billy 石头飞过原位置。Lewis 1973 策略失败:瓶子破碎不反事实依赖 Suzy 的扔石。结构方程框架:冻结 BH=0 可处理。 +
+
+
凌驾先占 TrumpingLewis 极困难
+ Merlin 早咒 + Morgana 晚咒;魔法法则规定第一个生效。Morgana 咒语完整但被凌驾。过程理论天然处理,反事实理论需要"影响"版本(Lewis 2000)。 +
+
+ 从 c 到 e 存在完整因果过程 vs 备用 b 的过程被中断——先占是过程理论的强项 +
+ + +
+ → Counterfactual Theory · Process Theories · Causal Models + Hall (2004) / Schaffer (2000) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/prefix-caching.mdx b/site/src/content/cards/zh/concepts/prefix-caching.mdx new file mode 100644 index 0000000..a79ae57 --- /dev/null +++ b/site/src/content/cards/zh/concepts/prefix-caching.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 前缀缓存 +titleAlt: Prefix Caching +tagline: KV Cache 复用 · 10× 成本差距 · 静态前缀稳定优先 · Compaction 对立 +refs: + - concepts/context-management + - concepts/harness-engineering + - concepts/context-compression +sourceLine: Anthropic / OpenAI / Kimi Prefix Caching Docs 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PREFIX CACHING · Agent 成本杠杆 · Prefill 复用 + + + +

前缀缓存

+

Prefix Caching — 共享前缀时复用 KV 张量,跳过重复 Prefill 计算

+
+ + + Agent loop 的 prefill/decode 比约 100:1,前缀缓存命中率直接决定成本。以 Claude Sonnet 为例:未缓存 $3.00/MTok,缓存命中 $0.30/MTok——10× 差距。从 0 到 80% 命中率可使每任务 API 成本降低约 8×。 + + + +
+ Harness 缓存友好布局 +
+ 静态区域(全局缓存) + 工具定义(完整集,从不变动)· 核心系统提示 · 固定知识库 +
+
--- DYNAMIC BOUNDARY ---
+
+ 动态区域(不缓存) + 项目特定配置 · 当前 git 状态 · 对话历史(增长) +
+
+
+ 三项跨厂商共识 + 工具/系统提示放最前,跨请求逐字节一致,不含任何动态内容 + 摘要/压缩修改对话历史前缀 → cache miss。Manus 方案:文件系统外部化替代 compaction + Anthropic:隐式后端亲和;OpenAI:prompt_cache_key;Kimi:x-session-affinity header +
+
+ + +
+ → Context Management · Harness Engineering · Context Compression + Anthropic / OpenAI / Kimi (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/probabilistic-causation.mdx b/site/src/content/cards/zh/concepts/probabilistic-causation.mdx new file mode 100644 index 0000000..de47b3e --- /dev/null +++ b/site/src/content/cards/zh/concepts/probabilistic-causation.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 概率因果 +titleAlt: Probabilistic Causation +tagline: 概率提升 · 净效应与路径效应 · 先占挑战 +refs: + - concepts/counterfactual-theory + - concepts/preemption + - concepts/regularity-theory +sourceLine: Suppes 1970 · Eells 1991 · Hitchcock 2001 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROBABILISTIC CAUSATION · 概率提升 · 不确定世界的因果 + + + +

概率因果

+

Probabilistic Causation — 原因使结果更可能发生:P(E|C) > P(E|¬C)

+
+ + + 因果关系的核心在于概率提升:C 导致 E 当且仅当 C 提高了 E 的概率。允许因果在不确定性下运作,不要求原因必然导致结果。Suppes(1970)系统化,Eells(1991)精炼,Hitchcock(2001)引入路径效应。 + + + +
+ 净效应 vs 路径特异效应(Hitchcock) +
+ 净效应 Net Effect + 考虑所有路径后的总体效果——避孕药对血栓的净效应可以为零(预防怀孕路径抵消直接促进路径) +
+
+ 路径特异效应 + 沿特定因果路径的效果——避孕药直接促进血栓的分量效应仍为正 +
+
+
+ 主要挑战 +
先占有备用原因时,实际原因可能不提高概率,但直觉上仍是原因
+
概率降低的原因{"高尔夫球击中树反弹入洞——击中树降低了进洞概率,但树是原因(Schaffer 2000)"}
+
Simpson 悖论不同子群体中概率提升方向可以逆转——需控制适当背景变量
+
+
+ + +
+ → Counterfactual Theory · Preemption · Regularity Theory + Suppes (1970) / Eells (1991) / Hitchcock (2001) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/probability-of-causation.mdx b/site/src/content/cards/zh/concepts/probability-of-causation.mdx new file mode 100644 index 0000000..2c4c57a --- /dev/null +++ b/site/src/content/cards/zh/concepts/probability-of-causation.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 因果概率 +titleAlt: Probability of Causation +tagline: PN · PS · PNS · but-for 法律标准 · 单调性识别 +refs: + - concepts/ladder-of-causation + - concepts/counterfactual-theory + - concepts/structural-causal-model +sourceLine: Pearl 2009 Causality Chapter 9 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROBABILITY OF CAUSATION · PN/PS/PNS · 反事实可操作化 + + + +

因果概率

+

Probability of Causation — 事件已发生后,某因素"是否是"原因的概率

+
+ + + 因果概率回答"效果的原因"类问题:这个药导致了我的病吗?三种形式:PN(必然性概率,对应法律 but-for 检验)、PS(充分性概率)、PNS(必然且充分概率)。Pearl 证明在单调性假设下可从数据识别。 + + + +
+ 三种因果概率 +
+ PN + 必然性概率 Necessity + {"P(Y_{x'} = y' | X=x, Y=y) — 若非 X,Y 是否非 y?法律 but-for 检验"} +
+
+ PS + 充分性概率 Sufficiency + {"P(Y_x = y | X=x', Y=y') — 若有 X,Y 是否为 y?"} +
+
+ PNS + 必然且充分 Both + 同一个体:因 X 得 Y,且因非 X 免 Y——最强因果形式 +
+
+
+ 识别条件 + Y_1(u) ≥ Y_0(u) 对所有个体成立时 PN 可完全识别 + 实验+观测数据组合下,即使每种单独看不到因果,PN 下界可达 1 + PN 必须调用反事实——无法从观测或干预实验单独回答 +
+
+ + +
+ → Ladder of Causation · Counterfactual Theory · Structural Causal Model + Pearl (2009) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/probing-classifiers.mdx b/site/src/content/cards/zh/concepts/probing-classifiers.mdx new file mode 100644 index 0000000..3be670f --- /dev/null +++ b/site/src/content/cards/zh/concepts/probing-classifiers.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 探针分类器 +titleAlt: Probing Classifiers +tagline: 线性/非线性探针 · 高性能 ≠ 模型使用 · 因果验证必要 +refs: + - concepts/linear-representation-hypothesis + - concepts/mechanistic-interpretability + - concepts/othello-world-model-hypothesis +sourceLine: Belinkov 2022 Probing Classifiers Review +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROBING CLASSIFIERS · 内部表征检测 · 方法论局限 + + + +

探针分类器

+

Probing Classifiers — 不修改模型参数,用简单分类器检测内部是否编码了特定信息

+
+ + + 固定预训练模型 → 提取某层激活 → 训练简单探针(线性/MLP)→ 评估测试集性能。高性能意味着该层编码了目标属性。核心方法论争议:探针高性能 ≠ 模型"使用"了该信息。 + + + +
+ 三类探针 +
线性探针验证线性表征假说,效率高,可解释无法捕捉非线性编码
+
非线性探针(MLP)更强能力上限,作为对照高性能可能反映探针自身建模能力
+
稀疏探针定位单个神经元,可解释性强覆盖范围受限
+
+
+ 从相关到因果的验证升级 + 块排除测试:排除某类数据后探针是否仍泛化 = 模型学到几何结构而非记忆 + 消融或定向激活干预——验证神经元对模型输出的因果效应,不止于相关性 + 标注坐标系(绝对颜色 vs 相对颜色)可以翻转线性探针的结论——探针高度依赖标注方案 +
+
+ + +
+ → Linear Repr. Hypothesis · Mechanistic Interpretability · Othello World Model + Belinkov (2022) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/problem-space.mdx b/site/src/content/cards/zh/concepts/problem-space.mdx new file mode 100644 index 0000000..8b781cd --- /dev/null +++ b/site/src/content/cards/zh/concepts/problem-space.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 问题空间 +titleAlt: Problem Space +tagline: 状态-算子-目标 · 表示决定难度 · Newell & Simon 1976 +refs: + - concepts/heuristic-search + - concepts/means-ends-analysis + - concepts/physical-symbol-system +sourceLine: Newell & Simon 1976 Computer Science as Empirical Inquiry +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROBLEM SPACE · 求解 = 路径搜索 · Newell & Simon 1976 + + + +

问题空间

+

Problem Space — 求解问题 = 在状态空间中找到从初始状态到目标状态的路径

+
+ + + {"问题存在是因为:我们知道测试(目标是什么)但不能直接产生满足测试的结构。四要素:初始状态 + 目标状态 + 移动算子 + 状态空间。关键洞见:同一问题在不同表示下难度差异巨大——表示变换是元级搜索。"} + + + +
+ 表示决定难度——残缺棋盘问题 +
+ 位置空间 + 天文数量排列组合 + 无法求解 +
+
+ 颜色奇偶空间 + 一步推断 + 立即可知不可能 +
+
+
+ 当代 AI 中的问题空间 + 中间步骤 = 在问题空间中显式标记当前位置,使模型利用空间结构信息 + 编排器-工作者 = 显式问题空间分解——将任务拆为子问题并行或串行求解 + 问题空间路径依赖:早期错误在后续步骤被放大——深度搜索的固有风险 + 自回归生成 = 隐式符号空间中的单步搜索,无显式回溯 +
+
+ + +
+ → Heuristic Search · Means-Ends Analysis · Physical Symbol System + Newell & Simon (1976) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/process-theories.mdx b/site/src/content/cards/zh/concepts/process-theories.mdx new file mode 100644 index 0000000..539f208 --- /dev/null +++ b/site/src/content/cards/zh/concepts/process-theories.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 过程理论 +titleAlt: Process Theories of Causation +tagline: 守恒量传递 · 因果过程 vs 伪过程 · 先占强项 · 预防盲区 +refs: + - concepts/preemption + - concepts/counterfactual-theory + - concepts/regularity-theory +sourceLine: Salmon 1984 · Dowe 2000 Physical Causation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROCESS THEORIES · Salmon 1984 · Dowe 2000 · 守恒量因果 + + + +

过程理论

+

Process Theories — 因果 = 物理过程连接:能量/动量/守恒量在世界线间的传递

+
+ + + Salmon(1984):因果过程可以传递标记(marks),伪过程不能——运动的球 vs 移动的影子。Dowe(2000)守恒量理论:因果过程是具有守恒量(能量、动量、电荷)的世界线,因果交互是守恒量在交叉世界线间的交换。 + + + +
+ 优势与盲区 +
+
+ 优势 +
+ 先占案例:c→e 有完整过程,备用 b→e 的过程被中断 + 凌驾先占:Merlin 的咒语存在因果过程,Morgana 的没有 +
+
+
+ 盲区 +
+ 预防:Bond 射下导弹使 Blofield 存活——两者无物理过程连接 + 双重预防:弹弓释放锁扣——复杂的双重预防结构 +
+
+
+
+
+ Hall(2004):两个概念的因果 + 物理过程连接——过程理论的强项:处理先占 + 反事实依赖——反事实理论的强项:处理预防和缺席 + 两个概念有时重合,有时分离——无法用单一理论统一 +
+
+ + +
+ → Preemption · Counterfactual Theory · Regularity Theory + Salmon (1984) / Dowe (2000) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/prompt-chaining.mdx b/site/src/content/cards/zh/concepts/prompt-chaining.mdx new file mode 100644 index 0000000..6a3c0a9 --- /dev/null +++ b/site/src/content/cards/zh/concepts/prompt-chaining.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 提示链 +titleAlt: Prompt Chaining +tagline: 顺序步骤 · Gate 检查 · 用延迟换准确率 · 最简单 Workflow 模式 +refs: + - concepts/agentic-systems + - concepts/routing + - concepts/orchestrator-workers +sourceLine: Anthropic Building Effective Agents 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROMPT CHAINING · 线性 Workflow · Agentic Systems + + + +

提示链

+

Prompt Chaining — 将任务分解为顺序步骤,每步 LLM 调用处理上一步输出

+
+ + + Agentic 系统中最简单的 Workflow 模式。任务能干净地分解为固定顺序子任务时使用。本质是用延迟换准确率——让每次 LLM 调用面对更简单、更专注的子任务。可在中间步骤加入程序化 Gate 检查。 + + + +
+ 典型用例 +
+
生成营销文案(英文)
+
+
翻译为目标语言
+
+
+
写文档大纲
+
+
Gate 检查
+
+
基于大纲写文档
+
+
+
+ 在 Agentic Workflow 中的定位 + 子任务固定且有序,无需动态决策分支 + Routing 需要根据输入选择路径;Prompt Chaining 路径固定 + Chaining 是线性串行;Orchestrator-Workers 是动态分解并行 + 中间程序化检查防止错误向后传播——早期失败比晚期失败代价更小 +
+
+ + +
+ → Agentic Systems · Routing · Orchestrator-Workers + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/propositional-fixation.mdx b/site/src/content/cards/zh/concepts/propositional-fixation.mdx new file mode 100644 index 0000000..74b1fa8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/propositional-fixation.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 命题固着 +titleAlt: Propositional Fixation +tagline: McCarthy 神经网络局限 · 有限一阶逻辑 · 全称量化天花板 +refs: + - concepts/neurosymbolic-ai + - concepts/neurosymbolic-ai-taxonomy + - concepts/constrained-decoding +sourceLine: McCarthy 引用于 Garcez & Lamb 2023 Neurosymbolic AI +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · PROPOSITIONAL FIXATION · McCarthy · 神经网络逻辑局限 + + + +

命题固着

+

Propositional Fixation — 神经网络无法表示完整一阶逻辑或高阶逻辑

+
+ + + McCarthy 的诊断:神经网络的根本局限不是实现细节,而是计算结构决定的。分布式连续表示无法实现任意深度的递归绑定和量化——这是神经符号集成的核心理论动机。 + + + +
+ 神经网络的逻辑可达范围 +
+ 可表示 + 命题逻辑 · 非单调逻辑程序 · 命题模态逻辑 · 一阶逻辑有限片段 +
+
+ 不可表示 + 完整一阶逻辑(含函数符号、无限量化链) · 高阶逻辑 +
+
+
+ 工程含义 + 学习"祖先"关系(任意深度递归)需要符号推理层,纯神经无法外推 + 学到的规则是命题级(接地的),无法组合外推到新变量 + LTN / Logic Tensor Networks:逻辑陈述转为损失约束——近似而非精确 + 神经符号混合:精确推理交给符号层(Type 3–6),神经层负责感知/学习 +
+
+ + +
+ → Neurosymbolic AI · NSAI Taxonomy · Constrained Decoding + McCarthy / Garcez & Lamb (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/regularity-theory.mdx b/site/src/content/cards/zh/concepts/regularity-theory.mdx new file mode 100644 index 0000000..c9c0321 --- /dev/null +++ b/site/src/content/cards/zh/concepts/regularity-theory.mdx @@ -0,0 +1,66 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 规则性理论 +titleAlt: Regularity Theory of Causation +tagline: 休谟传统 · 恒常连结 · INUS 条件 · 当代演进 +refs: + - concepts/constant-conjunction + - concepts/inus-conditions + - concepts/necessary-connection +sourceLine: Hume 1739 · Mackie 1965 · Baumgartner 2013 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · REGULARITY THEORY · 休谟传统 · 因果 = 恒常连结 + + + +

规则性理论

+

Regularity Theory — 因果 = 事件类型间的恒常连接,拒绝因果力与必然联系

+
+ + + 休谟传统:因果不是隐秘力量,是可观察的规律模式。三要素:时间先后 + 时空邻近 + 恒常连结(C 类总伴随 E 类)。标志性立场:拒绝任何形而上学厚实的必然联系。类型因果优先——个例因果通过类型因果获得成立条件。 + + + +
+ 四阶段理论演进 +
休谟原版(HRT)三条件:邻近 + 先后 + 恒常连结;两优势:无实质形而上学 + 解释因果发现
+
Mill(MRT)精炼:因果需"总体性"条件 + 规律须是自然法则(最佳系统法则观)
+
Mackie INUS(1965)原因 = INUS 条件;突破严格恒常连结要求;引入因果场与最小充分条件簇
+
Baumgartner(2013)永久非冗余性 + 活跃因果路径;可处理先占和过决定
+
+
+ 个例因果(一次性事件)· 虚假因果(共因联合效应)· 因果方向 + 推断性因果理论:用推断关系替代规律瞬例化,保留核心精神并克服个例因果难题 +
+
+ + +
+ → Constant Conjunction · INUS Conditions · Necessary Connection + Hume (1739) / Mackie (1965) / Baumgartner (2013) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/reliability-decay.mdx b/site/src/content/cards/zh/concepts/reliability-decay.mdx new file mode 100644 index 0000000..60fc2c8 --- /dev/null +++ b/site/src/content/cards/zh/concepts/reliability-decay.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 可靠性衰减 +titleAlt: Reliability Decay +tagline: 超线性衰减 · 错误正相关 · 领域 > 模型大小 · RDC 斜率定量任务分解收益 +refs: + - concepts/long-running-agents + - concepts/error-cascade + - concepts/harness-engineering +sourceLine: arXiv 2603.29231 Beyond Pass@1 Reliability Framework +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · RELIABILITY DECAY · 超线性衰减 · Agent 任务长度挑战 + + + +

可靠性衰减

+

Reliability Decay — Agent 成功率随任务复杂度增加而超线性下降

+
+ + + 不是"任务越难越容易失败"的平凡观察。衰减是超线性的——比独立错误假设预测的更快。根因:步间错误正相关(ρ > 0)——agent 一旦走上错误路径,倾向于在错误中持续,不会自发纠正。 + + + +
+ 领域分层衰减(Beyond Pass@1 数据) +
领域短任务 GDS超长任务 GDS衰减幅度
+
SE 代码编辑0.900.44-0.46 ★
+
WR 网络调研0.800.63-0.17
+
DP 文档处理0.740.71-0.03
+
+
+ 多步依赖严格——代码每步必须与前后一致,错误级联传播 + RDC 斜率越陡,分解回报越大:Qwen3 30B 的分解增益高达 41.5pp + 短任务 pass@1 不能预测长任务可靠性——必须在目标时长档上直接测量 +
+
+ + +
+ → Long-Running Agents · Error Cascade · Harness Engineering + arXiv:2603.29231 +
+
+ + From dd5007eec33c8519c25e9a8b588ec090d025f836 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 18:57:30 +0800 Subject: [PATCH 30/48] =?UTF-8?q?feat(cards):=20batch=208/18=20=E2=80=94?= =?UTF-8?q?=20concepts/reliability-surface=E2=86=92subconceptual-level=20(?= =?UTF-8?q?15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/concepts/reliability-surface.mdx | 84 +++++++++++++++++ .../cards/zh/concepts/repl-for-agents.mdx | 67 +++++++++++++ .../cards/zh/concepts/richardson-effect.mdx | 68 ++++++++++++++ .../src/content/cards/zh/concepts/routing.mdx | 93 +++++++++++++++++++ .../cards/zh/concepts/rule-circularity.mdx | 69 ++++++++++++++ .../cards/zh/concepts/scaling-laws.mdx | 70 ++++++++++++++ .../zh/concepts/settings-scope-hierarchy.mdx | 70 ++++++++++++++ .../cards/zh/concepts/software-3-0.mdx | 80 ++++++++++++++++ .../concepts/software-evolution-benchmark.mdx | 66 +++++++++++++ .../concepts/spatiotemporal-world-model.mdx | 84 +++++++++++++++++ .../zh/concepts/ssm-hybrid-architecture.mdx | 70 ++++++++++++++ .../concepts/statistical-self-similarity.mdx | 77 +++++++++++++++ .../zh/concepts/structural-causal-model.mdx | 79 ++++++++++++++++ .../cards/zh/concepts/structured-outputs.mdx | 68 ++++++++++++++ .../cards/zh/concepts/subconceptual-level.mdx | 80 ++++++++++++++++ 15 files changed, 1125 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/reliability-surface.mdx create mode 100644 site/src/content/cards/zh/concepts/repl-for-agents.mdx create mode 100644 site/src/content/cards/zh/concepts/richardson-effect.mdx create mode 100644 site/src/content/cards/zh/concepts/routing.mdx create mode 100644 site/src/content/cards/zh/concepts/rule-circularity.mdx create mode 100644 site/src/content/cards/zh/concepts/scaling-laws.mdx create mode 100644 site/src/content/cards/zh/concepts/settings-scope-hierarchy.mdx create mode 100644 site/src/content/cards/zh/concepts/software-3-0.mdx create mode 100644 site/src/content/cards/zh/concepts/software-evolution-benchmark.mdx create mode 100644 site/src/content/cards/zh/concepts/spatiotemporal-world-model.mdx create mode 100644 site/src/content/cards/zh/concepts/ssm-hybrid-architecture.mdx create mode 100644 site/src/content/cards/zh/concepts/statistical-self-similarity.mdx create mode 100644 site/src/content/cards/zh/concepts/structural-causal-model.mdx create mode 100644 site/src/content/cards/zh/concepts/structured-outputs.mdx create mode 100644 site/src/content/cards/zh/concepts/subconceptual-level.mdx diff --git a/site/src/content/cards/zh/concepts/reliability-surface.mdx b/site/src/content/cards/zh/concepts/reliability-surface.mdx new file mode 100644 index 0000000..445cd9c --- /dev/null +++ b/site/src/content/cards/zh/concepts/reliability-surface.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 可靠性曲面 +titleAlt: Reliability Surface +tagline: 三维评估 · k 一致性 · ε 鲁棒性 · λ 容错性 · pass@1 不够用 +refs: + - concepts/reliability-decay + - concepts/error-cascade + - concepts/harness-engineering +sourceLine: arXiv 2601.06112 ReliabilityBench 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · RELIABILITY SURFACE · R(k,ε,λ) · Agent 生产就绪评估 + + + +

可靠性曲面

+

Reliability Surface — 把单一 pass@1 拓展为三维"地形图"

+
+ + + {"pass@1 只量了血压,可靠性曲面是全身体检。三维:k(同一任务重复 k 次全部成功概率)、ε(语义等价扰动下的成功率)、λ(基础设施故障下的成功率)。曲面越平坦、越高 = 越适合生产部署。"} + + + +
+ 三个维度 +
+ k — 一致性 + 同一任务重复 k 次,全部成功的概率(pass^k) + k=2 时即可暴露非确定性失败 +
+
+ ε — 鲁棒性 + 语义等价但语法不同的扰动后成功率 + prompt 措辞不同应该不影响结果 +
+
+ λ — 容错性 + 超时/限流/数据异常等基础设施故障下的成功率 + 生产环境不可避免的故障 +
+
+
+ ReliabilityBench 实证(1280 episodes) +
Baseline (ε=0, λ=0)96.88%
+
扰动 ε=0.288.12% (-8.76pp)
+
故障 λ=0.291.0% (-5.88pp)
+
双重压力84.0% (-12.88pp ≠ 两者之和)
+
+
+ + +
+ → Reliability Decay · Error Cascade · Harness Engineering + arXiv:2601.06112 (2026) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/repl-for-agents.mdx b/site/src/content/cards/zh/concepts/repl-for-agents.mdx new file mode 100644 index 0000000..0a1ac7c --- /dev/null +++ b/site/src/content/cards/zh/concepts/repl-for-agents.mdx @@ -0,0 +1,67 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Agent 的 REPL +titleAlt: REPL for Agents +tagline: 驻留进程状态 · Undo 一等原语 · 双模式 · vs Subcommand vs MCP +refs: + - concepts/implicit-loop-architecture + - concepts/tool-design + - concepts/context-management +sourceLine: CLI-Anything HARNESS.md +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · REPL FOR AGENTS · 有状态工作台 · 驻留进程模式 + + + +

Agent 的 REPL

+

REPL for Agents — 进入持有状态的会话,上下文累积,连续操作无需重启

+
+ + + Subcommand 模式每次调用都付启动成本(进程、文件 I/O、序列化)。REPL 模式:状态驻留内存,agent 进入会话后操作近乎免费。适用于强状态工作流(图像编辑/代码迭代)、需要 Undo/Redo 的探索场景。 + + + +
+ 三种接口模式对比 +
维度SubcommandREPLMCP Tool
+
状态外部化(文件)驻留进程驻留 server
+
启动开销每次调用都付一次进入一次连接
+
适合场景单步、脚本化多步、试错跨进程、权限管理
+
+
+ REPL 设计四原则 + 裸命令进 REPL,有参数做单次调用——同一二进制服务两种场景 + 启动打印 banner:软件名 + SKILL.md 绝对路径 + 当前会话状态 + {"[gimp:poster.xcf *] > — 项目 + 修改标记 + undo 栈,无需单独 status 查询"} + 退出时 dump JSON session file,下次启动 load 回来——兼顾效率与持久性 +
+
+ + +
+ → Implicit Loop Architecture · Tool Design · Context Management + CLI-Anything HARNESS.md +
+
+ + diff --git a/site/src/content/cards/zh/concepts/richardson-effect.mdx b/site/src/content/cards/zh/concepts/richardson-effect.mdx new file mode 100644 index 0000000..e0d20c6 --- /dev/null +++ b/site/src/content/cards/zh/concepts/richardson-effect.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Richardson 效应 +titleAlt: Richardson Effect +tagline: 尺子越短 · 边界越长 · 趋零发散 · 分形维数的经验来源 +refs: + - concepts/coastline-paradox + - concepts/fractal-dimension + - concepts/statistical-self-similarity +sourceLine: Richardson 1951 · Mandelbrot 1967 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · RICHARDSON EFFECT · 测量悖论 · 分形几何经验基础 + + + +

Richardson 效应

+

Richardson Effect — 测量单位越短,不规则边界的测得长度越长

+
+ + + Richardson(约 1951 年)发现葡萄牙与西班牙报告的共同边界长度相差 23%(987 km vs 1214 km)。根因:两国使用了不同长度的"尺子"。更出人意料:某些边界在测量单位趋近零时,总长度趋向无穷——与欧氏几何预期完全相反。 + + + +
+ 直觉:沿海岸线行走 +
100 km 步幅切过许多小海湾和海角——路程短
+
1 km 步幅绕进小海湾——路程更长
+
1 m 步幅绕过每块岩石——路程更长
+
每次缩短步幅不是"更准确"——而是在测量一条更长的路线
+
+
+ Mandelbrot 形式化 + {"L(ε) ~ F·ε^(1-D) — 其中 D 即分形维数(Hausdorff 维数的非整数形式)"} + D 越大于 1,边界越"曲折",发散越快;D=1 为可求长曲线 + Richardson 效应是曲线不可求长的测量层面指纹 +
+
+ + +
+ → Coastline Paradox · Fractal Dimension · Statistical Self-Similarity + Richardson (1951) / Mandelbrot (1967) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/routing.mdx b/site/src/content/cards/zh/concepts/routing.mdx new file mode 100644 index 0000000..ae4e71e --- /dev/null +++ b/site/src/content/cards/zh/concepts/routing.mdx @@ -0,0 +1,93 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 路由 +titleAlt: Routing +tagline: 分类后导向专用流程 · 关注点分离 · 模型选择 · 客服分流 +refs: + - concepts/agentic-systems + - concepts/prompt-chaining + - concepts/orchestrator-workers +sourceLine: Anthropic Building Effective Agents 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · ROUTING · 分类 + 导向专用流程 · Agentic Workflow + + + +

路由

+

Routing — 对输入分类,然后导向专门化的后续处理流程

+
+ + + 路由实现关注点分离:不同类型的输入由不同的专用 prompt 或模型处理,避免为一类输入优化时损害其他类型的表现。分类可以由 LLM 或传统分类器完成。适用场景:任务有明确类别划分且分类可准确完成。 + + + +
+ 典型用例 +
+ 客服系统路由 +
+ 一般问题 + + FAQ 处理流程 +
+
+ 退款请求 + + 退款专用 prompt + 权限 +
+
+ 技术支持 + + 技术知识库 + 工单系统 +
+
+
+ 模型选择路由 +
+ 简单问题 + + 小模型(Haiku)— 低成本 +
+
+ 复杂推理 + + 大模型(Sonnet/Opus)— 高性能 +
+
+
+
+ 在 Agentic Workflow 中的定位 + Chaining 线性串行;Routing 是分叉——相同入口,不同出口路径 + LLM 分类(灵活,可处理模糊边界)vs 传统分类器(快速,确定性强) +
+
+ + +
+ → Agentic Systems · Prompt Chaining · Orchestrator-Workers + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/rule-circularity.mdx b/site/src/content/cards/zh/concepts/rule-circularity.mdx new file mode 100644 index 0000000..e9993f9 --- /dev/null +++ b/site/src/content/cards/zh/concepts/rule-circularity.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 规则循环 +titleAlt: Rule Circularity +tagline: 用推理规则 R 辩护 R 自身 · 前提循环 vs 规则循环 · 反归纳的自我支持难题 +refs: + - concepts/induction-problem + - concepts/uniformity-principle + - concepts/meta-induction +sourceLine: Carroll 1895 · SEP Induction Problem +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · RULE CIRCULARITY · 辩护循环 · 归纳问题第二角 + + + +

规则循环

+

Rule Circularity — 使用待辩护的推理规则本身来论证该规则可靠

+
+ + + 规则循环:用推理规则 R 来论证 R 自身的可靠性。区别于前提循环(结论在前提中预设):规则循环的前提本身是真的,但推理依赖了待辩护的规则。争议焦点:规则循环是否为恶性循环? + + + +
+ 两种立场 +
+ 规则循环可接受 + 演绎也有同样问题:Lewis Carroll(1895)证明无法说服拒绝 modus ponens 的人去用 modus ponens。基础性推理规则无处可退——"能合理要求的全部就是它认可自身"(Lange 2011) +
+
+ 规则循环有严重困难 + 反归纳规则(CI:多数 A 是 B → 多数 A 不是 B)也可以自我辩护!如果归纳可以规则循环辩护,坏规则同样可以——这大大削弱了辩护力度 +
+
+
+ 两种回应策略 + 回避归纳来回避规则循环——科学只需证伪,不需要归纳辩护 + 在元层面引入独立辩护——wMI 的可靠性可以不依赖归纳规则本身来证明 +
+
+ + +
+ → Induction Problem · Uniformity Principle · Meta-Induction + Carroll (1895) / SEP +
+
+ + diff --git a/site/src/content/cards/zh/concepts/scaling-laws.mdx b/site/src/content/cards/zh/concepts/scaling-laws.mdx new file mode 100644 index 0000000..32ca3b3 --- /dev/null +++ b/site/src/content/cards/zh/concepts/scaling-laws.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 缩放定律 +titleAlt: Scaling Laws +tagline: N×D 可预测 · 无饱和迹象 · Gold Rush 理论基础 · 多步误差级联抵消 +refs: + - concepts/llm-training-pipeline + - concepts/error-cascade + - concepts/bitter-lesson +sourceLine: Karpathy 2023 Intro to Large Language Models +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SCALING LAWS · 参数×数据 = 可预测性能 · Karpathy 2023 + + + +

缩放定律

+

Scaling Laws — LLM 性能是参数量和训练数据量的可预测、平滑函数

+
+ + + 在对数尺度上,性能近似线性随 N(参数量)和 D(数据量)增长,且目前未见饱和。两个关键特性:可预测性(给定 N 和 D 可以极高置信度预测精度)+ 无饱和(截至 2023 更大 = 更好)。算法进步是锦上添花,不是必要条件。 + + + +
+ Gold Rush 的理论基础 +
+ 缩放定律 → 性能提升 = 工程投入(非研究突破)→ GPU 集群军备竞赛 +
+
+ 现实推论 + 不需要等待理论突破——买更大的集群,准备更多数据,性能自然增长 +
+
+
+ 与相邻概念的关系 + 缩放定律对应 LLM 生态中的"摩尔定律"——算力的可预测增长驱动整个生态演进 + 单步性能随 scale 提升,但多步 agent 任务中的误差级联可能抵消收益 + 规模而非洞察——缩放定律是苦涩教训在训练阶段的精确量化 + 缩放定律的预测力依赖特定分布假设——分布外任务可能不遵循同一规律 +
+
+ + +
+ → LLM Training Pipeline · Error Cascade · Bitter Lesson + Karpathy (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/settings-scope-hierarchy.mdx b/site/src/content/cards/zh/concepts/settings-scope-hierarchy.mdx new file mode 100644 index 0000000..085b6d0 --- /dev/null +++ b/site/src/content/cards/zh/concepts/settings-scope-hierarchy.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 设置作用域层次 +titleAlt: Settings Scope Hierarchy +tagline: 五级优先级 · 托管设置不可覆盖 · Deny 跨层封锁 · auto 模式特殊规则 +refs: + - concepts/permission-modes + - concepts/permission-rules-hierarchy + - concepts/claude-code-permission-system +sourceLine: Anthropic Claude Code Permissions 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SETTINGS SCOPE HIERARCHY · 五级优先级 · 安全边界架构 + + + +

设置作用域层次

+

Settings Scope Hierarchy — 五级优先级决定哪个配置源生效

+
+ + + 任意层级的 deny 不可被低优先级的 allow 覆盖。五级从高到低:托管设置(MDM/OS)→ 命令行参数 → 本地项目(.local.json)→ 共享项目(checked-in)→ 用户全局设置。普通设置高优先级覆盖低优先级,Deny 不服从这个规则。 + + + +
+
1托管设置 ManagedMDM/OS 策略最高,不可覆盖
+
2命令行参数--allowedTools 等临时会话覆盖
+
3本地项目设置.claude/settings.local.jsongitignored,个人开发
+
4共享项目设置.claude/settings.jsonchecked-in,团队共享
+
5用户全局设置~/.claude/settings.json个人默认
+
+
+ 特殊规则 + 分类器不读取共享项目设置(防止被 compromise 的 repo 注入恶意 allow 规则) + allowManagedPermissionRulesOnly 等——只在托管层生效,其他层设置无效 +
+
+ + +
+ → Permission Modes · Permission Rules Hierarchy · Permission System + Anthropic Claude Code (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/software-3-0.mdx b/site/src/content/cards/zh/concepts/software-3-0.mdx new file mode 100644 index 0000000..21cb7e7 --- /dev/null +++ b/site/src/content/cards/zh/concepts/software-3-0.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Software 3.0 +titleAlt: Software 3.0 +tagline: Prompt 即程序 · 自然语言编程 · 三代范式 · Karpathy 2025 +refs: + - concepts/llm-os + - concepts/context-engineering + - concepts/agentic-systems +sourceLine: Karpathy 2025 YC Talk Software Is Changing Again +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SOFTWARE 3.0 · Karpathy 2025 · 自然语言 = 编程语言 + + + +

Software 3.0

+

Software 3.0 — LLM 不再是固定功能神经网络,而是可编程的通用计算机

+
+ + + Karpathy 的三代软件分类法。关键转变:1.0 人写代码 → 2.0 数据+优化器写权重 → 3.0 自然语言 prompt 是程序,LLM 是处理器。每个人都成为程序员——5-10 年专业训练不再是门槛。 + + + +
+ 三代软件范式 +
+ Software 1.0 + 人类编写代码 + 传统计算机执行 +
+
+ Software 2.0 + 数据 + 优化器 → 神经网络权重 + 固定功能网络推理 +
+
+ Software 3.0 + 自然语言 Prompt + 可编程 LLM 执行 +
+
+
+ 核心含义 + 2.0 逐渐吃掉 1.0(Tesla Autopilot C++ → 神经网络);3.0 正在吃掉 1.0/2.0 + 如果 Prompt 是程序,Context Engineering 就是 Software 3.0 的软件工程 + Software 3.0 程序(prompt)与外部世界的标准化接口 + 每人都是程序员——描述意图即可,无需精通语法 +
+
+ + +
+ → LLM OS · Context Engineering · Agentic Systems + Karpathy (2025) YC Talk +
+
+ + diff --git a/site/src/content/cards/zh/concepts/software-evolution-benchmark.mdx b/site/src/content/cards/zh/concepts/software-evolution-benchmark.mdx new file mode 100644 index 0000000..e7a9a4c --- /dev/null +++ b/site/src/content/cards/zh/concepts/software-evolution-benchmark.mdx @@ -0,0 +1,66 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 软件演进基准 +titleAlt: Software Evolution Benchmark +tagline: SWE-EVO · 单步 72.8% → 多步 ~20% · Release Notes 输入 · 误差级联暴露 +refs: + - concepts/error-cascade + - concepts/long-running-agents + - concepts/harness-engineering +sourceLine: arXiv 2512.18470 SWE-EVO +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SOFTWARE EVOLUTION BENCHMARK · SWE-EVO · 多步演进评估 + + + +

软件演进基准

+

Software Evolution Benchmark — 评估 Agent 在多步长 horizon 软件演进任务上的表现

+
+ + + 传统单 issue 修复基准(SWE-Bench)的盲区:无法预测多步演进能力。SWE-EVO 证明 GPT-5.2 单步修复 72.8%,多步演进降至约 20%——这个差距无法从单步基准预测。真实软件工程 80% 是维护和演进,不是单 bug 修复。 + + + +
+ SWE-Bench vs SWE-EVO +
维度SWE-BenchSWE-EVO
+
输入单个 GitHub issueRelease notes(多条需求)
+
改动范围通常 1-2 个文件平均 21 个文件
+
测试规模几个 FAIL→PASS平均 874 个测试
+
评估方式二值(全过/不过)二值 + Fix Rate
+
+
+ 对 Harness 设计的启示 + 指令遵循——需求分解和澄清机制比提升模型能力更重要 + GLM-5 在 SWE-agent 37.5% vs OpenHands 8.33%——harness-model 匹配度是关键变量 +
+
+ + +
+ → Error Cascade · Long-Running Agents · Harness Engineering + arXiv:2512.18470 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/spatiotemporal-world-model.mdx b/site/src/content/cards/zh/concepts/spatiotemporal-world-model.mdx new file mode 100644 index 0000000..ccbb59e --- /dev/null +++ b/site/src/content/cards/zh/concepts/spatiotemporal-world-model.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 时空世界模型 +titleAlt: Spatiotemporal World Model +tagline: Gurnee & Tegmark 2024 · R²=0.91/0.84 · 线性探针 · 涌现空间+时间表征 +refs: + - concepts/othello-world-model-hypothesis + - concepts/probing-classifiers + - concepts/mechanistic-interpretability +sourceLine: Gurnee & Tegmark ICLR 2024 arXiv:2310.02207 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SPATIOTEMPORAL WORLD MODEL · Gurnee & Tegmark 2024 · 线性探针证据 + + + +

时空世界模型

+

Spatiotemporal World Model — LLM 自发涌现出线性可解码的空间与时间表征

+
+ + + Gurnee & Tegmark(ICLR 2024)对 Llama-2 系列的研究证明:无监督训练的 LLM 内部自发形成了地理空间和历史时间的线性表征。线性探针在城市坐标任务上 R²=0.911,在历史事件时间上 R²=0.835。这直接反驳了"随机鹦鹉"假说——模型不只是在复制 token 序列,而是构建了真实的世界结构模型。 + + + +
+ 关键实验证据 +
+
+ R² = 0.911 + 空间任务 + 城市地理坐标线性探针 +
+
+ R² = 0.835 + 时间任务 + 历史事件时间线性探针 +
+
+
+ 因果干预验证 + 激活空间/时间神经元 → 模型输出的地点/时间信息相应偏移。探针不只是相关,而是因果。 +
+
+
+ 对 AI 系统设计的含义 + 统计模式匹配无法解释线性可分的高 R² 世界表征——内部结构是真实的 + Othello 棋局表征(Li 2022)→ 地理+时间表征(Gurnee 2024):越来越大的任务域 + 线性探针仅检测线性可解码性——更复杂的非线性表征可能未被捕捉 + 13B/70B 上均发现相同模式,但其他架构的泛化性仍需验证 +
+
+ + +
+ → Othello World Model · Probing Classifiers · Mechanistic Interpretability + Gurnee & Tegmark (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/ssm-hybrid-architecture.mdx b/site/src/content/cards/zh/concepts/ssm-hybrid-architecture.mdx new file mode 100644 index 0000000..46cd242 --- /dev/null +++ b/site/src/content/cards/zh/concepts/ssm-hybrid-architecture.mdx @@ -0,0 +1,70 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: SSM 混合架构 +titleAlt: SSM Hybrid Architecture +tagline: Mamba-3 · Jamba 1/8注意力 · 线性复杂度 · 长上下文代理推理优化 +refs: + - concepts/long-running-agents + - concepts/harness-engineering + - concepts/prefix-caching +sourceLine: Mamba-3 2025 · Jamba AI21 Labs 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SSM HYBRID ARCHITECTURE · Mamba-3 · Jamba · 推理优先设计 + + + +

SSM 混合架构

+

SSM Hybrid Architecture — 状态空间模型与 Transformer 融合,解决长上下文线性复杂度问题

+
+ + + 纯 Transformer 在长上下文下计算复杂度是 O(n²),成为 agent 任务的硬瓶颈。SSM 混合架构用选择性状态空间模型(Mamba)替换大部分注意力层,保留少量注意力层维持全局推理能力。Jamba 架构:1/8 注意力层 + 7/8 Mamba 层 + MoE,实现 256K token 上下文、线性复杂度、更低推理延迟。 + + + +
+ Jamba 架构解剖 +
组件比例作用
+
Mamba 层7/8线性复杂度序列建模,长程依赖压缩
+
Attention 层1/8全局推理,精确 token 定位
+
MoE 层稀疏激活52B 参数 / 12B 活跃,推理效率
+
上下文窗口256K tokens实用长文档/代码库 agent 任务
+
+
+ 对 Agent 设计的含义 + 推理阶段比 Transformer 快 2-8× ——适合高频调用的 harness 场景 + SSM 状态是固定大小的循环缓冲区,不随长度增长——降低显存压力 + 256K 窗口使单次 pass 处理大型代码库成为可能,减少 chunking 复杂度 + 训练效率仍低于纯 Transformer;精确检索任务中 attention 层仍然关键 +
+
+ + +
+ → Long-Running Agents · Harness Engineering · Prefix Caching + Mamba-3 (2025) · Jamba (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/statistical-self-similarity.mdx b/site/src/content/cards/zh/concepts/statistical-self-similarity.mdx new file mode 100644 index 0000000..670bc39 --- /dev/null +++ b/site/src/content/cards/zh/concepts/statistical-self-similarity.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 统计自相似性 +titleAlt: Statistical Self-Similarity +tagline: 自然界分形 · 统计属性跨尺度恒定 · Richardson 效应基础 · 严格 vs 统计 +refs: + - concepts/richardson-effect + - concepts/fractal-dimension + - concepts/scale-free-networks +sourceLine: Mandelbrot 1967 · Richardson 1961 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · STATISTICAL SELF-SIMILARITY · 跨尺度统计不变性 · Mandelbrot 1967 + + + +

统计自相似性

+

Statistical Self-Similarity — 自然界对象在不同观测尺度下保持相同的统计属性

+
+ + + 统计自相似性:在不同尺度下,对象的统计属性(方差、分布形状、幂律指数)保持恒定——而非每个细节完全相同(严格自相似)。海岸线、云朵、血管树、地震序列都是例子。这是 Richardson 海岸线悖论的理论基础:测量尺度缩小,长度无限增长,因为每个尺度都露出新的相似结构。 + + + +
+ 严格 vs 统计自相似 +
+
+ 严格自相似 + Koch 雪花 · Sierpinski 三角 + 放大任意倍后与原图完全一致。数学构造,自然界几乎不存在。 +
+
+ 统计自相似 + 海岸线 · 山脉轮廓 · 湍流 + 放大后细节不同,但幂律分布、分形维数等统计量保持不变。 +
+
+
+
+ 连接桥梁 + 测量尺度 ε 缩小 → 海岸线长度 L(ε) 幂律增长,指数即分形维数 D + 统计自相似 → 引出分形维数概念 → 为"非整数维"提供严格定义 + 流体湍流的能量谱、金融价格波动、语言词频——幂律背后往往是统计自相似 + 传感器分辨率提升不会停止发现新信息——这是精度边际收益递减的几何基础 +
+
+ + +
+ → Richardson Effect · Fractal Dimension · Scale-Free Networks + Mandelbrot (1967) / Richardson (1961) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/structural-causal-model.mdx b/site/src/content/cards/zh/concepts/structural-causal-model.mdx new file mode 100644 index 0000000..eb820ce --- /dev/null +++ b/site/src/content/cards/zh/concepts/structural-causal-model.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 结构因果模型 +titleAlt: Structural Causal Model +tagline: SCM ⟨U,V,E⟩ · 三阶梯统一框架 · 结构方程 ≠ 回归 · Pearl 2010 元框架 +refs: + - concepts/causal-dag + - concepts/do-calculus + - concepts/probability-of-causation +sourceLine: Pearl 2010 Causality 2nd Ed · arXiv:1304.1108 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · STRUCTURAL CAUSAL MODEL · ⟨U,V,E⟩ · 三阶梯统一 · Pearl 2010 + + + +

结构因果模型

+

Structural Causal Model — 用结构方程系统统一关联/干预/反事实三层因果推断

+
+ + + SCM 是因果推断的元框架,由三元组 ⟨U, V, E⟩ 定义:U 是外生(背景)变量集合,V 是内生变量集合,E 是结构方程集合(每个 Vi 都有一个方程 fi 决定其值)。关键:结构方程描述"生成机制",不是统计回归——它在干预下保持不变(模块性),而回归系数在干预下会改变。 + + + +
+ 三阶梯在 SCM 中的统一 +
+ L1 关联 + P(Y=y | X=x) + 观测数据 + 图读取 +
+
+ L2 干预 + P(Y=y | do(X=x)) + 截断方程 + do-calculus +
+
+ L3 反事实 + P(Yx=y | X=x', Y=y') + 孪生网络 + 外生变量固定 +
+
+
+ 关键区分 + fi(xi, ui) 描述机制,干预时只切断对应方程;回归系数是全局统计量,干预下失效 + SCM 用 DAG 表达定性因果结构,方程提供定量机制——两者相互补充 + 统一了 6 个独立因果传统:RCT、路径分析、图模型、反事实、决策理论、流行病学 +
+
+ + +
+ → Causal DAG · Do-Calculus · Probability of Causation + Pearl (2010) Causality 2nd Ed +
+
+ + diff --git a/site/src/content/cards/zh/concepts/structured-outputs.mdx b/site/src/content/cards/zh/concepts/structured-outputs.mdx new file mode 100644 index 0000000..68c8d15 --- /dev/null +++ b/site/src/content/cards/zh/concepts/structured-outputs.mdx @@ -0,0 +1,68 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 结构化输出 +titleAlt: Structured Outputs +tagline: Schema→CFG→Token 掩码 · JSON mode vs Structured 11.97%→0.1% · 轨迹偏差隐性代价 +refs: + - concepts/harness-engineering + - concepts/context-engineering + - concepts/prompt-chaining +sourceLine: Anthropic Claude Structured Outputs · OpenAI Structured Outputs 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · STRUCTURED OUTPUTS · Schema→CFG · 格式强制 · 轨迹偏差 + + + +

结构化输出

+

Structured Outputs — 通过 JSON Schema + CFG 强制模型输出符合格式,但有隐性代价

+
+ + + 结构化输出的实现链路:JSON Schema → 上下文无关文法(CFG)→ token 掩码(只允许当前合法的 token)。效果显著:OpenAI 数据显示 JSON mode 的格式错误率 11.97%,Structured Outputs 降至 0.1%。但隐性代价是"轨迹偏差"——强制格式会改变模型的推理路径,可能降低任务准确性。格式正确 ≠ 答案正确。 + + + +
+ JSON mode vs Structured Outputs +
方式格式错误率机制局限
+
JSON mode11.97%提示词约束模型自由发挥格式
+
Structured Outputs0.1%Schema→CFG token 掩码轨迹偏差
+
+
+ 隐性代价与工程原则 + 强制格式约束推理路径——某些任务中,自由文本的准确率反而更高 + 固定 Schema 触发服务端缓存,重复使用同一 Schema 可降低延迟 + 先自由推理,最后一步用工具/结构化提取——分离推理与格式化 + 工具调用/API 对接才用 Structured Outputs;人类阅读输出不需要强制格式 +
+
+ + +
+ → Harness Engineering · Context Engineering · Prompt Chaining + Anthropic / OpenAI (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/subconceptual-level.mdx b/site/src/content/cards/zh/concepts/subconceptual-level.mdx new file mode 100644 index 0000000..2083508 --- /dev/null +++ b/site/src/content/cards/zh/concepts/subconceptual-level.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 亚概念层 +titleAlt: Subconceptual Level +tagline: Smolensky 1988 · 微特征 · 三层框架 · 神经-符号中间层 · 分布式表征 +refs: + - concepts/neurosymbolic-ai + - concepts/physical-symbol-system + - concepts/mechanistic-interpretability +sourceLine: Smolensky 1988 On the Proper Treatment of Connectionism +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SUBCONCEPTUAL LEVEL · Smolensky 1988 · 微特征 · 分布式表征 + + + +

亚概念层

+

Subconceptual Level — 神经激活与符号概念之间的中间层,由微特征的分布式激活模式构成

+
+ + + Smolensky(1988)提出三层框架:神经层(单个激活)→ 亚概念层(微特征的分布模式)→ 符号层(高层概念/规则)。亚概念层的关键特性:微特征是上下文敏感的——"咖啡杯"的微特征在"空杯子"和"装满咖啡的杯子"语境中不同,无法用固定符号枚举。这是连接主义优于符号主义处理语境的核心论点。 + + + +
+ 三层架构 +
+ 神经层 + 单个神经元激活值 + 直接可观测,无语义 +
+
+ 亚概念层 ★ + 微特征分布激活模式 + 上下文敏感,不可直接命名 +
+
+ 符号层 + 离散概念与规则 + 可解释,但丢失语境 +
+
+
+ 与现代 LLM 的共鸣 + LLM 中的特征向量 ≈ Smolensky 的微特征——分布式、上下文相关 + 亚概念层通过能量最小化(Harmony)达到稳定态——类比现代注意力机制 + 从神经激活中恢复亚概念层结构——SuperPosition 假说直接呼应 Smolensky + SAE 的稀疏特征 ≈ 将亚概念层表征解耦为可命名的微特征 +
+
+ + +
+ → Neurosymbolic AI · Physical Symbol System · Mechanistic Interpretability + Smolensky (1988) +
+
+ + From e6ce285e771d270fd035cb5c9d55b5016320f310 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 19:04:28 +0800 Subject: [PATCH 31/48] =?UTF-8?q?feat(cards):=20batch=209/18=20=E2=80=94?= =?UTF-8?q?=20concepts/sumeru=E2=86=92world-models=20+=20entities/aios,all?= =?UTF-8?q?en-newell,andrej-karpathy=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/concepts/sumeru-mustard-seed.mdx | 76 +++++++++++++++++ .../cards/zh/concepts/symbol-grounding.mdx | 75 ++++++++++++++++ .../zh/concepts/system-1-vs-system-2.mdx | 80 +++++++++++++++++ .../cards/zh/concepts/systematicity.mdx | 75 ++++++++++++++++ .../cards/zh/concepts/task-lifecycle.mdx | 85 +++++++++++++++++++ .../zh/concepts/teleological-explanation.mdx | 81 ++++++++++++++++++ .../zh/concepts/token-vs-type-causation.mdx | 76 +++++++++++++++++ .../content/cards/zh/concepts/tool-design.mdx | 72 ++++++++++++++++ .../cards/zh/concepts/trajectory-bias.mdx | 74 ++++++++++++++++ .../zh/concepts/uniformity-principle.mdx | 81 ++++++++++++++++++ .../concepts/virtual-context-management.mdx | 69 +++++++++++++++ .../cards/zh/concepts/world-models.mdx | 65 ++++++++++++++ site/src/content/cards/zh/entities/aios.mdx | 69 +++++++++++++++ .../cards/zh/entities/allen-newell.mdx | 85 +++++++++++++++++++ .../cards/zh/entities/andrej-karpathy.mdx | 79 +++++++++++++++++ 15 files changed, 1142 insertions(+) create mode 100644 site/src/content/cards/zh/concepts/sumeru-mustard-seed.mdx create mode 100644 site/src/content/cards/zh/concepts/symbol-grounding.mdx create mode 100644 site/src/content/cards/zh/concepts/system-1-vs-system-2.mdx create mode 100644 site/src/content/cards/zh/concepts/systematicity.mdx create mode 100644 site/src/content/cards/zh/concepts/task-lifecycle.mdx create mode 100644 site/src/content/cards/zh/concepts/teleological-explanation.mdx create mode 100644 site/src/content/cards/zh/concepts/token-vs-type-causation.mdx create mode 100644 site/src/content/cards/zh/concepts/tool-design.mdx create mode 100644 site/src/content/cards/zh/concepts/trajectory-bias.mdx create mode 100644 site/src/content/cards/zh/concepts/uniformity-principle.mdx create mode 100644 site/src/content/cards/zh/concepts/virtual-context-management.mdx create mode 100644 site/src/content/cards/zh/concepts/world-models.mdx create mode 100644 site/src/content/cards/zh/entities/aios.mdx create mode 100644 site/src/content/cards/zh/entities/allen-newell.mdx create mode 100644 site/src/content/cards/zh/entities/andrej-karpathy.mdx diff --git a/site/src/content/cards/zh/concepts/sumeru-mustard-seed.mdx b/site/src/content/cards/zh/concepts/sumeru-mustard-seed.mdx new file mode 100644 index 0000000..39d08c5 --- /dev/null +++ b/site/src/content/cards/zh/concepts/sumeru-mustard-seed.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 须弥芥子 +titleAlt: Sumeru Mustard Seed +tagline: 大小无碍 · 维摩诘经 · 华严宗 · 自相似性哲学先驱 · 布莱克/莱布尼茨共鸣 +refs: + - concepts/indra-net + - concepts/statistical-self-similarity + - concepts/compositionality +sourceLine: 维摩诘所说经·不思议品 · 华严宗 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · 须弥芥子 · 维摩诘经 · 大小无碍 · 自相似先驱 + + + +

须弥芥子

+

Sumeru Mustard Seed — 须弥山藏于芥子中,整体可无损地蕴含于部分

+
+ + + 须弥藏芥子,芥子纳须弥。出自《维摩诘所说经·不思议品》,华严宗深入发展。核心洞见:大与小不是物理尺寸的函数,而是认知框架与功能关系的产物。部分与整体之间存在同构关系——这是分形与自相似性思想的佛教哲学先驱,比曼德尔布罗特早一千年。 + + + +
+ 三重哲学洞见 +
+ 1 + 大小非固有属性 + 智常禅师:头颅如椰子却容万卷书——「容量」是关系性概念,不是物理尺寸的函数 +
+
+ 2 + 功能超越体积 + 一粒米胜过须弥山——力量由因缘(功德的累积过程)决定,而非体积 +
+
+ 3 + 认知框架决定边界 + 大与小的区分来自观察者的认知框架,而非被观察物的内在属性 +
+
+
+ 跨文化汇聚 + 「To see a world in a grain of sand」——英国诗学与佛教哲学独立汇聚于同一结构洞见 + 每个单子映射整个宇宙——西方形而上学对部分-整体同构的平行表达 + 无限宝珠互相映照——须弥芥子原理的网络化精确表达,每节点映射全局 +
+
+ + +
+ → Indra's Net · Statistical Self-Similarity · Compositionality + 维摩诘经 / 华严经 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/symbol-grounding.mdx b/site/src/content/cards/zh/concepts/symbol-grounding.mdx new file mode 100644 index 0000000..73dea3e --- /dev/null +++ b/site/src/content/cards/zh/concepts/symbol-grounding.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 符号接地问题 +titleAlt: Symbol Grounding Problem +tagline: Harnad 1990 · 字典循环 · 中文房间 · 三种解决路径 · LLM 部分接地争议 +refs: + - concepts/physical-symbol-system + - concepts/neurosymbolic-ai + - concepts/spatiotemporal-world-model +sourceLine: Harnad 1990 Physica D · Searle 1980 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SYMBOL GROUNDING · Harnad 1990 · 中文房间 · LLM 部分接地 + + + +

符号接地问题

+

Symbol Grounding Problem — 纯符号系统如何建立符号与外部现实的真实联系

+
+ + + Harnad(1990):形式符号系统中,符号意义来自与其他符号的关系——一个无出口的循环。字典里每个词用其他词解释,最终没有任何词"接地"于现实。中文房间(Searle 1980)是类比:操纵符号的系统可通过图灵测试,但没有真正理解。这是对物理符号系统假说最根本的哲学挑战。 + + + +
+ 三种解决路径 +
+ 感知-动作接地 + 将符号与感知输入+动作输出直接连接。Brooks 的具身机器人——「世界是自己最好的模型」,无需内部符号表示。 +
+
+ 统计语义接地 + 通过大规模共现数据让词义在统计关系中涌现。LLM 的路径——词向量捕获语义关系,但争议:这是真正接地还是更复杂的符号间关系? +
+
+ 神经符号混合 + 神经网络提供感知接地,符号层提供组合性+可解释性。神经符号 AI 的核心动机。 +
+
+
+ LLM 接地争议 + LLM 从文本学习,没有物理世界的直接感知经验,谈不上接地 + 时空世界模型(R²=0.91)表明 LLM 自发推断出真实世界结构——某种接地的迹象 + 符号约束(JSON Schema)改变联结推理路径——符号-神经接口处的接地摩擦 +
+
+ + +
+ → Physical Symbol System · Neurosymbolic AI · Spatiotemporal World Model + Harnad (1990) / Searle (1980) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/system-1-vs-system-2.mdx b/site/src/content/cards/zh/concepts/system-1-vs-system-2.mdx new file mode 100644 index 0000000..f99ee3b --- /dev/null +++ b/site/src/content/cards/zh/concepts/system-1-vs-system-2.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 系统一与系统二 +titleAlt: System 1 vs System 2 +tagline: Kahneman · Karpathy 2023 LLM 只有 System 1 · CoT/o1 是工程化 System 2 · 非二分告诫 +refs: + - concepts/meta-cognition-ai + - concepts/evaluator-optimizer + - concepts/neurosymbolic-ai-taxonomy +sourceLine: Kahneman 2011 · Karpathy 2023 Intro to LLMs +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SYSTEM 1 VS SYSTEM 2 · Karpathy 2023 · LLM 快慢思考 · 推理时间分配 + + + +

系统一与系统二

+

System 1 vs System 2 — 快思考/慢思考框架与 LLM 推理能力的对应分析

+
+ + + Karpathy(2023)的核心判断:LLM 只有 System 1——每次 token 生成消耗的计算量大致相同(一次前向传播),无论问题简单还是复杂。「铁路上的列车,chunk chunk chunk」。LLM 没有「停下来认真想想」的能力——这是 CoT、Tree-of-Thoughts、o1/o3 系列出现的架构动机。 + + + +
+ 两个系统的对比 +
+
+ System 1 + 快速 · 直觉 · 自动 + 「2+2=?」→ 答案直接可用 + 当前 LLM:每 token 固定计算量 +
+
+ System 2 + 缓慢 · 理性 · 有意识 + 「17×24=?」→ 分步推导 + 目标:按需分配推理时间 +
+
+
+
+ 工程化 System 2 的路径 + 「展示思考过程」→ 在 token 序列中为推理留出空间 + 显式分配更多推理时间给困难问题——Karpathy 2023 的预言实现 + S1/S2 不是独立神经基底,是认知捷径。字面工程化为两个系统可能误读框架 + 神经符号 AI 的终极目标——神经引擎内部能触发符号推理 = S1 集成 S2 +
+
+ + +
+ → Meta-Cognition AI · Evaluator-Optimizer · Neurosymbolic AI Taxonomy + Kahneman (2011) / Karpathy (2023) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/systematicity.mdx b/site/src/content/cards/zh/concepts/systematicity.mdx new file mode 100644 index 0000000..78a87c3 --- /dev/null +++ b/site/src/content/cards/zh/concepts/systematicity.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 认知系统性 +titleAlt: Systematicity +tagline: Fodor & Pylyshyn 1988 · 非偶然的能力关联 · 联结主义的核心挑战 · LLM 实证验证 +refs: + - concepts/compositionality + - concepts/physical-symbol-system + - concepts/neurosymbolic-ai +sourceLine: Fodor & Pylyshyn 1988 Cognition · Dhar & Søgaard 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · SYSTEMATICITY · Fodor & Pylyshyn 1988 · 能力必然关联 · 架构决定性试验 + + + +

认知系统性

+

Systematicity — 认知能力在结构上必然关联:能理解 P 者,必然能理解 P 的结构邻项

+
+ + + 能理解「John loves Mary」的人,必然能理解「Mary loves John」——不是因为任务难度,而是拥有相关概念在构成上就足以赋予这种能力。Fodor & Pylyshyn(1988):「任何使系统性成为偶然的架构,都是错误的架构。」这把球抛给联结主义:若神经网络处理结构变体是训练的偶然结果,该架构就无法解释人类认知。 + + + +
+ 两种架构的解释能力 +
+ 符号系统 + 「John loves Mary」的心理表征包含可分离的 JOHN/LOVES/MARY 成分,组合性自动保证系统性 + 结构保证 +
+
+ 标准联结主义 + 「John loves Mary」的分布式表征不必然包含可分离成分——能否处理「Mary loves John」依赖权重配置 + 暴力偶然性 +
+
+
+ 40 年后的实证验证(Dhar & Søgaard 2024) + 大模型在系统性任务上表现更好,说明规模带来某种结构泛化 + RLHF 的代理目标与组合结构对齐不一致,导致系统性退化 + LLM 系统性远未达到人类认知程度,可靠性和分布外泛化仍是短板 +
+
+ + +
+ → Compositionality · Physical Symbol System · Neurosymbolic AI + Fodor & Pylyshyn (1988) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/task-lifecycle.mdx b/site/src/content/cards/zh/concepts/task-lifecycle.mdx new file mode 100644 index 0000000..e2f847b --- /dev/null +++ b/site/src/content/cards/zh/concepts/task-lifecycle.mdx @@ -0,0 +1,85 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 任务生命周期 +titleAlt: Task Lifecycle +tagline: A2A 状态机 · submitted→working→4终态 · input-required 人类介入 · 三种追踪模式 +refs: + - concepts/a2a-protocol + - concepts/long-running-agents + - concepts/context-management +sourceLine: Google A2A Protocol 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · TASK LIFECYCLE · A2A 状态机 · input-required · 三种追踪模式 + + + +

任务生命周期

+

Task Lifecycle — A2A 协议中 Task 的状态机,原生支持长时运行与人类介入

+
+ + + A2A Task 是最核心的工作单元:唯一 ID + 明确状态转移路径。提交后进入 submitted → working,然后分叉为四个终态(completed / failed / canceled / rejected)或 input-required(等待人类提供更多信息)。进入终态后不再接受新消息——对已完成 Task 发送消息返回 UnsupportedOperationError。 + + + +
+ 状态与终态 +
+
submitted
+
+
working
+
+
+
input-required
+
等待 client,人类介入
+
+
+
completed
+
failed
+
canceled
+
rejected
+
+
+
+
+
+ 三种状态追踪模式 + POST sendMessage → GET getTask 轮询 → completed 后取 artifacts。适合简单任务。 + 单向推送:TaskStatusUpdateEvent + TaskArtifactUpdateEvent → 实时进度,适合长任务。 + 注册 webhook → 断开连接 → 完成时 server 主动 POST → 适合分钟级超长任务。 +
+
+ + +
+ → A2A Protocol · Long-Running Agents · Context Management + Google A2A (2024) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/teleological-explanation.mdx b/site/src/content/cards/zh/concepts/teleological-explanation.mdx new file mode 100644 index 0000000..4450bf1 --- /dev/null +++ b/site/src/content/cards/zh/concepts/teleological-explanation.mdx @@ -0,0 +1,81 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 目的论解释 +titleAlt: Teleological Explanation +tagline: 亚里士多德 · 规律性需要解释 · 非心理学目的论 · 三因合一 · 目的因优先性 +refs: + - concepts/four-causes + - concepts/generation-verification-loop + - concepts/aristotle +sourceLine: Stanford Encyclopedia of Philosophy — Aristotle on Causality +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · TELEOLOGICAL EXPLANATION · 亚里士多德 · 目的因优先性 · 非心理学 + + + +

目的论解释

+

Teleological Explanation — 以事物的目的(telos)为核心,规律性需要解释,巧合不够

+
+ + + 亚里士多德的核心论证:牙齿的排列(前齿尖利、臼齿宽厚)规律性地有利于动物生存。如果只用质料因解释,有利对应只是巧合——但规律性的巧合需要解释。目的因被引入不是作为证明,而是对规律性的最佳解释。关键:目的论解释不依赖心理状态——铸铜像不需要工匠的欲望,只需铸铜术本身。 + + + +
+ 三因合一:自然生成中的融合 +
+ 目的因 + = + 完全发育的有机体(生成过程的终点) +
+
+ 形式因 + = + 该物种的形式规定(与目的因合一) +
+
+ 动力因 + = + 同类完全发育个体(「人生人」——在形式上与结果相同) +
+
「生成是为了实体,而非实体为了生成」— 《动物部分》I
+
+
+ 方法论延伸 + 「规律性需要解释,巧合不是解释」——任何领域中系统性有利模式都需要超越偶然的解释 + 与生成-验证循环结构对应:过程的意义由终点赋予——期望输出决定验证标准 + 目的因排除工匠欲望——可应用于自然过程而不陷入拟人化 +
+
+ + +
+ → Four Causes · Generation-Verification Loop · Aristotle + SEP — Aristotle on Causality +
+
+ + diff --git a/site/src/content/cards/zh/concepts/token-vs-type-causation.mdx b/site/src/content/cards/zh/concepts/token-vs-type-causation.mdx new file mode 100644 index 0000000..5e7dd1c --- /dev/null +++ b/site/src/content/cards/zh/concepts/token-vs-type-causation.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 个例因果与类型因果 +titleAlt: Token vs Type Causation +tagline: 2×2矩阵 · 三种关系立场 · 非对称存在案例 · 净效应vs分量效应 +refs: + - concepts/probabilistic-causation + - concepts/regularity-theory + - concepts/structural-causal-model +sourceLine: SEP Metaphysics of Causation · Lewis 1973 · Eells 1991 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · TOKEN VS TYPE CAUSATION · 个例与类型 · 常量与变量 · 2×2 分类 + + + +

个例因果与类型因果

+

Token vs Type Causation — 因果声称的基本二分,进一步与常量/变量交叉成 2×2 矩阵

+
+ + + 个例因果:「这场干旱导致了这次饥荒」——特定事件间的关系。类型因果:「疲劳驾驶导致车祸」——事件类型间的关系。二者与常量/变量的区分交叉形成完整的 2×2 矩阵:个例因果、类型因果、个例影响、类型影响。非对称性是关键:可以有无对应类型的个例因果(球撞树反弹入洞),也可以有无对应个例的类型因果(钚导致死亡——从未有人喝过)。 + + + +
+ 2×2 因果分类矩阵 +
+
+
个例(Tokens)
+
类型(Types)
+
常量(Constants)
+
个例因果
「这场干旱导致这次饥荒」
+
类型因果
「疲劳驾驶导致车祸」
+
变量(Variables)
+
个例影响
SCM 中特定赋值的效应
+
类型影响
结构方程编码的变量关系
+
+
+
+ 两者关系的三种立场 + 「吸烟导致癌症」只是说吸烟史通常是癌症的个例原因 + 个例因果之所以成立,是因为存在涵盖它的更广泛规律 + 钚案例证明:类型因果不可能是个例因果的概括,需分别分析 +
+
+ + +
+ → Probabilistic Causation · Regularity Theory · Structural Causal Model + SEP Metaphysics of Causation +
+
+ + diff --git a/site/src/content/cards/zh/concepts/tool-design.mdx b/site/src/content/cards/zh/concepts/tool-design.mdx new file mode 100644 index 0000000..c311190 --- /dev/null +++ b/site/src/content/cards/zh/concepts/tool-design.mdx @@ -0,0 +1,72 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 工具设计 +titleAlt: Tool Design +tagline: 格式选择 · 最小可行工具集 · Poka-yoke · 双模式双输出 · token 效率 +refs: + - concepts/aci + - concepts/context-engineering + - concepts/repl-for-agents +sourceLine: Anthropic Building Effective Agents · CLI-Anything +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · TOOL DESIGN · ACI 实践 · Poka-yoke · 最小可行工具集 · 双模式 + + + +

工具设计

+

Tool Design — 为 LLM agent 设计工具接口的工程实践,与 prompt 工程同等重要

+
+ + + 工具定义和规格需要与整体 prompt 同等程度的 prompt engineering。最常见的 agent 失败模式:膨胀的工具集——覆盖太多功能或导致歧义决策点。黄金原则:如果人类工程师无法确定性地说出在某情境下该用哪个工具,agent 也做不到。 + + + +
+ 核心设计原则 +
+ 格式选择 + 选择模型最容易正确生成的格式——接近训练数据中自然出现的格式,给模型足够 token 来「思考」,避免格式开销(精确行数、字符串转义) +
+
+ Poka-yoke + 通过改变参数设计让犯错更难,而不是靠提示词约束——防误设计优于警告文字 +
+
+ 最小工具集 + 精简工具集的二阶收益:减少选择歧义,同时使 context 的维护和修剪更可靠 +
+
+
+ CLI-Anything 双模式双输出模式 + 同一二进制:无参进 REPL(多步试错)/ 有参做一次性调用——同时服务人类和 agent + 内建 --json flag 切换机器可读结构和人类可读表格——无需额外 SDK + 冗余的工具输出直接消耗模型的注意力预算——返回值应尽量紧凑 +
+
+ + +
+ → ACI · Context Engineering · REPL for Agents + Anthropic / CLI-Anything +
+
+ + diff --git a/site/src/content/cards/zh/concepts/trajectory-bias.mdx b/site/src/content/cards/zh/concepts/trajectory-bias.mdx new file mode 100644 index 0000000..83259f1 --- /dev/null +++ b/site/src/content/cards/zh/concepts/trajectory-bias.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 轨迹偏差 +titleAlt: Trajectory Bias +tagline: Schall & de Melo RANLP 2025 · 约束解码累积扰动 · 格式正确≠答案正确 · CRANE 解法 +refs: + - concepts/structured-outputs + - concepts/system-1-vs-system-2 + - concepts/neurosymbolic-ai +sourceLine: Schall & de Melo RANLP 2025 · CRANE arXiv:2502.09061 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · TRAJECTORY BIAS · 约束解码语义损失 · Schall & de Melo 2025 + + + +

轨迹偏差

+

Trajectory Bias — 约束解码在 LLM 推理过程中引发的系统性语义损失

+
+ + + 约束解码在每步将违反文法的 token 概率归零后重归一化。当 JSON 格式强制要求低概率 token(如大括号、引号、逗号)时,重归一化是一次大扰动。LLM 生成是序列依赖的——跨多步重复扰动后,解码路径被系统性推向「在结构上容易保持合法的前缀」,而非语义最优路径。格式合规率不等于任务质量。 + + + +
+ 差异化影响 +
+
+ 指令微调模型 + 对话训练目标与文法约束产生摩擦——模型同时满足两个目标,代价是语义次优 token。轨迹偏差效应更强。 +
+
+ 基础模型 + 无对话内部目标,与文法约束摩擦较小,对结构约束适应更好。可预测微调后的表现。 +
+
+
+
+ 缓解策略 + 文法中保留自由文本推理区间——先完成自然推理,再输出约束格式的最终答案 + 约束条件下,模型从额外 few-shot 获益斜率更陡——需要更显式的 in-context 引导 + 仅推理时约束是根本性错位——将约束纳入训练阶段是长期方向 + 格式本身改变思考过程——这是联结主义与符号约束在 token 级交汇的紧急代价 +
+
+ + +
+ → Structured Outputs · System 1 vs 2 · Neurosymbolic AI + Schall & de Melo (RANLP 2025) +
+
+ + diff --git a/site/src/content/cards/zh/concepts/uniformity-principle.mdx b/site/src/content/cards/zh/concepts/uniformity-principle.mdx new file mode 100644 index 0000000..fec3cee --- /dev/null +++ b/site/src/content/cards/zh/concepts/uniformity-principle.mdx @@ -0,0 +1,81 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 齐一性原则 +titleAlt: Uniformity Principle +tagline: 未来将与过去相似 · 休谟二难 · 训练分布=测试分布 · 分布漂移的哲学基础 +refs: + - concepts/induction-problem + - concepts/causation-hume + - concepts/grue-problem +sourceLine: Stanford Encyclopedia of Philosophy — Problem of Induction +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · UNIFORMITY PRINCIPLE · 休谟二难 · 归纳核心预设 · 训练分布假设 + + + +

齐一性原则

+

Uniformity Principle — 「未来将与过去相似」:归纳推理的核心预设,无法被证明

+
+ + + 齐一性原则(UP)是归纳推理所预设的:「未经观察的事例将与已观察的事例相似」。休谟的二难论证:UP 既不能用演示性推理证明(其否定不构成矛盾),也不能用概率推理确立(那样会循环预设 UP 本身)。结论:没有论证可以支持 UP,归纳推理没有理性基础。 + + + +
+ 休谟二难的结构 +
+ P1 + 归纳推理 I 预设 UP +
+
+ P2a + 演示性论证无法建立 UP——自然进程改变不构成矛盾 +
+
+ P2b + 概率论证预设 UP 本身——循环 +
+
+ + 归纳推理没有理性基础(习惯是 UP 的实际来源) +
+
+
+ 与 AI 工程的映射 + 机器学习的核心假设——这就是 UP 的技术化身。分布一致时模型有效。 + UP 失效时——生产环境偏离训练分布——模型性能崩溃。这是可预期的 UP 失效。 + 长 context 中早期信息可靠性假设——假设早期 token 语义在整个 context 中保持一致 + 量词换位谬误:不同归纳推理依赖不同经验前提,没有共同的 UP +
+
+ + +
+ → Induction Problem · Causation (Hume) · Grue Problem + SEP — Problem of Induction +
+
+ + diff --git a/site/src/content/cards/zh/concepts/virtual-context-management.mdx b/site/src/content/cards/zh/concepts/virtual-context-management.mdx new file mode 100644 index 0000000..c0dd90d --- /dev/null +++ b/site/src/content/cards/zh/concepts/virtual-context-management.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 虚拟上下文管理 +titleAlt: Virtual Context Management +tagline: MemGPT · OS 虚拟内存类比 · RAM/磁盘层次 · Page fault → 记忆检索 +refs: + - concepts/context-management + - concepts/context-rot + - concepts/long-running-agents +sourceLine: Packer et al. 2023 MemGPT arXiv:2310.08560 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · VIRTUAL CONTEXT MANAGEMENT · MemGPT · OS 虚拟内存 · 层次存储 + + + +

虚拟上下文管理

+

Virtual Context Management — 借鉴 OS 虚拟内存机制扩展 LLM 上下文空间

+
+ + + MemGPT(Packer et al., 2023)的核心思想:通过在快速存储(context window)和慢速存储(外部记忆)之间智能调度,为 LLM 提供超出物理 context window 限制的「虚拟」上下文空间。OS-LLM 的直接映射:RAM → context window,磁盘 → archival memory,page fault → 函数调用(记忆检索),LLM 自身 → 虚拟内存管理器。 + + + +
+ OS-LLM 映射表 +
操作系统LLM 对应
+
RAMContext window — 直接可见,快速但有限
+
磁盘Archival/recall memory — 容量大,需显式加载
+
Page fault函数调用(memory retrieval)— 所需信息不在 context 时触发
+
虚拟内存管理器LLM 自身 — 自主决定何时读写外部存储
+
+
+ 统一 Context 策略 + 类比的边界 + 压缩 context window 内的数据,不涉及磁盘交换 + 将 context 信息持久化到外部存储——显式的 write-back 操作 + OS 换入换出不改变计算结果;LLM 的 context 变化直接影响推理质量(context rot) + 即使 context window 扩展到 1M token,context rot 的存在意味着层次化存储仍有效 +
+
+ + +
+ → Context Management · Context Rot · Long-Running Agents + MemGPT (2023) arXiv:2310.08560 +
+
+ + diff --git a/site/src/content/cards/zh/concepts/world-models.mdx b/site/src/content/cards/zh/concepts/world-models.mdx new file mode 100644 index 0000000..f4ef9dc --- /dev/null +++ b/site/src/content/cards/zh/concepts/world-models.mdx @@ -0,0 +1,65 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 世界模型 +titleAlt: World Models +tagline: LeCun AMI · 预测下一状态而非下一token · 物理推理 · LLM涌现证据链 +refs: + - concepts/othello-world-model-hypothesis + - concepts/spatiotemporal-world-model + - concepts/agentic-systems +sourceLine: LeCun AMI Labs · World Models Race 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 概念 · WORLD MODELS · LeCun AMI · 状态预测 vs Token 预测 · 涌现证据 + + + +

世界模型

+

World Models — 学习物理现实表征,预测动作后果而非下一个 token

+
+ + + LeCun:「你的心智模型,关于世界如何运转。你可以想象一系列可能采取的行动,世界模型让你预测这些行动对世界的影响。」核心能力:规划(模拟结果后再行动)、物理推理、因果理解、持久记忆。与 LLM 互补而非替代:LLM 处理语言推理和工具使用,世界模型提供物理环境理解。 + + + +
+ LLM 局限 → 世界模型的回应 +
事实幻觉无验证知识库基于物理一致性的生成
+
物理推理失败无具身经验从观察中学习物理规律
+
因果混淆模式匹配非理解动作-结果预测训练
+
+
+ LLM 内部涌现证据链 + 仅在着手序列训练 → 激活中涌现棋盘表征,跨架构余弦相似度 93-96% + Llama-2 线性探针 R²=0.911(空间)/ 0.835(时间)——世界结构的基本成分 + 表征空间预测(而非像素空间)构建原始世界模型——LeCun AMI Labs 基础 + 世界模型表征准确性 ≠ 战略深度——OthelloGPT 棋盘精确但 2-hop 规划退化 +
+
+ + +
+ → Othello World Model · Spatiotemporal World Model · Agentic Systems + LeCun AMI / World Models Race 2026 +
+
+ + diff --git a/site/src/content/cards/zh/entities/aios.mdx b/site/src/content/cards/zh/entities/aios.mdx new file mode 100644 index 0000000..caf8ba7 --- /dev/null +++ b/site/src/content/cards/zh/entities/aios.mdx @@ -0,0 +1,69 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AIOS +titleAlt: AIOS — LLM Agent Operating System +tagline: Rutgers 2024 · 六大内核模块 · LLM-OS类比最完整实现 · COLM 2025 +refs: + - concepts/llm-os-analogy + - concepts/harness-engineering + - entities/memgpt +sourceLine: Mei et al. arXiv:2403.16971 COLM 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · AIOS · Rutgers 2024 · LLM Agent 操作系统 · 六大内核模块 + + + +

AIOS

+

LLM Agent Operating System — 将传统 OS 资源管理映射到多 agent 并发场景

+
+ + + Rutgers University(Kai Mei、Yongfeng Zhang 等)开发,arXiv:2403.16971,发表于 COLM 2025。核心思想:将传统 OS 的调度、内存、存储、权限模块映射到 LLM agent 场景,为多 agent 并发提供系统级基础设施。AIOS 是 LLM-OS 类比的最完整工程实现,与 MemGPT 互补:MemGPT 聚焦单 agent 虚拟内存,AIOS 覆盖多 agent 完整内核。 + + + +
+ 六大内核模块 +
1LLM Core统一 LLM 实例接口,支持 OpenAI/Anthropic/Google/HuggingFace/vLLM/Ollama 等后端
+
2Scheduler集中式请求队列,FIFO 和 Round Robin 调度
+
3Context Manager推理中断时保存快照(文本级或 logits 级),支持精确恢复
+
4Memory Manageragent 对话历史的 RAM 管理,LRU-K 换页
+
5Storage Manager持久化存储,本地文件 + 向量数据库
+
6Access Manager基于权限组的 agent 间数据隔离
+
+
+ AIOS SDK + ReAct · Reflexion · AutoGen · Open-Interpreter · MetaGPT 等通过 adapter 接入 AIOS kernel + AIOS 代表「向下」的解决方案:将 harness 层的调度/隔离/容错职责下沉到系统层 +
+
+ + +
+ → LLM-OS Analogy · Harness Engineering · MemGPT + arXiv:2403.16971 (COLM 2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/allen-newell.mdx b/site/src/content/cards/zh/entities/allen-newell.mdx new file mode 100644 index 0000000..3df2d3d --- /dev/null +++ b/site/src/content/cards/zh/entities/allen-newell.mdx @@ -0,0 +1,85 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Allen Newell +titleAlt: Allen Newell +tagline: 1927–1992 · 图灵奖1975 · PSSH · GPS · SOAR统一认知理论 +refs: + - concepts/physical-symbol-system + - concepts/means-ends-analysis + - concepts/problem-space +sourceLine: Newell & Simon 1976 Comm ACM · Newell 1990 Unified Theories +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ALLEN NEWELL · 1927–1992 · 图灵奖 1975 · PSSH · GPS · SOAR + + + +

Allen Newell

+

美国计算机科学家与认知科学家,卡内基梅隆大学——AI 符号主义奠基人

+
+ + + Newell 与 Simon 的合作是 AI 史上持续时间最长的学术伙伴关系之一(1954–1992)。1975 年共同获 ACM 图灵奖,获奖理由涵盖:AI 奠基贡献、符号系统认知理论、表处理(List Processing)发明、以及将计算机概念化为「操纵符号结构的系统」。 + + + +
+ 核心贡献年表 +
+ 1955–56 + Logic Theorist + 首个证明数学定理的 AI 程序,证明《数学原理》前 52 条中 38 条 +
+
+ 1957 + GPS + 形式化手段-目的分析,提取跨任务域的通用问题求解机制 +
+
+ 1976 + PSSH + 图灵奖讲座:物理符号系统是通用智能行为的充分必要条件 +
+
+ 1987– + SOAR + 统一认知理论:基于问题空间的通用认知架构,整合学习/规划/决策 +
+
+
+ 在本 Wiki 中的位置 + 物理符号系统假说——AI 符号主义的最根本定性结构律 + 手段-目的分析的工程化——现代 CoT/ReAct 的历史先驱 + State-Operator 框架——AI 问题求解的通用表示 +
+
+ + +
+ → Physical Symbol System · Means-Ends Analysis · Problem Space + Newell & Simon (1976) / Newell (1990) +
+
+ + diff --git a/site/src/content/cards/zh/entities/andrej-karpathy.mdx b/site/src/content/cards/zh/entities/andrej-karpathy.mdx new file mode 100644 index 0000000..bfb31b1 --- /dev/null +++ b/site/src/content/cards/zh/entities/andrej-karpathy.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Andrej Karpathy +titleAlt: Andrej Karpathy +tagline: Tesla AI总监 · OpenAI研究员 · Eureka Labs · LLM-OS架构思想 · Software 3.0 +refs: + - concepts/llm-os-analogy + - concepts/software-3-0 + - concepts/system-1-vs-system-2 +sourceLine: Karpathy 2023 Intro to LLMs · 2025 YC AI Startup School +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ANDREJ KARPATHY · LLM-OS · Software 3.0 · 「1960s of LLMs」 + + + +

Andrej Karpathy

+

AI 研究者、教育者——前 Tesla AI 总监,前 OpenAI,Eureka Labs 创始人

+
+ + + Karpathy 是 LLM-OS 类比框架最系统的构建者,也是 Software 3.0 分类法的提出者。核心论断:「We're in the 1960s of LLMs」。他的架构思想不是修辞,而是实用的设计工具——暗示 agent 基础设施可以从数十年 OS 研究中汲取经验,但底层「硬件」的非确定性意味着不能简单照搬。 + + + +
+ 关键演讲演进 +
+ 2023-11 + Intro to LLMs + 首次系统阐述 LLM OS——LLM 作为内核进程、context window 作为 RAM。System 1 诊断。 +
+
+ 2025-06 + YC AI Startup School + Software 1.0/2.0/3.0 分类法、LLM 人灵心理学、autonomy slider、generation-verification loop +
+
+ 2026-03 + LLM = CPU 类比 + 「LLM = CPU, Agent = OS Kernel」——token vs byte, statistical vs deterministic 的根本差异 +
+
+
+ 核心设计哲学 + Iron Man 类比:现阶段造 augmentation,不是 full agent——人-AI 协作 generation-verification loop + Stochastic simulations of people——百科知识但也有幻觉、锯齿状智能、顺行性遗忘 + 小增量、具体 prompt、可审计的中间 artifact——autonomy slider 让用户掌控 +
+
+ + +
+ → LLM-OS Analogy · Software 3.0 · System 1 vs System 2 + Karpathy (2023, 2025, 2026) +
+
+ + From aa52c20f90107429b4fd9d345a9462a609cd4205 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 19:10:47 +0800 Subject: [PATCH 32/48] =?UTF-8?q?feat(cards):=20batch=2010/18=20=E2=80=94?= =?UTF-8?q?=20entities/answer-ai=E2=86=92david-lewis=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../content/cards/zh/entities/answer-ai.mdx | 58 +++++++++++++ .../content/cards/zh/entities/anthropic.mdx | 79 +++++++++++++++++ .../content/cards/zh/entities/aristotle.mdx | 79 +++++++++++++++++ .../cards/zh/entities/artur-garcez.mdx | 75 +++++++++++++++++ site/src/content/cards/zh/entities/asplos.mdx | 64 ++++++++++++++ .../cards/zh/entities/avatamsaka-sutra.mdx | 77 +++++++++++++++++ .../cards/zh/entities/benoit-mandelbrot.mdx | 79 +++++++++++++++++ site/src/content/cards/zh/entities/chroma.mdx | 59 +++++++++++++ .../cards/zh/entities/claude-agent-sdk.mdx | 73 ++++++++++++++++ .../content/cards/zh/entities/claude-code.mdx | 75 +++++++++++++++++ .../cards/zh/entities/cli-anything.mdx | 79 +++++++++++++++++ site/src/content/cards/zh/entities/codex.mdx | 79 +++++++++++++++++ .../content/cards/zh/entities/cycle-js.mdx | 75 +++++++++++++++++ .../content/cards/zh/entities/david-hume.mdx | 77 +++++++++++++++++ .../content/cards/zh/entities/david-lewis.mdx | 84 +++++++++++++++++++ 15 files changed, 1112 insertions(+) create mode 100644 site/src/content/cards/zh/entities/answer-ai.mdx create mode 100644 site/src/content/cards/zh/entities/anthropic.mdx create mode 100644 site/src/content/cards/zh/entities/aristotle.mdx create mode 100644 site/src/content/cards/zh/entities/artur-garcez.mdx create mode 100644 site/src/content/cards/zh/entities/asplos.mdx create mode 100644 site/src/content/cards/zh/entities/avatamsaka-sutra.mdx create mode 100644 site/src/content/cards/zh/entities/benoit-mandelbrot.mdx create mode 100644 site/src/content/cards/zh/entities/chroma.mdx create mode 100644 site/src/content/cards/zh/entities/claude-agent-sdk.mdx create mode 100644 site/src/content/cards/zh/entities/claude-code.mdx create mode 100644 site/src/content/cards/zh/entities/cli-anything.mdx create mode 100644 site/src/content/cards/zh/entities/codex.mdx create mode 100644 site/src/content/cards/zh/entities/cycle-js.mdx create mode 100644 site/src/content/cards/zh/entities/david-hume.mdx create mode 100644 site/src/content/cards/zh/entities/david-lewis.mdx diff --git a/site/src/content/cards/zh/entities/answer-ai.mdx b/site/src/content/cards/zh/entities/answer-ai.mdx new file mode 100644 index 0000000..c052532 --- /dev/null +++ b/site/src/content/cards/zh/entities/answer-ai.mdx @@ -0,0 +1,58 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Answer.AI +titleAlt: Answer.AI +tagline: Jeremy Howard创立 · llms.txt标准 · fast.ai生态延伸 · 开放实用AI工具 +refs: + - concepts/llms-txt + - entities/jeremy-howard +sourceLine: Answer.AI / AnswerDotAI/llms-txt +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ANSWER.AI · Jeremy Howard · llms.txt 标准 · fast.ai 生态 + + + +

Answer.AI

+

由 Jeremy Howard 创立的 AI 研究机构,聚焦开放、实用的 AI 工具和标准

+
+ + + Answer.AI 是 fast.ai 生态的延伸组织,聚焦于实用 AI 工具的研究与标准化。其最重要的输出是 llms.txt 标准——网站 LLM 友好文档约定,托管于 github.com/AnswerDotAI/llms-txt,已成为 AI 索引领域的事实规范。 + + + +
+ 主要输出 + 网站 LLM 友好文档约定——AI 爬虫和 agent 可以通过 /llms.txt 快速了解网站内容结构 + llms.txt 标准的参考实现网站,展示如何正确部署标准 + 所有 Answer.AI 和 fast.ai 软件项目默认生成各页面的 .md 版本——对齐 LLM 处理格式 +
+
+ 生态定位 + fast.ai 聚焦 AI 教育与研究;Answer.AI 聚焦实用 AI 工具标准化——两者共享 Jeremy Howard 的实用主义哲学 + AI 时代的 robots.txt——告知 LLM 哪些内容值得索引,哪些格式更易处理 +
+
+ + +
+ → llms.txt · Jeremy Howard + Answer.AI / AnswerDotAI +
+
+ + diff --git a/site/src/content/cards/zh/entities/anthropic.mdx b/site/src/content/cards/zh/entities/anthropic.mdx new file mode 100644 index 0000000..0ea87f8 --- /dev/null +++ b/site/src/content/cards/zh/entities/anthropic.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Anthropic +titleAlt: Anthropic +tagline: Claude系列 · 可解释性研究领先 · Agent SDK · MCP · Managed Agents +refs: + - entities/claude-code + - entities/claude-agent-sdk + - concepts/mechanistic-interpretability +sourceLine: Anthropic Official Docs 2024-2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ANTHROPIC · AI 安全公司 · Claude · 可解释性 · Agent 基础设施 + + + +

Anthropic

+

AI 安全公司,Claude 系列模型开发者——本项目最主要参考来源之一

+
+ + + Anthropic 是本 wiki 最主要的参考来源之一:agentic systems 的 workflows vs agents 分类、augmented LLM 基础构建块、五种 workflow 模式、ACI 设计原则、harness engineering 方法论均来自其官方文档。在 mechanistic interpretability 方面是业界领先者,MIT Technology Review 将其列为 2026 年十大突破技术。 + + + +
+ 四个核心领域 +
+ Agent 框架 + Claude Agent SDK(原 Claude Code SDK):「给 agent 一台计算机」,隐式循环架构,内建 context compaction +
+
+ 可解释性 + Circuit Tracing 归因图、Biology of a LLM(Claude 3.5 Haiku 系统性研究)、涌现内省意识——2026 MIT TR 十大突破 +
+
+ Managed Agents + brain-hands 解耦:推理与执行分离,meta-harness 概念的首个生产实现,借鉴 OS 虚拟化设计 +
+
+ 结构化输出 + grammar-constrained sampling,约束只作用于直接输出,Extended Thinking 推理区段保持自由 +
+
+
+ 旗舰模型 + 截至 2026 年旗舰,首个 Opus 级 1M token context,agent teams + adaptive thinking + Anthropic 主导的模型上下文协议——agent 工具接入的标准化接口 +
+
+ + +
+ → Claude Code · Claude Agent SDK · Mechanistic Interpretability + Anthropic Official Docs (2024-2026) +
+
+ + diff --git a/site/src/content/cards/zh/entities/aristotle.mdx b/site/src/content/cards/zh/entities/aristotle.mdx new file mode 100644 index 0000000..e7d6cac --- /dev/null +++ b/site/src/content/cards/zh/entities/aristotle.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 亚里士多德 +titleAlt: Aristotle +tagline: 公元前384-322 · 四因说 · 目的论解释 · 知识即因果知识 · 西方科学方法论奠基 +refs: + - concepts/four-causes + - concepts/teleological-explanation + - entities/herbert-simon +sourceLine: SEP — Aristotle on Causality (2006/2023) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · 亚里士多德 · 公元前 384-322 · 四因说 · 目的论解释奠基 + + + +

亚里士多德

+

Aristotle(公元前 384–322)——西方科学方法论奠基人,因果性理论创建者

+
+ + + 亚里士多德之前的自然哲学家缺乏对因果性本身的系统理论。亚里士多德的比喻:他们像没有拳击技术的拳手,偶尔能打出好拳,但全靠运气。核心方法论原则:「我们认为只有在掌握了事物的原因时才拥有对它的知识」——知识就是因果知识,理解就是能回答「为什么」。 + + + +
+ 关键文本与贡献 +
+ 《物理学》II 3 / 《形而上学》V 2 + 四因的一般性阐述(质料因/形式因/动力因/目的因) +
+
+ 《物理学》II 8 + 目的论解释的辩护——规律性需要解释,巧合不够 +
+
+ 《物理学》II 9 + 假设必然性——调和质料因与目的因 +
+
+ 《动物部分》I + 目的因对动力因的解释优先性,「人生人」论证 +
+
+
+ 方法论遗产 + 目的因排除工匠的欲望——目的论解释可应用于自然过程,不陷入拟人化 + 识别四种不可还原的解释类型,将因果性从实践工具提升为理论框架 + 两者都提供复杂系统解释框架——Simon 按结构分解,亚里士多德按解释角色分解 +
+
+ + +
+ → Four Causes · Teleological Explanation · Herbert Simon + SEP — Aristotle on Causality +
+
+ + diff --git a/site/src/content/cards/zh/entities/artur-garcez.mdx b/site/src/content/cards/zh/entities/artur-garcez.mdx new file mode 100644 index 0000000..add3cfc --- /dev/null +++ b/site/src/content/cards/zh/entities/artur-garcez.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Artur d'Avila Garcez +titleAlt: Artur d'Avila Garcez +tagline: City University London · 神经符号计算 · Kautz分类法 · XAI忠实性批判 · 第三浪潮 +refs: + - concepts/neurosymbolic-ai + - concepts/neurosymbolic-ai-taxonomy + - concepts/knowledge-extraction-fidelity +sourceLine: Garcez & Lamb 2023 Neurosymbolic AI The 3rd Wave arXiv:2012.05876 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ARTUR GARCEZ · City University London · 神经符号第三浪潮 + + + +

Artur d'Avila Garcez

+

City, University of London 教授——神经符号计算领域核心研究者

+
+ + + Garcez 与 Luís C. Lamb 合著「Neurosymbolic AI: The 3rd Wave」(arXiv:2012.05876),综合 20 年神经符号计算研究,发表于 Artificial Intelligence Review(Springer Nature, 2023)。核心贡献:命题固着的系统论证、Kautz 六类分类法的详细阐述、以及对 XAI 忠实性原则的批判性重申。 + + + +
+ 核心贡献 +
+ 命题固着系统论证 + 神经网络无法表达完整命题逻辑推理的理论边界——联结主义最根本的表达局限 +
+
+ Kautz 六类分类法 + 从松耦合(Type 1 Symbolic+Neural)到紧耦合(Type 6 Neuro[Symbolic])的神经符号集成光谱 +
+
+ XAI 忠实性批判 + 批评 LIME 等方法放弃忠实性:「不能准确描述 ML 系统工作方式的解释不能被称为真正的解释」 +
+
+
+ 研究主题 + 将逻辑张量网络作为神经符号集成的一种具体实现路径 + 将非单调推理与神经网络结合——处理不确定性和默认推理 + 从训练好的神经网络中提取可解释的符号规则 +
+
+ + +
+ → Neurosymbolic AI · Neurosymbolic AI Taxonomy · Knowledge Extraction Fidelity + Garcez & Lamb (2023) +
+
+ + diff --git a/site/src/content/cards/zh/entities/asplos.mdx b/site/src/content/cards/zh/entities/asplos.mdx new file mode 100644 index 0000000..8a6283d --- /dev/null +++ b/site/src/content/cards/zh/entities/asplos.mdx @@ -0,0 +1,64 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: ASPLOS +titleAlt: ASPLOS +tagline: 计算机系统顶会 · AgenticOS Workshop 2026 · Agent基础设施进入系统研究议程 +refs: + - concepts/agent-os + - concepts/agent-sandboxing + - entities/anthropic +sourceLine: AgenticOS Workshop ASPLOS 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · ASPLOS · 计算机系统顶会 · AgenticOS Workshop 2026 · 标志性事件 + + + +

ASPLOS

+

Architectural Support for Programming Languages and Operating Systems — 计算机系统领域顶级学术会议

+
+ + + ASPLOS 覆盖体系结构、编程语言和操作系统的交叉研究,ACM/IEEE 联合主办。2026 年举办首届 AgenticOS Workshop,标志着学术系统社区正式将 AI agent 基础设施纳入研究议程——这是 agent 研究从 ML/NLP 社区向系统社区扩散的标志性事件。 + + + +
+ AgenticOS Workshop 2026 +
+ 意义 + 产业界 agent 实践(OpenAI/Anthropic 等)所积累的应用层问题,反向催生了 OS 级系统研究需求——这一需求在 ASPLOS 找到了学术出口 +
+
+ 超越传统进程/线程模型的 agent 执行单元抽象 + LLM 推理的调度、内存管理、算力分配 + agent 执行环境的安全隔离与权限边界 + 理解 agent 任务语义的智能调度——不同于传统 FIFO/优先级调度 +
+
+
+ + +
+ → Agent OS · Agent Sandboxing · Anthropic + AgenticOS Workshop ASPLOS 2026 +
+
+ + diff --git a/site/src/content/cards/zh/entities/avatamsaka-sutra.mdx b/site/src/content/cards/zh/entities/avatamsaka-sutra.mdx new file mode 100644 index 0000000..dd08871 --- /dev/null +++ b/site/src/content/cards/zh/entities/avatamsaka-sutra.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 华严经 +titleAlt: Avatamsaka Sutra +tagline: 法界缘起 · 因陀罗网 · 须弥芥子 · 一即一切 · 分形哲学先驱 +refs: + - concepts/indra-net + - concepts/sumeru-mustard-seed + - concepts/fractal-architecture +sourceLine: 华严经 / Cook 1973 Jewel Net of Indra +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · 华严经 · Avatamsaka Sutra · 法界缘起 · 一即一切,一切即一 + + + +

华严经

+

大方广佛华严经 — 大乘佛教核心经典,华严宗根本经典,分形结构的哲学先驱

+
+ + + 华严经的核心哲学是法界缘起——一切现象互为因果、互相含摄、圆融无碍。产生了两个对后世影响深远的隐喻:须弥芥子(大小互含,部分映射整体)和因陀罗网(无限宝珠互映,每节点包含全局信息)。这两个隐喻共同表达华严哲学的核心命题:一即一切,一切即一。 + + + +
+ 两大核心隐喻 +
+
+ 须弥芥子 + 须弥山藏于芥子中——大小非固有属性,部分可无损地蕴含整体的结构关系 + → 自相似性哲学先驱 +
+
+ 因陀罗网 + 帝释天珠网无限互映——每个节点包含所有其他节点(包括它们映出的自己) + → 递归全息结构 +
+
+
+
+ 历史背景与学术资源 + 约公元 1-4 世纪,历多次增补;唐代实叉难陀译八十卷本为通行本 + 华严宗(中国)、Kegon(日本)以此经为根本;与禅宗在中韩有更深融合关系 + Cook (1973) Hua-Yen Buddhism: The Jewel Net of Indra — 因陀罗网经典描述 + 分形架构中「无碍互入」的工程类比——华严哲学的软件工程化 +
+
+ + +
+ → Indra's Net · Sumeru Mustard Seed · Fractal Architecture + 华严经 / Cook (1973) +
+
+ + diff --git a/site/src/content/cards/zh/entities/benoit-mandelbrot.mdx b/site/src/content/cards/zh/entities/benoit-mandelbrot.mdx new file mode 100644 index 0000000..a246aae --- /dev/null +++ b/site/src/content/cards/zh/entities/benoit-mandelbrot.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Benoit Mandelbrot +titleAlt: Benoit Mandelbrot +tagline: 分形几何学创始人 · fractal造词1975 · 海岸线论文1967 · 云不是球体 +refs: + - concepts/statistical-self-similarity + - concepts/richardson-effect + - concepts/fractal-dimension +sourceLine: Mandelbrot 1967 Science · 1982 The Fractal Geometry of Nature +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · BENOIT MANDELBROT · 分形几何学创始人 · fractal 造词 1975 + + + +

Benoit Mandelbrot

+

数学家,分形几何学创始人——为自然界不规则形态建造合适的数学语言

+
+ + + Mandelbrot 的核心洞察:欧氏几何无法描述自然界大部分形状——「云不是球体,山不是锥体,海岸线不是圆」。他不是从抽象数学出发找应用,而是从自然界的不规则现象出发,为之建造合适的数学语言。1975 年造词「fractal」(源自拉丁语 fractus,意为破碎的、不规则的),建立了描述自然界不规则形态的全新数学分支。 + + + +
+ 主要贡献年表 +
+ 1967 + 海岸线论文(Science) + 将 Richardson 效应与 Hausdorff 维数联系,引入统计自相似性概念 +
+
+ 1975 + fractal 造词 + 建立分形几何学,Mandelbrot 集成为分形几何最广为人知的视觉符号 +
+
+ 1982 + 《The Fractal Geometry of Nature》 + 系统阐述分形理论的专著,海岸线/云朵/血管树/金融价格波动统一框架 +
+
+
+ 与本 Wiki 的关联链 + Richardson 的经验发现(1961)→ Mandelbrot 的理论框架(1967)→ 分形维数定义 + 同一统计属性在不同尺度恒定——连接数学分形与自然界的核心概念 + 幂律分布背后往往是统计自相似——传感器分辨率提升不停止发现新信息 +
+
+ + +
+ → Statistical Self-Similarity · Richardson Effect · Fractal Dimension + Mandelbrot (1967 / 1982) +
+
+ + diff --git a/site/src/content/cards/zh/entities/chroma.mdx b/site/src/content/cards/zh/entities/chroma.mdx new file mode 100644 index 0000000..d4a75d9 --- /dev/null +++ b/site/src/content/cards/zh/entities/chroma.mdx @@ -0,0 +1,59 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Chroma +titleAlt: Chroma +tagline: 开源向量数据库 · Context Rot系统研究 · 18模型测试 · RAG vs长上下文实证 +refs: + - concepts/context-rot + - concepts/context-management + - concepts/virtual-context-management +sourceLine: Chroma Research Context Rot 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CHROMA · 开源向量数据库 · Context Rot 研究 2025 + + + +

Chroma

+

开源向量数据库公司——其研究部门发布了 Context Rot 系统性实证研究

+
+ + + Chroma 在 2025 年发布的 Context Rot 研究是目前对 LLM 长 context 退化最系统的实证工作之一:测试 18 个前沿模型,4 类控制实验(needle-question similarity、distractor impact、needle-haystack similarity、haystack structure),加上 LongMemEval 和 Repeated Words 两个补充实验。代码开源于 github.com/chroma-core/context-rot。 + + + +
+ Context Rot 研究设计 + 18 个前沿模型,4 类控制实验 + 2 个补充实验——迄今最系统的长 context 退化研究 + 针(目标信息)与问题相似 → 更容易被找到;针与草垛相似 → 更容易被混淆 + 相关但不正确的干扰项使模型性能大幅下降——结构化 context 优于随机排列 + 跨会话记忆评估——多轮对话中信息检索的系统性退化 +
+
+ 利益关系注解 + 作为向量数据库公司,Chroma 的动机指向 RAG 优于纯长 context 的论证——这一利益关系不影响方法论价值,但解读结论时应注意 +
+
+ + +
+ → Context Rot · Context Management · Virtual Context Management + Chroma Research (2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/claude-agent-sdk.mdx b/site/src/content/cards/zh/entities/claude-agent-sdk.mdx new file mode 100644 index 0000000..df4c72e --- /dev/null +++ b/site/src/content/cards/zh/entities/claude-agent-sdk.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Claude Agent SDK +titleAlt: Claude Agent SDK +tagline: 「给agent一台计算机」· 隐式循环架构 · Context Compaction · 长时运行需要外部化追踪 +refs: + - concepts/harness-engineering + - concepts/implicit-loop-architecture + - concepts/context-management +sourceLine: Anthropic Building Agents Claude Agent SDK 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CLAUDE AGENT SDK · 原 Claude Code SDK · 「给 agent 一台计算机」 + + + +

Claude Agent SDK

+

Anthropic 的 agent 开发框架——原 Claude Code SDK,让 agent 使用计算机完成工作

+
+ + + 设计哲学:「给 agent 一台计算机」。SDK 让 agent 能使用文件系统、终端、工具——与人类使用计算机的方式一致。运行在隐式循环架构上:gather context → take action → verify work → repeat,行为由工具、prompt、权限和反馈机制约束,而非预定义图。 + + + +
+ 隐式循环架构 +
+
Gather Context
+
+
Take Action
+
+
Verify Work
+
+
Repeat
+
+
行为由约束塑造,而非预设路径——工具/prompt/权限/反馈机制共同决定
+
+
+ 长时运行能力与局限 + context 接近上限时自动压缩历史继续工作——SDK 内建能力 + Anthropic 实践发现:还需要外部化进度追踪(progress file + git history + feature tracking) + Initializer-Coder 双 agent 架构才能实现可靠的跨 session 工作 + Claude Agent SDK + MCP 工具调用是推荐的 agent 开发组合 +
+
+ + +
+ → Harness Engineering · Implicit Loop Architecture · Context Management + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/claude-code.mdx b/site/src/content/cards/zh/entities/claude-code.mdx new file mode 100644 index 0000000..ad53af9 --- /dev/null +++ b/site/src/content/cards/zh/entities/claude-code.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Claude Code +titleAlt: Claude Code +tagline: Anthropic官方编码agent CLI · 三级工具审批 · deny-first规则 · 五级作用域 · 六种权限模式 +refs: + - concepts/claude-code-permission-system + - concepts/permission-modes + - concepts/agent-sandboxing +sourceLine: Anthropic Claude Code Permissions 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CLAUDE CODE · 官方编码 Agent CLI · 权限系统参考实现 + + + +

Claude Code

+

Anthropic 官方 AI 编码 agent CLI——读写文件、执行命令、调用工具的完整代理系统

+
+ + + Claude Code 不只是聊天界面,而是可以读写文件、执行 Bash 命令、调用 MCP 工具、启动子 agent 的完整代理系统。其权限系统是生产级 agent 权限管理的参考实现:三级工具分级审批 + deny-first 规则语义 + 五级作用域层次 + 六种权限模式,与 OS 沙箱构成双层纵深防御。 + + + +
+ 三轴权限系统 +
+ 工具分级审批 + 只读工具(无需审批)→ 文件修改工具(会话级)→ Bash 命令(永久记录) +
+
+ Deny-First 规则 + deny → ask → allow 优先级评估,任意层级的 deny 无法被 allow 覆盖 +
+
+ 五级作用域 + 托管设置 {">"} CLI 参数 {">"} 本地项目 {">"} 共享项目 {">"} 用户设置 +
+
+
+ 特色设计 + default / acceptEdits / plan / auto / dontAsk / bypassPermissions + 行为由约束塑造而非预设路径——Skills 系统通过 .claude/skills/ 可组合扩展能力 + 权限规则阻止受限请求,OS 沙箱在 prompt injection 绕过模型决策时作为最后防线 +
+
+ + +
+ → Claude Code Permission System · Permission Modes · Agent Sandboxing + Anthropic Claude Code (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/cli-anything.mdx b/site/src/content/cards/zh/entities/cli-anything.mdx new file mode 100644 index 0000000..60b1f11 --- /dev/null +++ b/site/src/content/cards/zh/entities/cli-anything.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: CLI-Anything +titleAlt: CLI-Anything +tagline: HKUDS 2026 · 29K stars · 任意软件→agent原生CLI · 7阶段流水线 · CLI-Hub +refs: + - concepts/tool-design + - concepts/agent-native-software + - concepts/repl-for-agents +sourceLine: HKUDS/CLI-Anything github.com 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CLI-ANYTHING · HKUDS 2026 · 软件 → agent 原生 CLI · 29K stars + + + +

CLI-Anything

+

自动生成结构化 CLI,将任意现有软件转换为 agent 原生可调用工具

+
+ + + 「Today's Software Serves Humans. Tomorrow's Users will be Agents.」HKUDS 团队 2026-03 推出,截至 2026-04 有 29,804 GitHub stars,覆盖 20+ 主流软件,2,130 测试全部通过。一条命令触发 7 阶段全自动流水线(Analyze → Design → Implement → Plan Tests → Write Tests → Document → Publish),产出放在 software/agent-harness/ 目录。 + + + +
+ 四条核心设计原则 +
+ Authentic Integration + 生成合法项目文件,渲染交给真实软件——不做替代品,只做结构化接口 +
+
+ 双模式 + 无参进 REPL(多步试错),有参做脚本调用——同时服务人类和 agent +
+
+ 一致体验 + ReplSkin 强制所有 CLI 用同一套视觉语言——同构产出让 agent 可迁移经验 +
+
+ Agent-Native + --json 内建,--help 自文档,which 可发现——只用 POSIX 原语,无需额外 SDK +
+
+
+ 生态影响 + agent 可自主浏览并 pip install 任意 CLI——零人类介入的 agent-native 软件分发 + Claude Code / Codex / GitHub Copilot CLI / Goose 等 8 个平台有官方/社区支持 +
+
+ + +
+ → Tool Design · Agent-Native Software · REPL for Agents + HKUDS/CLI-Anything (2026) +
+
+ + diff --git a/site/src/content/cards/zh/entities/codex.mdx b/site/src/content/cards/zh/entities/codex.mdx new file mode 100644 index 0000000..f210676 --- /dev/null +++ b/site/src/content/cards/zh/entities/codex.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Codex +titleAlt: Codex (OpenAI) +tagline: OpenAI编码agent · codex-1(o3 RL微调) · 6小时+运行 · 零人工百万行代码 · Harness Engineering验证 +refs: + - concepts/harness-engineering + - concepts/implicit-loop-architecture + - entities/claude-agent-sdk +sourceLine: OpenAI Codex 2025 · OpenAI Harness Engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CODEX · OpenAI · agent 编码平台 · Harness Engineering 规模验证 + + + +

Codex

+

OpenAI 的 agent 编码平台——基于 codex-1(o3 RL 微调),支持 6+ 小时自主运行

+
+ + + Codex 是 OpenAI 的 agentic 编码解决方案,2025 年发布为 cloud agent 产品。内部运行隐式循环架构(Runner 组件驱动 prompt → tool call → reasoning → loop end)。OpenAI 团队用 Codex 零人工编码构建了百万行代码的产品,验证了 harness engineering 在规模化 agent 开发中的核心地位。 + + + +
+ 核心能力 +
+ 模型 + codex-1:基于 o3 的 RL 微调版本,针对编码任务优化 +
+
+ 长时运行 + 单次运行可持续 6+ 小时,独立沙箱隔离,并行多任务支持 +
+
+ 引导机制 + AGENTS.md 文件引导 agent 行为,类似 Claude Code 的 CLAUDE.md +
+
+ 工作流集成 + 支持自主 PR 开启、review 响应、merge——完整的 git 工作流自动化 +
+
+
+ Harness Engineering 规模验证 + OpenAI 团队实践:完整产品级代码库不需要人工编码介入 + gh、本地脚本、repo 内 skills——不依赖专有 API,验证工具设计原则 + 两者都是 agentic 编码平台,都运行隐式循环架构,路径各有侧重 +
+
+ + +
+ → Harness Engineering · Implicit Loop Architecture · Claude Agent SDK + OpenAI Codex (2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/cycle-js.mdx b/site/src/content/cards/zh/entities/cycle-js.mdx new file mode 100644 index 0000000..9bbd9bf --- /dev/null +++ b/site/src/content/cards/zh/entities/cycle-js.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Cycle.js +titleAlt: Cycle.js +tagline: André Staltz · sources→sinks纯函数 · 分形架构典型实现 · 副作用推到driver层 +refs: + - concepts/fractal-architecture + - concepts/implicit-loop-architecture + - concepts/harness-engineering +sourceLine: Anton Telesh Fractal Architecture 2016 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · CYCLE.JS · André Staltz · sources→sinks 纯函数 · 分形架构 + + + +

Cycle.js

+

基于响应式编程的 JS 框架——应用即纯函数,分形架构的典型实现

+
+ + + Cycle.js 将应用视为纯函数:接收外部世界的输入(sources,observables 形式),返回对外部世界的输出(sinks,也是 observables)。每个组件都是 sources → sinks 的纯函数,与整个应用签名相同——这是分形架构的典型实现:任意层级的接口结构相同,可以递归组合。 + + + +
+ 架构特征 +
+ 统一接口 + 每个组件 sources → sinks 签名与整个应用相同——任意深度的嵌套保持接口一致性 +
+
+ 递归组合 + 组件内部调用其他组件,如同函数调用其他函数——分形自相似结构 +
+
+ 副作用 → Driver 层 + 组件无副作用;副作用被推到框架的 driver 层——胶水与逻辑分离 +
+
+
+ 与 Agent 系统的结构同构 + Cycle.js:sources → sinks 纯函数;Agent:context → actions,harness 处理副作用 + 两者都通过约束(而非预设路径)塑造行为——行为从交互中涌现 + Driver 层 ↔ Harness 层——副作用(I/O)与推理(纯逻辑)分离的同构设计 +
+
+ + +
+ → Fractal Architecture · Implicit Loop Architecture · Harness Engineering + Anton Telesh (2016) +
+
+ + diff --git a/site/src/content/cards/zh/entities/david-hume.mdx b/site/src/content/cards/zh/entities/david-hume.mdx new file mode 100644 index 0000000..53083cb --- /dev/null +++ b/site/src/content/cards/zh/entities/david-hume.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: David Hume +titleAlt: David Hume +tagline: 1711-1776 · 苏格兰哲学家 · 恒常连结 · 归纳问题 · 习惯 · 康德的触发者 +refs: + - concepts/causation-hume + - concepts/induction-problem + - concepts/regularity-theory +sourceLine: SEP David Hume · SEP Metaphysics of Causation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · DAVID HUME · 1711–1776 · 苏格兰 · 因果经验主义 · 归纳问题 + + + +

David Hume

+

苏格兰哲学家(1711–1776)——经验主义认识论奠基人,西方哲学史转折点

+
+ + + 休谟以牛顿为楷模,将实验方法引入「道德科学」。核心影响链:康德被休谟从「独断论的迷梦」中唤醒,整个批判哲学是对休谟挑战的回应;达尔文视休谟为进化论中心影响;边沁阅读休谟使「眼前的鳞片脱落」,催生功利主义传统。英语世界最重要的哲学家之一。 + + + +
+ 核心因果理论贡献 +
+ 恒常连结 + 因果关系的经验基础——「原因」是「其后通常跟随结果」的恒常连结,非神秘的必然联系 +
+
+ 必然联系问题 + 必然联系非印象而来,来自心灵对恒常连结的期待——因果的主观来源揭示 +
+
+ 归纳问题 + 齐一性原则无法被证明(演示性推理)也无法被辩护(概率推理循环)——理性对归纳无能为力 +
+
+ 习惯的作用 + 比理性更可靠的实践指南——习惯而非理性驱动人类的预测行为 +
+
+
+ 与 AI 工程的结构呼应 + 模型从数据中学到的是统计模式而非因果理解——休谟式学习 + 基于经验数据的系统设计优于理论推导——harness engineering 的经验主义立场 +
+
+ + +
+ → Causation (Hume) · Induction Problem · Regularity Theory + SEP David Hume +
+
+ + diff --git a/site/src/content/cards/zh/entities/david-lewis.mdx b/site/src/content/cards/zh/entities/david-lewis.mdx new file mode 100644 index 0000000..f01fcba --- /dev/null +++ b/site/src/content/cards/zh/entities/david-lewis.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: David Lewis +titleAlt: David Lewis +tagline: 1941-2001 · 反事实因果理论 · 可能世界语义学 · 影响理论2000 · 类型因果=个例概括 +refs: + - concepts/counterfactual-theory + - concepts/possible-world-semantics + - concepts/preemption +sourceLine: SEP Counterfactual Theories of Causation · Lewis 1973 · Lewis 2000 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · DAVID LEWIS · 1941–2001 · 反事实因果 · 可能世界 · 影响理论 + + + +

David Lewis

+

美国-澳大利亚分析哲学家(1941–2001)——反事实因果理论奠基者

+
+ + + Lewis(1973):c 是 e 的原因,当且仅当存在从 c 到 e 的反事实依赖链——「如果 c 没有发生,e 就不会发生」,通过最近可能世界语义学赋予精确真值条件。Lewis 还主张类型因果只是个例因果的概括,以及因果关系是客观的、不依赖语境的关系(平等主义不变主义)。 + + + +
+ 因果理论演进 +
+ 1973 + 反事实因果理论 + 依赖链模型 + 可能世界语义学——因果关系形而上学的范式转换 +
+
+ 1979 + 时间不对称性 + 「过度决定的不对称性」解释因果时间方向——原因留下大量痕迹被结果过度决定 +
+
+ 1986 + 细粒度事件理论 + 事件是时空区域的属性——解决金属球旋转/加热的区分问题 +
+
+ 2000 + 影响理论 + 为应对晚期/凌驾先占挑战:从「反事实依赖」转向「影响」——但面临虚假因果批评 +
+
+
+ 核心立场 + 非实际可能世界是与实际世界同等级的真实具体实体(多数哲学家持距离) + Lewis 的可能世界语义 vs Pearl 的干预语义(do-calculus)——两种因果形式化的对比 +
+
+ + +
+ → Counterfactual Theory · Possible World Semantics · Preemption + Lewis (1973 / 2000) +
+
+ + From fddfe270929d64f35cf6423e721da81bed9d1384 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 19:16:14 +0800 Subject: [PATCH 33/48] =?UTF-8?q?feat(cards):=20batch=2011/18=20=E2=80=94?= =?UTF-8?q?=20entities/factory-ai=E2=86=92max-tegmark=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../content/cards/zh/entities/factory-ai.mdx | 60 +++++++++++++ .../cards/zh/entities/gerard-de-melo.mdx | 59 +++++++++++++ site/src/content/cards/zh/entities/google.mdx | 84 ++++++++++++++++++ .../content/cards/zh/entities/henry-kautz.mdx | 75 ++++++++++++++++ .../cards/zh/entities/herbert-simon.mdx | 75 ++++++++++++++++ .../cards/zh/entities/james-woodward.mdx | 60 +++++++++++++ .../cards/zh/entities/jeremy-howard.mdx | 59 +++++++++++++ .../content/cards/zh/entities/jerry-fodor.mdx | 78 +++++++++++++++++ .../content/cards/zh/entities/john-mackie.mdx | 85 +++++++++++++++++++ .../content/cards/zh/entities/karl-popper.mdx | 74 ++++++++++++++++ .../content/cards/zh/entities/langgraph.mdx | 79 +++++++++++++++++ .../zh/entities/lewis-fry-richardson.mdx | 60 +++++++++++++ .../cards/zh/entities/linux-foundation.mdx | 74 ++++++++++++++++ site/src/content/cards/zh/entities/manus.mdx | 82 ++++++++++++++++++ .../content/cards/zh/entities/max-tegmark.mdx | 65 ++++++++++++++ 15 files changed, 1069 insertions(+) create mode 100644 site/src/content/cards/zh/entities/factory-ai.mdx create mode 100644 site/src/content/cards/zh/entities/gerard-de-melo.mdx create mode 100644 site/src/content/cards/zh/entities/google.mdx create mode 100644 site/src/content/cards/zh/entities/henry-kautz.mdx create mode 100644 site/src/content/cards/zh/entities/herbert-simon.mdx create mode 100644 site/src/content/cards/zh/entities/james-woodward.mdx create mode 100644 site/src/content/cards/zh/entities/jeremy-howard.mdx create mode 100644 site/src/content/cards/zh/entities/jerry-fodor.mdx create mode 100644 site/src/content/cards/zh/entities/john-mackie.mdx create mode 100644 site/src/content/cards/zh/entities/karl-popper.mdx create mode 100644 site/src/content/cards/zh/entities/langgraph.mdx create mode 100644 site/src/content/cards/zh/entities/lewis-fry-richardson.mdx create mode 100644 site/src/content/cards/zh/entities/linux-foundation.mdx create mode 100644 site/src/content/cards/zh/entities/manus.mdx create mode 100644 site/src/content/cards/zh/entities/max-tegmark.mdx diff --git a/site/src/content/cards/zh/entities/factory-ai.mdx b/site/src/content/cards/zh/entities/factory-ai.mdx new file mode 100644 index 0000000..0fc5bdc --- /dev/null +++ b/site/src/content/cards/zh/entities/factory-ai.mdx @@ -0,0 +1,60 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Factory.ai +titleAlt: Factory.ai +tagline: AI编码agent · 锚定式迭代摘要 · 36K生产消息压缩评估 · artifact tracking弱点揭示 +refs: + - concepts/context-compression + - concepts/harness-engineering + - entities/anthropic +sourceLine: Factory Evaluating Context Compression 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · FACTORY.AI · AI 编码 Agent · 上下文压缩实证研究 + + + +

Factory.ai

+

AI 编码 agent 公司——上下文压缩实证研究的重要来源

+
+ + + Factory 在 36,000+ 条生产 session 消息上对比了三种压缩策略(Factory、OpenAI、Anthropic),构建了 probe-based 功能质量评估框架,直接衡量压缩后 agent 的任务继续能力。核心发现:artifact tracking 是所有压缩方法的普遍弱点——无论哪种策略,压缩后追踪代码产物和文件状态的能力都会显著下降。 + + + +
+ 压缩研究贡献 + Anchored Iterative Summarization——通过结构化 section 和增量合并防止信息丢失,区别于简单截断 + 功能质量评估框架:测量压缩后 agent 能否继续执行任务,而非只测文本相似度 + 基于真实生产数据而非合成测试集——评估结果更具工程参考价值 + Factory vs OpenAI vs Anthropic 策略对比——揭示不同方法在生产场景的真实权衡 +
+
+ 普遍弱点发现 + 所有压缩方法的共同弱点:压缩后模型对代码产物、文件状态的追踪能力下降 + 外部化 artifact 追踪(如 feature tracking + progress file)是 harness 层的必要补偿机制 +
+
+ + +
+ → Context Compression · Harness Engineering · Anthropic + Factory (2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/gerard-de-melo.mdx b/site/src/content/cards/zh/entities/gerard-de-melo.mdx new file mode 100644 index 0000000..4236c55 --- /dev/null +++ b/site/src/content/cards/zh/entities/gerard-de-melo.mdx @@ -0,0 +1,59 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Gerard de Melo +titleAlt: Gerard de Melo +tagline: 计算语言学 · 轨迹偏差揭示者 · RANLP 2025 · Draft-Conditioned解法 · 指令模型vs基础模型分歧 +refs: + - concepts/trajectory-bias + - concepts/structured-outputs +sourceLine: Schall & de Melo RANLP 2025 · arXiv:2603.03305 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · GERARD DE MELO · 轨迹偏差研究者 · RANLP 2025 + + + +

Gerard de Melo

+

计算语言学与 NLP 研究者——轨迹偏差概念的命名者与实验揭示者

+
+ + + de Melo 与 Maximilian Schall 合作(RANLP 2025),系统性实验揭示约束解码对 LLM 推理质量的隐性代价,命名并量化了「轨迹偏差」现象:约束施加的累积扰动将解码路径系统性推离语义最优方向,即使输出在句法上完全合规。 + + + +
+ 研究贡献 + 系统性实验揭示约束解码的隐性语义代价——格式合规率不等于任务准确率 + 11 个模型实验发现关键分歧:指令微调模型受轨迹偏差影响更强,因对话目标与文法约束产生摩擦 + 基础模型在约束条件下的表现可预测其指令微调后的结构化输出能力 + arXiv:2603.03305(2025):草稿-格式分离缓解轨迹偏差——先推理再格式化 +
+
+ 工程影响 + 仅推理时施加约束是根本性错位——将约束纳入训练阶段是长期方向 + de Melo 的实证与 CRANE(Beurer-Kellner 2025)的理论证明互为佐证 +
+
+ + +
+ → Trajectory Bias · Structured Outputs + Schall & de Melo (RANLP 2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/google.mdx b/site/src/content/cards/zh/entities/google.mdx new file mode 100644 index 0000000..fae11f7 --- /dev/null +++ b/site/src/content/cards/zh/entities/google.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Google +titleAlt: Google +tagline: A2A协议原始开发者 · ADK · Gemini · 捐赠Linux Foundation中立化 · 完整agent技术栈 +refs: + - concepts/a2a-protocol + - entities/linux-foundation + - concepts/agent-interoperability +sourceLine: Google A2A Protocol 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · GOOGLE · A2A 协议发起方 · ADK · Gemini · 完整 Agent 技术栈 + + + +

Google

+

AI 研究与产品公司——A2A 协议原始开发者,Agent Development Kit 背后推动者

+
+ + + Google 是 A2A 协议的发起方,2024 年主导开发后捐赠给 Linux Foundation 以中立化治理——确保协议不被单一厂商控制,鼓励多方参与,目标是让 A2A 成为真正的行业标准而非 Google 私有标准。这是开源协议演进的标准路径(类比:Kubernetes 从 Google 内部到 CNCF 托管)。 + + + +
+ Agent 技术栈四层布局 +
+ 模型层 + Gemini + ADK 默认优化目标 +
+
+ 框架层 + ADK(Agent Development Kit) + Agent 开发工具包,协议层之上 +
+
+ 工具层 + MCP 生态兼容 + 工具调用与外部系统集成 +
+
+ 通信层 + A2A Protocol + 跨框架 agent 通信标准 +
+
+
+ A2A 治理策略 + 中立化治理——协议标准化需要超越单一厂商利益 + 通过开放 A2A 标准吸引生态参与,建立 agent 互操作领域的技术话语权 +
+
+ + +
+ → A2A Protocol · Linux Foundation · Agent Interoperability + Google A2A (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/henry-kautz.mdx b/site/src/content/cards/zh/entities/henry-kautz.mdx new file mode 100644 index 0000000..55b0f8e --- /dev/null +++ b/site/src/content/cards/zh/entities/henry-kautz.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Henry Kautz +titleAlt: Henry Kautz +tagline: Rochester大学 · 六类神经符号分类法 · 第三个AI之夏 · 不会有第三个寒冬 · Allen Newell Award +refs: + - concepts/neurosymbolic-ai-taxonomy + - concepts/neurosymbolic-ai + - entities/artur-garcez +sourceLine: Kautz 2022 AI Magazine The Third AI Summer +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · HENRY KAUTZ · Rochester · Kautz 六类分类法 · 第三个 AI 之夏 + + + +

Henry Kautz

+

计算机科学家,Rochester 大学——神经符号 AI 六类分类法提出者

+
+ + + Kautz 在 AAAI 2020 Robert S. Engelmore 纪念讲座(「The Third AI Summer」)中提出神经符号 AI 六类架构分类法,成为领域标准参照框架。核心论断:「不会有第三个冬天」——AI 将通过神经符号集成演化,而非以资金撤退终结。反对「猫和老鼠」叙事:AlphaGo 本身已经是 Type 2 神经符号系统。 + + + +
+ 三个 AI 之夏叙事 +
+ 第一夏(1948-1966) + 神经网络与逻辑系统同步出现——并非符号主义独占 +
+
+ 第二夏(1968-1987) + 专家系统的商业成功与局限——「冬天」是 Pearl 贝叶斯网络的孕育期 +
+
+ 第三夏(2012–今) + 深度学习主导,走向神经符号融合——不会有第三个寒冬 +
+
+
+ 六类分类法的影响力 + 2020 年后几乎所有神经符号 AI 综述都以 Kautz 分类法为组织框架 + Type 2 系统已实现超人表现,证明神经符号集成方法实际有效 + 认知科学与 AI 跨学科贡献——与 Newell 的连接耐人寻味 +
+
+ + +
+ → Neurosymbolic AI Taxonomy · Neurosymbolic AI · Artur Garcez + Kautz (AI Magazine 2022) +
+
+ + diff --git a/site/src/content/cards/zh/entities/herbert-simon.mdx b/site/src/content/cards/zh/entities/herbert-simon.mdx new file mode 100644 index 0000000..cf71733 --- /dev/null +++ b/site/src/content/cards/zh/entities/herbert-simon.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Herbert A. Simon +titleAlt: Herbert A. Simon +tagline: 诺贝尔奖1978 · 图灵奖1975 · 有限理性 · 复杂性架构 · 近可分解性 · PSSH共同作者 +refs: + - concepts/hierarchical-systems + - concepts/near-decomposability + - concepts/physical-symbol-system +sourceLine: Simon 1962 Architecture of Complexity · Newell & Simon 1976 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · HERBERT A. SIMON · 诺贝尔 1978 · 图灵 1975 · 有限理性 · 复杂性架构 + + + +

Herbert A. Simon

+

跨越经济学、认知科学、AI 的思想家(1916–2001)——有限理性与复杂系统奠基者

+
+ + + Simon 是少数真正跨越学科边界的思想家——研究横跨管理学、经济学、认知科学、AI 和复杂系统理论。1978 年诺贝尔经济学奖(有限理性),1975 年图灵奖(AI 与认知心理学贡献,与 Newell 共同获奖)。有限理性理论与 LLM agent 面临的约束高度同构:在有限 context window 中做出的每个决策都是有限理性的实例。 + + + +
+ 核心贡献 +
+ 复杂性架构(1962) + 层级系统 + 近可分解性 + 钟表匠寓言 + 描述可压缩性——复杂系统通论 +
+
+ PSSH(1976,与 Newell) + 物理符号系统是通用智能行为的充分必要条件——符号 AI 的奠基命题 +
+
+ 有限理性 + 决策者的理性受限于信息/认知能力/时间约束——优化→满足化(satisficing) +
+
+
+ 与 AI Agent 工程的连接 + 层级内部交互强于层级间——agent 系统的模块化设计原则的理论基础 + LLM agent 在有限 context window 中决策 = 有限理性在计算系统中的实例 + Simon 按结构分解复杂系统;亚里士多德按解释角色分解——互补的复杂性分析框架 +
+
+ + +
+ → Hierarchical Systems · Near-Decomposability · Physical Symbol System + Simon (1962) / Newell & Simon (1976) +
+
+ + diff --git a/site/src/content/cards/zh/entities/james-woodward.mdx b/site/src/content/cards/zh/entities/james-woodward.mdx new file mode 100644 index 0000000..72c946f --- /dev/null +++ b/site/src/content/cards/zh/entities/james-woodward.mdx @@ -0,0 +1,60 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: James Woodward +titleAlt: James Woodward +tagline: Pittsburgh大学 · Making Things Happen 2003 · 干预主义因果理论 · 模块性 · 类型影响焦点 +refs: + - concepts/interventionist-theory + - concepts/causal-models + - entities/judea-pearl +sourceLine: Woodward 2003 Making Things Happen · SEP Metaphysics of Causation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · JAMES WOODWARD · Pittsburgh · 干预主义因果理论 · Making Things Happen + + + +

James Woodward

+

匹兹堡大学科学哲学家——干预主义因果理论的主要建构者

+
+ + + Woodward 在 Making Things Happen(2003)中提出系统的干预主义框架:X 对 Y 有直接因果影响,当且仅当存在对 X 的干预,在固定其他变量后,会改变 Y。关键特性:非还原但非循环——定义 X-Y 影响时只引用 X、Y 之外的变量关系。区别于反事实语义,干预语义更接近科学实践的因果推理。 + + + +
+ 干预主义核心框架 + 「手术性」干预的精确刻画——只通过 X 影响 Y,不通过其他路径影响 Y + 定义 X-Y 影响时引用其他变量之间的影响,形成非循环的定义网络 + 主要分析「X 影响 Y」的一般性关系——特别适合科学实践中的因果推理 + 每个结构方程可独立被干预破坏——保证干预的可行性和局部性 +
+
+ 与其他理论家的关系 + 独立发展了基于干预的形式化框架,与 Pearl 的 do-calculus 高度互补 + 干预语义替代了 Lewis 的可能世界语义——更接近实验科学的操作概念 +
+
+ + +
+ → Interventionist Theory · Causal Models · Judea Pearl + Woodward (2003) Making Things Happen +
+
+ + diff --git a/site/src/content/cards/zh/entities/jeremy-howard.mdx b/site/src/content/cards/zh/entities/jeremy-howard.mdx new file mode 100644 index 0000000..8119655 --- /dev/null +++ b/site/src/content/cards/zh/entities/jeremy-howard.mdx @@ -0,0 +1,59 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Jeremy Howard +titleAlt: Jeremy Howard +tagline: fast.ai联合创始人 · Answer.AI创始人 · llms.txt标准 · AI教育民主化 · top-down实践法 +refs: + - concepts/llms-txt + - entities/answer-ai +sourceLine: fast.ai · Answer.AI · llmstxt.org +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · JEREMY HOWARD · fast.ai · Answer.AI · llms.txt 标准提出者 + + + +

Jeremy Howard

+

AI 研究者、教育者、创业者——以推动 AI 教育民主化和实用 AI 工具标准著称

+
+ + + Howard 的核心哲学:让 AI 工具真正实用且可被所有人使用。fast.ai 用 top-down 实践方法打破 AI 教育门槛;Answer.AI 延续这一精神,推出 llms.txt 等实用标准。2024 年提出的 llms.txt 标准已成为 AI 索引领域的事实规范。 + + + +
+ 主要贡献 + 面向所有人的深度学习教育课程,top-down 实践方法——先用起来,再理解原理 + 基于 Jupyter Notebook 的软件开发工具,将文档、测试、代码集成于一体 + 2024 年提出的网站 LLM 友好文档约定——AI 时代的 robots.txt + Python web 框架,同时是 llms.txt 标准的首个参考实现 +
+
+ 实用主义哲学 + 5-10 年专业训练不应是使用 AI 的门槛——fast.ai 和 Answer.AI 的核心使命 + 不追求学术发表,追求开放的实用工具——Answer.AI 与 fast.ai 的组织定位 +
+
+ + +
+ → llms.txt · Answer.AI + fast.ai / Answer.AI +
+
+ + diff --git a/site/src/content/cards/zh/entities/jerry-fodor.mdx b/site/src/content/cards/zh/entities/jerry-fodor.mdx new file mode 100644 index 0000000..cfba79e --- /dev/null +++ b/site/src/content/cards/zh/entities/jerry-fodor.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Jerry A. Fodor +titleAlt: Jerry A. Fodor +tagline: 1935-2017 · Rutgers/MIT · 思维语言 · 模块性 · Fodor&Pylyshyn 1988 联结主义挑战 +refs: + - concepts/language-of-thought + - concepts/systematicity + - concepts/compositionality +sourceLine: Fodor & Pylyshyn 1988 Cognition · Fodor 1975 The Language of Thought +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · JERRY FODOR · 1935–2017 · 思维语言 · 认知系统性 · 联结主义批判 + + + +

Jerry A. Fodor

+

哲学家、认知科学家(Rutgers / MIT)——思维语言假说与认知系统性论证奠基者

+
+ + + Fodor 是认知科学领域最具影响力的哲学家之一。1988 年与 Pylyshyn 合著的联结主义批判论文,是认知科学史上引用最广泛的文章之一——核心论证:联结主义无法解释人类认知的系统性,因为分布式表征缺乏组合性所需的句法组成结构。这直接触发了神经符号 AI 研究纲领的形成。 + + + +
+ 三大核心贡献 +
+ 1975 + 思维语言假说(LOTH) + 思维是对句法结构化符号表达式的计算,构成「心理语言」Mentalese +
+
+ 1983 + 心理模块性 + 认知系统由相对独立的领域特定模块组成;中央系统各向同性、不可封装 +
+
+ 1988 + 联结主义批判(与 Pylyshyn) + 「任何使系统性成为偶然的架构,都是错误的架构」——40 年后 LLM 提供了实证答案 +
+
+
+ 理论遗产 + Smolensky 的亚概念层理论是对 Fodor & Pylyshyn 的直接理论应对 + 40 年后 LLM 实证:规模提升系统性,但指令微调降低系统性——部分验证 Fodor 预测 +
+
+ + +
+ → Language of Thought · Systematicity · Compositionality + Fodor & Pylyshyn (1988) +
+
+ + diff --git a/site/src/content/cards/zh/entities/john-mackie.mdx b/site/src/content/cards/zh/entities/john-mackie.mdx new file mode 100644 index 0000000..0a8294b --- /dev/null +++ b/site/src/content/cards/zh/entities/john-mackie.mdx @@ -0,0 +1,85 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: J. L. Mackie +titleAlt: J. L. Mackie +tagline: 1917-1981 · INUS条件 · 规则性理论最重要技术贡献 · 因果场 · 道德错误论 +refs: + - concepts/inus-conditions + - concepts/regularity-theory + - entities/david-hume +sourceLine: SEP Regularity and Inferential Theories · Mackie 1965 · Mackie 1974 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · J.L. MACKIE · 1917–1981 · INUS 条件 · 规则性理论技术贡献 + + + +

J. L. Mackie

+

澳大利亚裔英国哲学家(1917–1981)——INUS 条件分析的提出者

+
+ + + Mackie 在「Causes and Conditions」(1965)中首次提出 INUS 条件分析:日常所说的「原因」是结果的「不充分但非冗余的,不必要但充分条件的组成部分」(Insufficient but Non-redundant part of an Unnecessary but Sufficient condition)。这是规则性理论传统中最具影响力的技术贡献,至今仍是法律因果推理的重要参考框架。 + + + +
+ INUS 条件解析 +
+ I + Insufficient + 单独不足以引起结果——X 不是充分条件 +
+
+ N + Non-redundant + 在所在的充分条件中不可缺少——X 是非冗余的 +
+
+ U + Unnecessary + 所在的充分条件不是必要条件——存在其他引起结果的方式 +
+
+ S + Sufficient + 所在的充分条件整体上足以引起结果 +
+
+
+ 其他贡献 + 因果分析的背景约束——同一事件在不同「场」中有不同的因果解释 + Ethics: Inventing Right and Wrong(1977)——道德判断系统性为假,因预设不存在的客观道德属性 + 直接继承并发展休谟的因果性分析,是规则性理论传统中的关键一环 +
+
+ + +
+ → INUS Conditions · Regularity Theory · David Hume + Mackie (1965 / 1974) +
+
+ + diff --git a/site/src/content/cards/zh/entities/karl-popper.mdx b/site/src/content/cards/zh/entities/karl-popper.mdx new file mode 100644 index 0000000..14d34c6 --- /dev/null +++ b/site/src/content/cards/zh/entities/karl-popper.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Karl Popper +titleAlt: Karl Popper +tagline: 1902-1994 · 证伪主义 · 接受归纳问题不可解 · 佐证vs确认 · 科学发现的逻辑 +refs: + - concepts/falsificationism + - concepts/induction-problem + - entities/david-hume +sourceLine: Popper 1935 Logic of Scientific Discovery · SEP Problem of Induction +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · KARL POPPER · 1902–1994 · 证伪主义 · 归纳问题接受者 · 批判理性主义 + + + +

Karl Popper

+

奥地利/英国科学哲学家(1902–1994)——证伪主义的创立者,批判理性主义代表

+
+ + + Popper 接受休谟的归纳问题为不可解决的,但提出科学不依赖归纳。证伪主义方案:科学通过大胆猜想和严格证伪推进,不通过归纳积累确认。证伪逻辑完全是演绎的(modus tollens):H → P,¬P,因此 ¬H。未被证伪的理论不是「被证实的」,只是「被佐证的」(corroborated)。 + + + +
+ 证伪主义方法论 +
+ 可证伪性标准 + 科学性的标志:能做出可能被经验否定的预测——将科学与非科学划界 +
+
+ 佐证 vs 确认 + 未被证伪的理论不是被归纳「确认」的,只是被暂时「佐证」的——拒绝确认逻辑 +
+
+ 确认与证伪的不对称 + 无法用有限数量的正例确认全称命题,但一个反例可以证伪——利用这一逻辑不对称 +
+
+
+ 核心局限 + 「佐证」概念:当多个未被证伪的假说矛盾时,为何选择佐证度高的?暗中引入了归纳直觉 + 接受归纳问题的起点相同,但解决方案不同——Popper 转向演绎,休谟转向习惯 + 可证伪性 ↔ 可测试的模型预测;佐证 ↔ 验证集表现——科学哲学与 ML 的结构对应 +
+
+ + +
+ → Falsificationism · Induction Problem · David Hume + Popper (1935 / 1963) +
+
+ + diff --git a/site/src/content/cards/zh/entities/langgraph.mdx b/site/src/content/cards/zh/entities/langgraph.mdx new file mode 100644 index 0000000..40d65a2 --- /dev/null +++ b/site/src/content/cards/zh/entities/langgraph.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LangGraph +titleAlt: LangGraph +tagline: LangChain · StateGraph显式编排 · 隐式循环的对比范式 · Durable Execution · 企业采用 +refs: + - concepts/implicit-loop-architecture + - entities/claude-agent-sdk + - entities/codex +sourceLine: LangGraph Documentation +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · LANGGRAPH · LangChain · 显式图架构 · 隐式循环对立范式 + + + +

LangGraph

+

LangChain 的低层 agent 编排框架——用 StateGraph 定义节点和边的有向图

+
+ + + LangGraph 是隐式循环架构(Claude Agent SDK、Codex)的主要对比范式,代表了 agent 编排的两极之一。显式图架构:流程在编译时确定,用 StateGraph 定义有向图中的节点和边,可预测性高,调试容易。被 Klarna、Uber、J.P. Morgan 等企业采用,主打 durable execution、human-in-the-loop 和内存管理。 + + + +
+ 两种编排范式对比 +
+
+ LangGraph(显式图) + 编译时确定流程 + 可预测性高,调试容易 + 灵活性低,依赖预设路径 +
+
+ 隐式循环(Claude/Codex) + 运行时模型自主决策 + 灵活性高,无需预设路径 + 可预测性低,依赖模型能力 +
+
+
+
+ LangGraph 特色功能 + 执行状态可持久化——任务中断后可从断点恢复,适合长时运行任务 + 内建对人类介入的支持——条件节点可暂停等待人类决策 + Klarna / Uber / J.P. Morgan——显式图的可审计性更适合企业合规需求 +
+
+ + +
+ → Implicit Loop Architecture · Claude Agent SDK · Codex + LangGraph Documentation +
+
+ + diff --git a/site/src/content/cards/zh/entities/lewis-fry-richardson.mdx b/site/src/content/cards/zh/entities/lewis-fry-richardson.mdx new file mode 100644 index 0000000..0bf01fd --- /dev/null +++ b/site/src/content/cards/zh/entities/lewis-fry-richardson.mdx @@ -0,0 +1,60 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Lewis Fry Richardson +titleAlt: Lewis Fry Richardson +tagline: 英国数学家气象学家 · 海岸线悖论经验发现者 · Richardson效应命名原型 · 数值天气预报先驱 +refs: + - concepts/richardson-effect + - concepts/coastline-paradox + - entities/benoit-mandelbrot +sourceLine: Wikipedia Coastline Paradox · Richardson 1961 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · LEWIS FRY RICHARDSON · 数学家气象学家 · 海岸线悖论发现者 · Richardson 效应 + + + +

Lewis Fry Richardson

+

英国数学家、物理学家、气象学家(1881–1953)——分形几何经验前驱

+
+ + + Richardson 在研究边界长度与战争概率关系时,注意到各国对同一边界报告的长度差异:葡萄牙报告其与西班牙的边界为 987 km,西班牙报告为 1214 km。追踪这一差异,他发现原因是测量单位不同,并进而发现了长度随单位缩短而系统性增长的普遍规律。Richardson 本人没有给出理论解释——Mandelbrot 后来将其与分形维数联系,赋予数学基础。 + + + +
+ 主要贡献 + 不规则边界的测量长度随测量单位缩短而单调递增——分形几何的经验前驱 + 系统收集和分析国际冲突数据,尝试用数学模型理解战争成因——「无意的」分形发现 + 最早提出用数值方法计算天气演变的设想——现代气象学的方法论先驱 +
+
+ 发现的意外性质 + 葡萄牙-西班牙边界的测量差异——不同测量单位导致,非政治争议 + Richardson 发现了规律但无法解释——Mandelbrot 1967 年完成了理论化 + 经验异常(measurement paradox)催生理论突破——Richardson Effect 是典型案例 +
+
+ + +
+ → Richardson Effect · Coastline Paradox · Benoit Mandelbrot + Richardson (1961) / Wikipedia +
+
+ + diff --git a/site/src/content/cards/zh/entities/linux-foundation.mdx b/site/src/content/cards/zh/entities/linux-foundation.mdx new file mode 100644 index 0000000..422e172 --- /dev/null +++ b/site/src/content/cards/zh/entities/linux-foundation.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Linux Foundation +titleAlt: Linux Foundation +tagline: 开源中立治理机构 · A2A协议托管方 · Kubernetes模式 · PyTorch Foundation +refs: + - concepts/a2a-protocol + - entities/google +sourceLine: Google A2A Protocol 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · LINUX FOUNDATION · 开源中立治理 · A2A 协议托管方 + + + +

Linux Foundation

+

开源技术的中立治理机构——当前 A2A 协议的托管方

+
+ + + A2A 协议由 Google 开发后捐赠给 Linux Foundation,以实现中立化治理——确保协议不被单一厂商控制,鼓励多方参与和贡献,目标是让 A2A 成为真正的行业标准。这是开源协议演进的标准路径,类比:Kubernetes 从 Google 内部项目捐赠给 CNCF(Cloud Native Computing Foundation),成为容器编排领域的行业标准。 + + + +
+ 开源协议中立化模式 +
+ Kubernetes 模式 + Google → CNCF → 容器编排行业标准 +
+
+ PyTorch 模式 + Meta → PyTorch Foundation(LF AI & Data)→ 深度学习框架标准 +
+
+ A2A 模式 + Google → Linux Foundation → agent 互操作协议行业标准 +
+
+
+ 中立化治理的必要性 + 中立机构托管 → 竞争对手愿意采用和贡献——OpenAI/Anthropic 等更容易加入 + 不被单一厂商控制 → 行业标准的可信度和持久性更高 + LF 的 AI/ML 项目群:PyTorch、Onnx、Kubeflow、Flyte、A2A——构建完整 AI 基础设施标准生态 +
+
+ + +
+ → A2A Protocol · Google + Google A2A (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/manus.mdx b/site/src/content/cards/zh/entities/manus.mdx new file mode 100644 index 0000000..5e823f4 --- /dev/null +++ b/site/src/content/cards/zh/entities/manus.mdx @@ -0,0 +1,82 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Manus +titleAlt: Manus +tagline: 通用自主agent · 5维Context Engineering框架 · prefill/decode 100:1 · logit masking +refs: + - concepts/context-engineering + - concepts/prefix-caching + - concepts/context-management +sourceLine: Manus Context Engineering Blog 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · MANUS · 通用自主 Agent · 5 维 Context Engineering 框架 · 生产经验 + + + +

Manus

+

AI agent 公司——以「Stochastic Graduate Descent」式迭代发展出生产验证的 context engineering 框架

+
+ + + Manus 历经四次架构重建,总结出 context engineering 五维框架。核心经济洞察:agent loop 的 prefill/decode 比例约 100:1,prefix cache 命中率是首要生产成本杠杆(Claude Sonnet:命中 $0.30/MTok vs 未命中 $3.00/MTok——10× 成本差)。 + + + +
+ 五维 Context Engineering 框架 +
+ Offloading + 文件系统作为无限外部 memory,零 token 成本——把内容「移出」context +
+
+ Reduction + 仅限可恢复压缩(保留路径/URL 指针)——防止信息永久丢失 +
+
+ Retrieval + 文件搜索工具作为结构化检索层——按需加载而非全部载入 +
+
+ Isolation + 子 agent 在独立 context window 中运行——隔离避免干扰 +
+
+ Caching + Stable prefix + session affinity 路由——最大化 prefix cache 命中率 +
+
+
+ 代表性技术决策 + 修改 tools 数组破坏 KV cache,改用解码阶段 logit masking 约束动作空间 + 每次迭代更新 todo.md,将全局计划维持在 context 近期位置——对抗「中间迷失」 + 保留失败记录为模型提供隐式 belief update,错误恢复行为自然涌现 +
+
+ + +
+ → Context Engineering · Prefix Caching · Context Management + Manus Blog (2025) +
+
+ + diff --git a/site/src/content/cards/zh/entities/max-tegmark.mdx b/site/src/content/cards/zh/entities/max-tegmark.mdx new file mode 100644 index 0000000..ab44e40 --- /dev/null +++ b/site/src/content/cards/zh/entities/max-tegmark.mdx @@ -0,0 +1,65 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Max Tegmark +titleAlt: Max Tegmark +tagline: MIT物理学家 · 数学宇宙假说 · Future of Life Institute · 时空世界模型共同作者 +refs: + - concepts/spatiotemporal-world-model + - entities/wes-gurnee +sourceLine: Gurnee & Tegmark ICLR 2024 arXiv:2310.02207 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · MAX TEGMARK · MIT 物理 · 时空世界模型 · FLI 联合创始人 + + + +

Max Tegmark

+

MIT 宇宙学家——将物理学量化方法引入 LLM 内部表征研究

+
+ + + Tegmark 是知名宇宙学家,以数学宇宙假说和《Our Mathematical Universe》(2014)著称。他同时是 AI 安全领域积极参与者,Future of Life Institute(FLI)联合创始人,2017 年阿西洛马 AI 原则倡导者之一。在 AI 可解释性领域,他将物理学的量化方法引入 LLM 内部表征研究,侧重于发现神经网络中的结构化、可测量规律。 + + + +
+ AI 内部表征研究 +
+ 2023 + Language Models Represent Space and Time(与 Wes Gurnee) +
+
发表于 ICLR 2024。将物理学探针方法用于量化 LLM 对时空坐标的编码能力——Llama-2 系列线性探针 R²=0.911(空间)/ 0.835(时间)
+
+
+ 「物理学家看 AI」视角 + 关注神经网络表征的几何结构、可量化性和普遍规律,而非工程实现细节 + 多篇关于神经网络中涌现和相变现象的工作——物理相变理论对 AI 的迁移 + FLI 联合创始人——从可解释性研究到 AI 安全政策的跨越 +
+
+ + +
+ → Spatiotemporal World Model · Wes Gurnee + Gurnee & Tegmark (ICLR 2024) +
+
+ + From 5d2838686ca93f77b605707d76f9c484e0fa392c Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 19:23:22 +0800 Subject: [PATCH 34/48] =?UTF-8?q?feat(cards):=20batch=2012/18=20=E2=80=94?= =?UTF-8?q?=20entities/maximilian-schall=E2=86=92wesley-salmon=20+=20sourc?= =?UTF-8?q?es/[2012.05876,2210.13382]=20(15=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- .../cards/zh/entities/maximilian-schall.mdx | 73 ++++++++++++++ site/src/content/cards/zh/entities/mcp.mdx | 77 +++++++++++++++ site/src/content/cards/zh/entities/memgpt.mdx | 80 ++++++++++++++++ .../content/cards/zh/entities/neel-nanda.mdx | 75 +++++++++++++++ .../cards/zh/entities/nelson-goodman.mdx | 80 ++++++++++++++++ site/src/content/cards/zh/entities/openai.mdx | 75 +++++++++++++++ .../content/cards/zh/entities/openhands.mdx | 81 ++++++++++++++++ .../cards/zh/entities/paul-smolensky.mdx | 80 ++++++++++++++++ .../content/cards/zh/entities/rich-sutton.mdx | 78 +++++++++++++++ .../content/cards/zh/entities/swe-bench.mdx | 79 ++++++++++++++++ .../cards/zh/entities/thomas-bayes.mdx | 76 +++++++++++++++ .../content/cards/zh/entities/wes-gurnee.mdx | 78 +++++++++++++++ .../cards/zh/entities/wesley-salmon.mdx | 74 +++++++++++++++ ...2012.05876-neurosymbolic-ai-third-wave.mdx | 94 +++++++++++++++++++ ...gent-world-representations-othello-gpt.mdx | 77 +++++++++++++++ 15 files changed, 1177 insertions(+) create mode 100644 site/src/content/cards/zh/entities/maximilian-schall.mdx create mode 100644 site/src/content/cards/zh/entities/mcp.mdx create mode 100644 site/src/content/cards/zh/entities/memgpt.mdx create mode 100644 site/src/content/cards/zh/entities/neel-nanda.mdx create mode 100644 site/src/content/cards/zh/entities/nelson-goodman.mdx create mode 100644 site/src/content/cards/zh/entities/openai.mdx create mode 100644 site/src/content/cards/zh/entities/openhands.mdx create mode 100644 site/src/content/cards/zh/entities/paul-smolensky.mdx create mode 100644 site/src/content/cards/zh/entities/rich-sutton.mdx create mode 100644 site/src/content/cards/zh/entities/swe-bench.mdx create mode 100644 site/src/content/cards/zh/entities/thomas-bayes.mdx create mode 100644 site/src/content/cards/zh/entities/wes-gurnee.mdx create mode 100644 site/src/content/cards/zh/entities/wesley-salmon.mdx create mode 100644 site/src/content/cards/zh/sources/2012.05876-neurosymbolic-ai-third-wave.mdx create mode 100644 site/src/content/cards/zh/sources/2210.13382-emergent-world-representations-othello-gpt.mdx diff --git a/site/src/content/cards/zh/entities/maximilian-schall.mdx b/site/src/content/cards/zh/entities/maximilian-schall.mdx new file mode 100644 index 0000000..cbc65e5 --- /dev/null +++ b/site/src/content/cards/zh/entities/maximilian-schall.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Maximilian Schall +titleAlt: Maximilian Schall +tagline: NLP研究者 · 轨迹偏差命名者 · Draft-Conditioned解法 · RANLP 2025 +refs: + - concepts/trajectory-bias + - concepts/constrained-decoding + - concepts/structured-outputs +sourceLine: RANLP 2025 arXiv:2603.03305 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · MAXIMILIAN SCHALL · NLP 研究者 · 轨迹偏差 · RANLP 2025 + + + +

Maximilian Schall

+

NLP 研究者——与 Gerard de Melo 合作,首次系统性证明约束解码的语义代价

+
+ + + Schall 与 de Melo 合作,通过对 11 个模型的跨基准实验,命名并实证了「轨迹偏差」——约束解码在保持句法合规的同时,系统性损害语义正确性。这是约束解码代价的首个大规模量化研究。 + + + +
+ 主要研究 +
+ 2025 + The Hidden Cost of Structure(RANLP 2025) + 首次系统性证明约束解码句法合规 vs 语义正确的权衡——11 个模型,跨基准实验 +
+
+ 2025 + Draft-Conditioned Constrained Decoding(arXiv:2603.03305) + 与 Castillo、de Melo 合作——两阶段分离(草稿生成 + 格式约束)缓解轨迹偏差的算法解 +
+
+
+ 核心发现 + 约束下两类模型行为分歧显著——指令微调模型更脆弱,约束对其语义损害更大 + 先自由生成草稿(保持语义完整性),再用约束解码格式化——解耦语义生成与格式约束 + 约束解码不是「免费的午餐」——格式合规的代价是可量化的语义偏差 +
+
+ + +
+ → Trajectory Bias · Constrained Decoding · Structured Outputs + RANLP 2025 / arXiv:2603.03305 +
+
+ + diff --git a/site/src/content/cards/zh/entities/mcp.mdx b/site/src/content/cards/zh/entities/mcp.mdx new file mode 100644 index 0000000..31eca56 --- /dev/null +++ b/site/src/content/cards/zh/entities/mcp.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: MCP +titleAlt: Model Context Protocol +tagline: Anthropic开放协议 · Agent↔工具标准接口 · A2A互补 · Mobile-MCP扩展 +refs: + - concepts/augmented-llm + - concepts/a2a-protocol + - entities/anthropic +sourceLine: Anthropic Building Effective Agents 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · MCP · Model Context Protocol · Anthropic · Agent ↔ 工具标准接口 + + + +

MCP — Model Context Protocol

+

Anthropic 推出的开放协议——标准化 LLM 与外部工具、数据源的集成接口

+
+ + + MCP 通过 JSON-RPC 规范 agent 与工具之间的调用语义,是「增强型 LLM」接入第三方工具生态的标准路径。与 A2A 协议互补:MCP 负责 Agent ↔ 工具通信,A2A 负责 Agent ↔ Agent 通信。 + + + +
+ MCP vs A2A:互补协议 +
+
维度
+
MCP
+
A2A
+
连接对象
+
Agent ↔ 工具/数据
+
Agent ↔ Agent
+
通信性质
+
无状态函数调用
+
有状态任务委派
+
发现机制
+
JSON Schema 能力描述
+
Agent Card 端点
+
+
+
+ 协议路线 vs CLI 路线 + JSON-RPC 跨边界通信、权限审计、双向流——标准化工具接入的「协议层」 + 自动生成 CLI + POSIX 原语——无需协议层,明确不走 MCP + 两条路线非零和——CLI 实现可包裹在 MCP Server 内暴露,分层协作 + 通过 Android IPC 将 MCP 从桌面/云端扩展至移动端原生应用能力 +
+
+ + +
+ → Augmented LLM · A2A Protocol · Anthropic · CLI-Anything + Anthropic (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/memgpt.mdx b/site/src/content/cards/zh/entities/memgpt.mdx new file mode 100644 index 0000000..86b9f33 --- /dev/null +++ b/site/src/content/cards/zh/entities/memgpt.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: MemGPT +titleAlt: Memory-GPT +tagline: UC Berkeley · 虚拟上下文管理 · LLM as OS · 层次化存储 · arXiv:2310.08560 +refs: + - concepts/virtual-context-management + - concepts/context-management + - entities/aios +sourceLine: MemGPT arXiv:2310.08560 (2023) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · MEMGPT · UC Berkeley · LLM as OS · 虚拟上下文管理 · 2023 + + + +

MemGPT

+

将 OS 层次化内存管理思想引入 LLM 上下文管理——"Towards LLMs as Operating Systems"

+
+ + + MemGPT(Packer、Stoica、Gonzalez 等,2023)将操作系统的虚拟内存概念映射到 LLM:main context 类似 RAM,archival/recall memory 类似磁盘。LLM 通过函数调用自主决定何时换页——这是「LLM as OS」架构思路的关键系统实现。 + + + +
+ MemGPT vs AIOS:同源异流 +
+
维度
+
MemGPT
+
AIOS
+
焦点
+
单 agent 上下文扩展
+
多 agent 资源管理
+
OS 概念
+
虚拟内存分层
+
完整内核调度
+
调度方
+
LLM 自主换页
+
Kernel 集中调度
+
解决问题
+
Context window 太小
+
并发 agent 抢资源
+
+
+
+ 核心机制 + 活跃工作内存——当前对话、任务状态、近期记忆 + 长期持久存储——历史对话、积累知识,按需检索 + 控制流在管理系统与用户之间切换——实现长期会话的自然暂停恢复 + Anthropic structured note-taking、Codex compaction——层次化思路在生产中的落地 +
+
+ + +
+ → Virtual Context Management · Context Management · AIOS + arXiv:2310.08560 (2023) +
+
+ + diff --git a/site/src/content/cards/zh/entities/neel-nanda.mdx b/site/src/content/cards/zh/entities/neel-nanda.mdx new file mode 100644 index 0000000..c17c629 --- /dev/null +++ b/site/src/content/cards/zh/entities/neel-nanda.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Neel Nanda +titleAlt: Neel Nanda +tagline: Google DeepMind · TransformerLens开发者 · MATS导师 · OthelloGPT线性化 · 机制可解释性 +refs: + - concepts/mechanistic-interpretability + - concepts/othello-world-model-hypothesis + - concepts/linear-representation-hypothesis +sourceLine: Nanda et al. BlackboxNLP @ EMNLP 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · NEEL NANDA · Google DeepMind · TransformerLens · MATS · 机制可解释性 + + + +

Neel Nanda

+

Google DeepMind 可解释性研究员——机制可解释性领域的核心基础设施建设者

+
+ + + Nanda 开发了 TransformerLens——MI 领域最广泛使用的开源工具库,提供干净的 hook API 和残差流分解支持。他主导 MATS(ML Alignment Theory Scholars)研究训练计划,同时对 OthelloGPT 的表征研究作出关键贡献:发现正确的特征坐标系(MINE/YOURS/EMPTY)使线性探针准确率从 ~75% 跃升至 ~99%。 + + + +
+ 核心贡献 +
+ TransformerLens + MI 领域标准工具库——hook API 可在任意位置读取/修改激活,支持残差流分解、注意力模式分析 +
+
+ MATS 研究训练计划 + 密集 MI 研究项目——jylin04 的 OthelloGPT「Bag of Heuristics」即来自 MATS 6.0(2024 夏) +
+
+ OthelloGPT 线性化(2023) + 与 Lee、Wattenberg 合作——MINE/YOURS/EMPTY 坐标系修正,线性探针从 ~75% 跃升至 ~99% +
+
+
+ 方法论洞察 + Li et al. 非线性探针结论的根源是错误的特征坐标系,而非表征本身的非线性 + 提出单次线性向量加法干预法——比 Li et al. 的梯度迭代干预更简洁有效 + 对小型 transformer 玩具任务(模块加法)的电路分析,发现算法相变和 grokking 现象 +
+
+ + +
+ → Mechanistic Interpretability · Othello World Model · Linear Representation + BlackboxNLP @ EMNLP 2023 +
+
+ + diff --git a/site/src/content/cards/zh/entities/nelson-goodman.mdx b/site/src/content/cards/zh/entities/nelson-goodman.mdx new file mode 100644 index 0000000..bcd2896 --- /dev/null +++ b/site/src/content/cards/zh/entities/nelson-goodman.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Nelson Goodman +titleAlt: Nelson Goodman +tagline: 美国哲学家 · Grue问题 · 新归纳之谜 · 构造主义世界观 · 符号理论 +refs: + - concepts/grue-problem + - concepts/induction-problem + - entities/david-hume +sourceLine: Goodman 1955 Fact Fiction and Forecast +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · NELSON GOODMAN · 哲学家 · Grue 问题 · 新归纳之谜 · 1906–1998 + + + +

Nelson Goodman

+

美国哲学家(1906–1998)——将归纳问题从「是否合理」推进到「哪些合理」

+
+ + + Goodman 在《事实、虚构与预测》(1955)中提出 grue 问题:同一组观察数据可支持互相矛盾的归纳结论——区别仅在于所用谓词。「绿色」是可投射的,「grue」不是。这一「新归纳之谜」证明休谟从未解释过为什么我们投射某些谓词而非其他。 + + + +
+ Grue 问题的逻辑结构 +
+ Grue 的定义 + 某物是 grue 当且仅当:它在 2100 年前被检验时是绿色,或在 2100 年后被检验时是蓝色 +
+
+
+ 观察:所有已检验的翡翠都是绿色 +
+
+ 归纳 A:所有翡翠都是绿色 ✓ +
+
+ 归纳 B:所有翡翠都是 grue(2100 后变蓝)也同样成立! +
+
+
+
+ 主要著作与回应 + 提出 grue 问题——归纳逻辑的核心悖论 + 可投射性来自语言实践历史,而非世界客观结构——绿色因被频繁使用而「习惯化」 + 构造主义世界观——世界是被我们的符号系统构造出来的多元版本 + LLM 的投射模式由训练数据的语言分布决定,而非外部现实——Goodman 的习惯化理论对此有解释力 +
+
+ + +
+ → Grue Problem · Induction Problem · David Hume + Goodman (1955) +
+
+ + diff --git a/site/src/content/cards/zh/entities/openai.mdx b/site/src/content/cards/zh/entities/openai.mdx new file mode 100644 index 0000000..99e275d --- /dev/null +++ b/site/src/content/cards/zh/entities/openai.mdx @@ -0,0 +1,75 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: OpenAI +titleAlt: OpenAI +tagline: GPT系列 · Codex agent平台 · Harness Engineering方法论 · Agent Legibility · Structured Outputs +refs: + - concepts/harness-engineering + - concepts/implicit-loop-architecture + - entities/codex +sourceLine: OpenAI Harness Engineering / Structured Outputs 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · OPENAI · GPT · Codex · Harness Engineering · Agent Legibility + + + +

OpenAI

+

AI 研究公司——「全 agent 开发」极端视角的实践者,Harness Engineering 方法论的主要来源

+
+ + + OpenAI 从「agent 是主要开发者」的极端立场出发,发展出独特的 harness engineering 洞见:Repository 即知识系统,为 agent 可读性(legibility)而非人类优化代码,隐式循环架构的 Codex 实现。2024 年 Structured Outputs 将格式错误率从 ~11.97% 降至 {`<`}0.1%。 + + + +
+ Harness Engineering 核心洞见 +
+ Agent Legibility + 为 agent 可读性优化——代码、文档的组织应方便 agent 理解,而非仅方便人类 +
+
+ Repository as Knowledge + 代码仓库是 agent 的知识系统——结构和命名约定是 agent 导航的关键信号 +
+
+ Codex 隐式循环 + 云端沙箱 + 双向 JSON-RPC——隐式循环架构在生产级编码 agent 的实现 +
+
+
+ Structured Outputs(2024) + 将 JSON Schema 编译为上下文无关文法,推理时强制约束 token 采样 + 格式错误率从 11.97%(JSON mode)降至 0.1%(Structured Outputs evals 达到 0%) + 支持 JSON Schema 的递归嵌套结构——FSM 无法表达,需要上下文无关文法 +
+
+ + +
+ → Harness Engineering · Implicit Loop Architecture · Codex · Structured Outputs + OpenAI (2024) +
+
+ + diff --git a/site/src/content/cards/zh/entities/openhands.mdx b/site/src/content/cards/zh/entities/openhands.mdx new file mode 100644 index 0000000..26c4a41 --- /dev/null +++ b/site/src/content/cards/zh/entities/openhands.mdx @@ -0,0 +1,81 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: OpenHands +titleAlt: OpenHands +tagline: 开源多agent编码平台 · CodeActAgent · SWE-EVO基准框架 · 模型×框架性能函数 +refs: + - concepts/implicit-loop-architecture + - entities/swe-bench + - entities/codex +sourceLine: SWE-EVO arXiv:2512.18470 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · OPENHANDS · All Hands AI · CodeActAgent · 开源多 Agent 编码平台 + + + +

OpenHands

+

All Hands AI 开源多 agent 编码平台——SWE-EVO 基准评估框架之一

+
+ + + OpenHands 的 CodeActAgent 架构在 SWE-EVO 评估中揭示了关键现象:GLM-5 在 SWE-agent 上 37.5%,在 OpenHands 上仅 8.33%——即使同一个模型,框架差异导致极大性能分歧。这证明 agent 能力是「模型 × 框架」的函数,而非模型本身的固有属性。 + + + +
+ 框架对比 +
+
框架
+
架构
+
特点
+
OpenHands
+
CodeActAgent
+
多 agent 平台,统一行动空间
+
SWE-agent
+
单 agent
+
强调 agent-computer interface 设计
+
Codex
+
隐式循环
+
云端沙箱,双向 JSON-RPC
+
LangGraph
+
显式图编排
+
StateGraph 节点和边
+
+
+
+ 关键洞见 + 同一模型在不同框架上相差 4.5 倍——框架 prompt 风格和交互模式决定性地影响表现 + 不存在「模型固有 agent 能力」——评估结果总是特定框架下的结果 + SWE-EVO 设置下的迭代上限——长时运行任务的资源边界 +
+
+ + +
+ → Implicit Loop Architecture · SWE-Bench · Codex · LangGraph + SWE-EVO arXiv:2512.18470 +
+
+ + diff --git a/site/src/content/cards/zh/entities/paul-smolensky.mdx b/site/src/content/cards/zh/entities/paul-smolensky.mdx new file mode 100644 index 0000000..3240302 --- /dev/null +++ b/site/src/content/cards/zh/entities/paul-smolensky.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Paul Smolensky +titleAlt: Paul Smolensky +tagline: 约翰斯·霍普金斯 · 调和理论 · 亚概念层理论 · 张量积表征 · 优化理论音系学 +refs: + - concepts/subconceptual-level + - concepts/compositionality + - entities/jerry-fodor +sourceLine: Smolensky 1988 Behavioral and Brain Sciences +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · PAUL SMOLENSKY · 联结主义理论家 · 亚概念层 · 张量积表征 · 1955– + + + +

Paul Smolensky

+

约翰斯·霍普金斯大学认知科学家——联结主义认知科学最完整的理论框架建构者

+
+ + + Smolensky(1988)直接回应了 Fodor & Pylyshyn 的符号主义批判,提出亚概念层理论:联结主义运作于神经生物学层和符号/概念层之间,符号规则是亚概念动力学的近似宏观描述——而非底层机制的字面描述。这是认知科学史上最重要的靶论文之一(附 40+ 篇同行评论)。 + + + +
+ 四大理论贡献 +
+ 调和理论(1986–1988) + 认知是全局调和函数的最大化——衡量激活状态对网络权重编码的软约束满足程度 +
+
+ 亚概念层理论(1988) + 联结主义的中间层次——符号规则是宏观近似,不是底层机制的字面描述 +
+
+ 张量积表征(1990) + 角色-填充者绑定的张量积叠加——将组合性嵌入联结主义的最系统尝试 +
+
+ 优化理论 OT(1993,与 Prince) + 调和理论应用于音系学——成为现代生成音系学的主流框架 +
+
+
+ 历史地位与影响 + 1988 年两篇论文——认知科学最著名的理论争论,至今未完全解决 + LLM 的涌现能力和隐式规则正是「亚概念动力学产生宏观符号行为」的实证 + Garcez & Lamb 的神经符号第三波部分继承了亚概念层理论 +
+
+ + +
+ → Subconceptual Level · Compositionality · Jerry Fodor + Smolensky (1988) BBS +
+
+ + diff --git a/site/src/content/cards/zh/entities/rich-sutton.mdx b/site/src/content/cards/zh/entities/rich-sutton.mdx new file mode 100644 index 0000000..1bacfc2 --- /dev/null +++ b/site/src/content/cards/zh/entities/rich-sutton.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Rich Sutton +titleAlt: Rich Sutton +tagline: 强化学习奠基人 · The Bitter Lesson 2019 · 通用计算方法总是胜出 · 持续剥离假设 +refs: + - concepts/harness-engineering + - concepts/meta-harness + - entities/anthropic +sourceLine: Sutton The Bitter Lesson 2019 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · RICH SUTTON · 强化学习奠基人 · The Bitter Lesson · 阿尔伯塔大学 + + + +

Rich Sutton

+

加拿大计算机科学家、强化学习奠基人——「苦涩教训」对 agent engineering 的理论支撑

+
+ + + Sutton 的 2019 年短文 The Bitter Lesson 核心论点:AI 研究 70 年的历史证明,通用计算方法(搜索 + 学习)总是最终胜出——人类知识的内建短期有效但长期阻碍进展。这一论断成为 agent harness 工程中「持续剥离假设」和 meta-harness 架构的理论基础。 + + + +
+ The Bitter Lesson 的核心论据 +
+ 国际象棋(Deep Blue) + 人类知识编码短期领先 → 通用搜索最终胜出 +
+
+ 围棋(AlphaGo) + 专家知识嵌入 → 自对弈学习(Alpha Zero)最终胜出 +
+
+ 语音识别 + HMM 手工特征 → 端到端深度学习最终胜出 +
+
+ NLP + 语言学规则 → 统计方法 → LLM 通用预训练胜出 +
+
+
+ 对 Agent Engineering 的含义 + 当前有效的 harness 约束未来会被模型能力取代——设计时留出剥离路径 + 不编码具体策略,而是编码让模型自主发现策略的机制——苦涩教训的 harness 实践 + Sutton 不做 agent 工程,但他的框架是理解 harness 演化方向的关键视角 +
+
+ + +
+ → Harness Engineering · Meta-Harness · Anthropic + Sutton (2019) +
+
+ + diff --git a/site/src/content/cards/zh/entities/swe-bench.mdx b/site/src/content/cards/zh/entities/swe-bench.mdx new file mode 100644 index 0000000..4d42ca0 --- /dev/null +++ b/site/src/content/cards/zh/entities/swe-bench.mdx @@ -0,0 +1,79 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: SWE-Bench +titleAlt: SWE-Bench +tagline: Princeton NLP · 编码Agent评估事实标准 · GitHub Issue修复 · SWE-Bench Verified · 72.8%饱和 +refs: + - concepts/software-evolution-benchmark + - concepts/error-cascade + - entities/openhands +sourceLine: SWE-EVO arXiv:2512.18470 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · SWE-BENCH · Princeton NLP · 编码 Agent 事实标准 · 单 Issue → 单 PR + + + +

SWE-Bench

+

Princeton NLP Group 发布的 AI 编码 agent 评估基准——从真实 GitHub issue 构造任务

+
+ + + SWE-Bench 以「单个 GitHub issue → 单个 PR → FAIL→PASS 测试验证」作为任务单元,已成为编码 agent 的事实标准。截至 2025–2026,前沿模型(GPT-5.2)在 Verified 子集上达到 ~72.8%,排行榜增长趋于平缓,推动了更长程基准的出现。 + + + +
+ SWE-Bench vs SWE-EVO +
+
维度
+
SWE-Bench
+
SWE-EVO
+
任务粒度
+
单个 issue / PR
+
版本间 release notes
+
文件范围
+
通常 1–2 个文件
+
平均 21 个文件
+
测试量
+
几个测试
+
平均 874 个测试
+
最好成绩
+
~72.8%(GPT-5.2)
+
~25%(饱和时对比)
+
+
+
+ 基准设计 + GitHub issue 描述 + 对应仓库代码快照 + FAIL→PASS 测试全部通过 + PASS→PASS 测试无回归 + 72.8% 的饱和推动了 SWE-EVO 等长程基准的出现——单步能力无法外推到多步任务 +
+
+ + +
+ → Software Evolution Benchmark · Error Cascade · OpenHands + SWE-EVO arXiv:2512.18470 +
+
+ + diff --git a/site/src/content/cards/zh/entities/thomas-bayes.mdx b/site/src/content/cards/zh/entities/thomas-bayes.mdx new file mode 100644 index 0000000..7b432a0 --- /dev/null +++ b/site/src/content/cards/zh/entities/thomas-bayes.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Thomas Bayes +titleAlt: Thomas Bayes +tagline: 英国牧师数学家 · 贝叶斯定理 · 逆概率方法 · 1764遗著 · 归纳问题的概率回应 +refs: + - concepts/bayesian-induction + - concepts/induction-problem + - entities/david-hume +sourceLine: Bayes 1764 Philosophical Transactions +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · THOMAS BAYES · 长老会牧师 · 数学家 · 逆概率 · 1701–1761 + + + +

Thomas Bayes

+

英国牧师、数学家(1701–1761)——逆概率方法开创者,贝叶斯定理命名者

+
+ + + Bayes 开创了「逆概率」方法——从观察到的样本推断产生该样本的假说概率。他的论文(1764,遗著,由 Richard Price 整理)可能是对休谟 1748 年《人类理解研究》中归纳问题的直接回应——用概率论为「从过去到未来的推理」提供数学基础。 + + + +
+ 逆概率的逻辑 +
+ 正向概率(传统) + 已知假说 H,求观察 E 出现的概率:P(E | H) +
+
+ 逆概率(Bayes 的贡献) + 已知观察 E,求假说 H 为真的概率:P(H | E) ∝ P(E | H) · P(H) +
+
+ 与休谟的关系 + 休谟问:为何过去规律适用于未来?Bayes:每一次新观察都更新假说置信度,归纳推理是概率更新 +
+
+
+ 历史地位 + 1761 年去世后由 Richard Price 整理,1764 年发表于 Philosophical Transactions + Laplace 后来独立推广为贝叶斯定理,赋予完整数学形式 + 贝叶斯框架将归纳合理性从「真/假」转化为「置信度更新」——最精确的归纳回应之一 + 贝叶斯推断是机器学习核心——从朴素贝叶斯到 MCMC,「逆概率」方法渗透 AI 全域 +
+
+ + +
+ → Bayesian Induction · Induction Problem · David Hume + Bayes (1764) +
+
+ + diff --git a/site/src/content/cards/zh/entities/wes-gurnee.mdx b/site/src/content/cards/zh/entities/wes-gurnee.mdx new file mode 100644 index 0000000..41dc356 --- /dev/null +++ b/site/src/content/cards/zh/entities/wes-gurnee.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Wes Gurnee +titleAlt: Wes Gurnee +tagline: MIT · LLM可解释性 · 时空表征R²=0.911/0.835 · 稀疏探针 · ICLR 2024共同作者 +refs: + - concepts/spatiotemporal-world-model + - concepts/linear-representation-hypothesis + - entities/max-tegmark +sourceLine: Gurnee & Tegmark ICLR 2024 arXiv:2310.02207 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · WES GURNEE · MIT · LLM 可解释性 · 时空世界模型 · 稀疏探针 + + + +

Wes Gurnee

+

MIT 可解释性研究员——大规模实证 + 线性探针 + 因果干预的系统验证方法

+
+ + + Gurnee 与 Max Tegmark 合作,以 6 个时空数据集(累计 {">"}18 万样本)系统证明 Llama-2 内部存在真实世界地理坐标和历史时间坐标的线性表征,并定位了个体「空间神经元」和「时间神经元」——空间探针 R²=0.911,时间探针 R²=0.835。 + + + +
+ 时空表征关键结果(Llama-2 系列) +
+
+ R² = 0.911 + 空间表征 + 地理坐标线性探针——6 个空间数据集验证 +
+
+ R² = 0.835 + 时间表征 + 历史时间坐标线性探针——年代序列验证 +
+
+
神经元消融验证因果性——干预「空间神经元」改变空间预测,证明非相关性而是因果作用
+
+
+ 研究方法特征 + 18 万+ 样本,6 个时空数据集——反对小样本个案分析 + 对所有 transformer 层做线性探针——识别表征的层次分布 + Finding Neurons in a Haystack——用极少数神经元定位编码特定信息的位置 +
+
+ + +
+ → Spatiotemporal World Model · Linear Representation · Max Tegmark + ICLR 2024 arXiv:2310.02207 +
+
+ + diff --git a/site/src/content/cards/zh/entities/wesley-salmon.mdx b/site/src/content/cards/zh/entities/wesley-salmon.mdx new file mode 100644 index 0000000..00affdd --- /dev/null +++ b/site/src/content/cards/zh/entities/wesley-salmon.mdx @@ -0,0 +1,74 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Wesley Salmon +titleAlt: Wesley Salmon +tagline: 科学哲学家 · 过程因果理论 · 标记传递 · 因果-机制解释模型 · 1925-2001 +refs: + - concepts/process-theories + - concepts/preemption + - entities/james-woodward +sourceLine: Salmon 1984 Scientific Explanation and the Causal Structure of the World +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 实体 · WESLEY SALMON · 匹兹堡大学 · 过程因果理论 · 标记传递 · 1925–2001 + + + +

Wesley Salmon

+

美国科学哲学家(1925–2001)——过程理论的主要奠基者,因果结构的物理世界锚定

+
+ + + Salmon 的核心贡献是用「标记传递」区分因果过程与伪过程:因果过程可以传递标记(marks),伪过程不能。运动的球是因果过程(标记随球移动),移动的影子是伪过程(在影子某点放置标记不会随影子移动)。这将因果关系锚定在物理世界的真实连接中。 + + + +
+ 过程理论的核心区分 +
+ 因果过程 + 可传递标记(marks) + 运动的球:在球上做标记,标记随球移动到目的地 +
+
+ 伪过程 + 不能传递标记 + 移动的影子:在影子某点放置标记,影子移动后标记消失 +
+
+
+ 理论地位与局限 + 通过检查因果过程完整性区分先占者和备用者——过程理论的强项 + 预防中原因和结果之间没有物理过程连接——反事实理论更擅长处理 + Phil Dowe (1992, 2000) 用守恒量(能量、动量)替代标记——避免标记概念的自循环问题 + 科学解释本质是揭示现象背后的因果机制——反对覆盖律模型(D-N model) +
+
+ + +
+ → Process Theories · Preemption · James Woodward + Salmon (1984) +
+
+ + diff --git a/site/src/content/cards/zh/sources/2012.05876-neurosymbolic-ai-third-wave.mdx b/site/src/content/cards/zh/sources/2012.05876-neurosymbolic-ai-third-wave.mdx new file mode 100644 index 0000000..549a4b6 --- /dev/null +++ b/site/src/content/cards/zh/sources/2012.05876-neurosymbolic-ai-third-wave.mdx @@ -0,0 +1,94 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Neurosymbolic AI - The 3rd Wave +titleAlt: Neurosymbolic AI The 3rd Wave +tagline: Garcez & Lamb · Kautz六类分类法 · 分布式vs局部主义 · 忠实性原则 · AI Review 2023 +refs: + - concepts/neurosymbolic-ai + - concepts/neurosymbolic-ai-taxonomy + - entities/artur-garcez +sourceLine: Garcez & Lamb arXiv:2012.05876 AI Review 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · NEUROSYMBOLIC AI: THE 3RD WAVE · Garcez & Lamb · AI Review 2023 + + + +

Neurosymbolic AI: The 3rd Wave

+

Garcez & Lamb(2020/2023)——综合 20 年研究,重新定义神经符号集成的核心问题

+
+ + + 最重要的概念贡献:将争论从「神经 vs 符号」重新定位为「分布式 vs 局部主义表示」。神经网络用连续向量(擅长学习),符号系统用离散标识符(擅长推理)——两者天然互补,而非对立。量化不对称性:学习擅长存在量化(∃x),推理擅长全称量化(∀x)。 + + + +
+ Kautz 六类神经符号架构(耦合谱) +
+
+ Type 1 + Symbolic_Neuro_Symbolic + 符号输入→神经→符号输出(Transformer NLP) +
+
+ Type 2 + Symbolic[Neuro] + 符号框架内嵌神经组件(AlphaGo) +
+
+ Type 3 + Neuro;Symbolic + 任务专化松散耦合(NS-CL, deepProbLog) +
+
+ Type 4 + Neuro:Symbolic→Neuro + 符号知识编译进神经(Logical Neural Networks) +
+
+ Type 5–6 + Neuro_Symbolic / Neuro[Symbolic] + 软约束分布式集成 → 神经引擎内嵌符号推理(尚未完全实现) +
+
+
+
+ 核心原则 + XAI 的核心标准:对神经网络行为的描述准确度——LIME 等方法忠实性极低 + 三级因果(关联→干预→反事实)均可通过神经符号系统实现——纯神经无法 + Type 4/5 实现——符号规则(CFG)约束神经生成,但有轨迹偏差代价 +
+
+ + +
+ → Neurosymbolic AI · Kautz Taxonomy · Artur Garcez + arXiv:2012.05876 (2023) +
+
+ + diff --git a/site/src/content/cards/zh/sources/2210.13382-emergent-world-representations-othello-gpt.mdx b/site/src/content/cards/zh/sources/2210.13382-emergent-world-representations-othello-gpt.mdx new file mode 100644 index 0000000..a47e7ae --- /dev/null +++ b/site/src/content/cards/zh/sources/2210.13382-emergent-world-representations-othello-gpt.mdx @@ -0,0 +1,77 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: OthelloGPT - Emergent World Representations +titleAlt: Emergent World Representations OthelloGPT +tagline: Li et al. ICLR 2023 · 非线性探针 · 激活干预验证因果性 · 0.01%错误率 · 世界模型假说奠基 +refs: + - concepts/othello-world-model-hypothesis + - concepts/activation-intervention + - entities/neel-nanda +sourceLine: Li et al. arXiv:2210.13382 ICLR 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · OTHELLOGPT · Li et al. · ICLR 2023 · 世界模型假说奠基 · 激活干预 + + + +

OthelloGPT: Emergent World Representations

+

Li et al.(2022/ICLR 2023)——语言模型是「记忆表面统计」还是「构建内部世界模型」?

+
+ + + OthelloGPT 以受控实验(8 层 GPT,仅看着手序列,从未见棋盘几何)证明:模型不是靠记忆,而是构建了棋盘内部表征——合成数据错误率 0.01%,偏斜数据集测试排除序列记忆。棋盘状态以「非线性方式」编码于激活中(线性探针失败,MLP 探针成功)。 + + + +
+ 关键实验结果 +
+
设置
+
错误率
+
未训练基线
+
93.29%
+
合成数据训练
+
0.01%
+
偏斜数据集(反记忆测试)
+
0.02%
+
线性探针(失败)
+
{">"}20%(接近随机)
+
非线性探针 MLP(成功)
+
1.7–4.8%
+
+
+
+ 方法论贡献 + 梯度下降修改中间层激活至反事实棋盘状态 B' → 观察预测改变——从相关到因果 + 干预前平均错误 2.68,干预后 0.12——对训练分布外状态依然有效 + Nanda et al. (2023) 发现:MINE/YOURS/EMPTY 坐标系下线性探针达 ~99%——非线性结论部分是坐标系问题 +
+
+ + +
+ → Othello World Model Hypothesis · Activation Intervention · Neel Nanda + ICLR 2023 arXiv:2210.13382 +
+
+ + From 45abe971641f7669633d122456d59bf697ae8156 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 19:28:19 +0800 Subject: [PATCH 35/48] =?UTF-8?q?feat(cards):=20batch=2013/18=20=E2=80=94?= =?UTF-8?q?=20sources/[2309.00941=E2=86=92anthropic-building-effective-age?= =?UTF-8?q?nts]=20(12=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Sonnet 4.6 --- ...nt-linear-representations-world-models.mdx | 78 +++++++++++++++ ...nguage-models-represent-space-and-time.mdx | 96 +++++++++++++++++++ .../2311.03658-linear-rep-hypothesis.mdx | 76 +++++++++++++++ ...mpositionality-cognitive-architectures.mdx | 76 +++++++++++++++ ...eurosymbolic-ai-2024-systematic-review.mdx | 90 +++++++++++++++++ ...isiting-othello-world-model-hypothesis.mdx | 73 ++++++++++++++ .../agenticos-workshop-asplos-2026.mdx | 80 ++++++++++++++++ .../content/cards/zh/sources/ai21-jamba.mdx | 83 ++++++++++++++++ .../aios-llm-agent-operating-system.mdx | 78 +++++++++++++++ ...anthropic-biology-large-language-model.mdx | 85 ++++++++++++++++ ...ropic-building-agents-claude-agent-sdk.mdx | 84 ++++++++++++++++ .../anthropic-building-effective-agents.mdx | 86 +++++++++++++++++ 12 files changed, 985 insertions(+) create mode 100644 site/src/content/cards/zh/sources/2309.00941-emergent-linear-representations-world-models.mdx create mode 100644 site/src/content/cards/zh/sources/2310.02207-language-models-represent-space-and-time.mdx create mode 100644 site/src/content/cards/zh/sources/2311.03658-linear-rep-hypothesis.mdx create mode 100644 site/src/content/cards/zh/sources/2407.13419-from-words-to-worlds-compositionality-cognitive-architectures.mdx create mode 100644 site/src/content/cards/zh/sources/2501.05435-neurosymbolic-ai-2024-systematic-review.mdx create mode 100644 site/src/content/cards/zh/sources/2503.04421-revisiting-othello-world-model-hypothesis.mdx create mode 100644 site/src/content/cards/zh/sources/agenticos-workshop-asplos-2026.mdx create mode 100644 site/src/content/cards/zh/sources/ai21-jamba.mdx create mode 100644 site/src/content/cards/zh/sources/aios-llm-agent-operating-system.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-biology-large-language-model.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-building-agents-claude-agent-sdk.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-building-effective-agents.mdx diff --git a/site/src/content/cards/zh/sources/2309.00941-emergent-linear-representations-world-models.mdx b/site/src/content/cards/zh/sources/2309.00941-emergent-linear-representations-world-models.mdx new file mode 100644 index 0000000..5a37edf --- /dev/null +++ b/site/src/content/cards/zh/sources/2309.00941-emergent-linear-representations-world-models.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Emergent Linear Representations in World Models +titleAlt: Nanda et al. Emergent Linear Representations +tagline: Nanda Lee Wattenberg · Mine/Yours/Empty坐标系 · 线性探针~99% · 向量加法干预 · BlackboxNLP 2023 +refs: + - concepts/othello-world-model-hypothesis + - concepts/linear-representation-hypothesis + - concepts/activation-intervention +sourceLine: Nanda et al. arXiv:2309.00941 BlackboxNLP @ EMNLP 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · NANDA ET AL. 2023 · 线性表征 · OthelloGPT 坐标系修正 · EMNLP + + + +

Emergent Linear Representations in World Models

+

Nanda、Lee、Wattenberg(BlackboxNLP @ EMNLP 2023)——OthelloGPT 线性化的关键

+
+ + + Li et al. 发现非线性探针才能解码 OthelloGPT 棋盘表征(~75% 线性 vs ~98% 非线性)。Nanda et al. 找到了根源:标注坐标系错了。改用 Mine/Yours/Empty(行棋方视角)替代 Black/White/Empty(绝对颜色),线性探针准确率从 ~75% 跃升至 ~99%。表征本来就是线性的。 + + + +
+ 坐标系修正的效果 +
+
探针类型
+
坐标系
+
准确率
+
线性探针
+
Black/White/Empty(Li et al.)
+
~75%
+
非线性 MLP
+
Black/White/Empty(Li et al.)
+
~98%
+
线性探针
+
Mine/Yours/Empty(Nanda et al.)
+
~99%
+
+
+
+ 额外发现与方法贡献 + 单次加法修改激活——错误率 0.10,比梯度迭代(0.12)更简洁,Erasing 任务更优 + 线性编码每时间步被翻转棋子(F1 score 第 3 层后 {">"}96%) + 部分注意力头只关注奇数时间步(己方),另一些只关注偶数时间步(对方) + 终局前模型常先预测出着手再完成棋盘状态——并行电路而非单一算法 +
+
+ + +
+ → Othello World Model · Linear Representation · Activation Intervention + arXiv:2309.00941 (2023) +
+
+ + diff --git a/site/src/content/cards/zh/sources/2310.02207-language-models-represent-space-and-time.mdx b/site/src/content/cards/zh/sources/2310.02207-language-models-represent-space-and-time.mdx new file mode 100644 index 0000000..14525c4 --- /dev/null +++ b/site/src/content/cards/zh/sources/2310.02207-language-models-represent-space-and-time.mdx @@ -0,0 +1,96 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Language Models Represent Space and Time +titleAlt: Gurnee Tegmark Language Models Space Time +tagline: Gurnee & Tegmark · R²=0.911空间/0.835时间 · 6数据集18万样本 · 空间神经元 · ICLR 2024 +refs: + - concepts/spatiotemporal-world-model + - concepts/linear-representation-hypothesis + - entities/wes-gurnee +sourceLine: Gurnee & Tegmark arXiv:2310.02207 ICLR 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · GURNEE & TEGMARK · ICLR 2024 · 时空世界模型 · R²=0.911/0.835 + + + +

Language Models Represent Space and Time

+

Gurnee & Tegmark(MIT,ICLR 2024)——首次系统验证 LLM 内部的连续时空坐标线性表征

+
+ + + 用 6 个时空数据集(共 18 万+ 样本)对 Llama-2 系列全层扫描:空间探针 R²=0.911,时间探针 R²=0.835——线性探针与非线性 MLP 探针性能持平(0.911 vs 0.926),证明时空信息确实以线性方式编码,而非需要复杂非线性变换解码。 + + + +
+ 六个时空数据集 +
+
+ 世界地点 + 39,585 + R²=0.911 +
+
+ 美国地点 + 29,997 + +
+
+ 纽约市地点 + 19,838 + R²=0.359(最难) +
+
+ 历史人物(死亡年) + 37,539 + R²=0.835 +
+
+ 艺术品(发布年) + 31,321 + +
+
+ 新闻标题(发表年) + 28,389 + NYT 2010–2020 +
+
+
+
+ 关键发现 + 余弦相似度搜索定位高度对齐单神经元(Spearman {">"}0.7),消融验证因果作用 + 表征在约 60% 深度处达到峰值,对 prompt 鲁棒,大模型持续优于小模型 + 同一探针泛化到不同实体类型——统一表征,非分类别编码 +
+
+ + +
+ → Spatiotemporal World Model · Linear Representation · Wes Gurnee · Max Tegmark + ICLR 2024 arXiv:2310.02207 +
+
+ + diff --git a/site/src/content/cards/zh/sources/2311.03658-linear-rep-hypothesis.mdx b/site/src/content/cards/zh/sources/2311.03658-linear-rep-hypothesis.mdx new file mode 100644 index 0000000..6da5166 --- /dev/null +++ b/site/src/content/cards/zh/sources/2311.03658-linear-rep-hypothesis.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Linear Representation Hypothesis +titleAlt: Park Choe Veitch Linear Representation Hypothesis +tagline: Park Choe Veitch · 三种直觉统一 · 因果内积 · 可分离概念正交 · ICML 2024 +refs: + - concepts/linear-representation-hypothesis + - concepts/mechanistic-interpretability + - entities/wes-gurnee +sourceLine: Park et al. arXiv:2311.03658 ICML 2024 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · PARK CHOE VEITCH · ICML 2024 · LRH 严格形式化 · 因果内积 + + + +

The Linear Representation Hypothesis

+

Park、Choe、Veitch(U Chicago / Google,ICML 2024)——LRH 的严格数学形式化

+
+ + + 「线性表征假说」在经验上广为人知,但「线性表征」到底指什么?本文区分了三种不同直觉(子空间/测量/干预),用反事实变量形式化「概念」,提出因果内积——唯一使因果可分离概念在此内积下正交的内积,将三种直觉统一到同一数学框架。 + + + +
+ 三种线性表征直觉 +
+ 子空间(Subspace) + 反事实词对差值落在同一方向:queen-king ∥ woman-man +
+
+ 测量(Measurement) + 线性探针能预测概念值:这是法语还是英语? +
+
+ 干预(Intervention) + 沿方向向量修改激活改变目标概念而不影响其他 +
+
+
+ 因果内积的核心性质 + 唯一满足「因果可分离概念正交」条件的内积 + ⟨γ̄, γ̄'⟩_C = γ̄ᵀ Cov(γ)⁻¹ γ̄'(词汇非嵌入协方差逆加权) + 27 个概念的 block diagonal 结构——语义相似概念同块,因果可分离概念近似正交 + LLM 激活空间存在任意可逆线性变换的不可辨性——欧氏距离无语义意义 +
+
+ + +
+ → Linear Representation Hypothesis · Mechanistic Interpretability + ICML 2024 arXiv:2311.03658 +
+
+ + diff --git a/site/src/content/cards/zh/sources/2407.13419-from-words-to-worlds-compositionality-cognitive-architectures.mdx b/site/src/content/cards/zh/sources/2407.13419-from-words-to-worlds-compositionality-cognitive-architectures.mdx new file mode 100644 index 0000000..98fe03f --- /dev/null +++ b/site/src/content/cards/zh/sources/2407.13419-from-words-to-worlds-compositionality-cognitive-architectures.mdx @@ -0,0 +1,76 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: From Words to Worlds - Compositionality for Cognitive Architectures +titleAlt: Dhar Sogaard Compositionality LLM +tagline: Dhar & Søgaard · 规模提升组合性 · 指令微调降低组合性 · ICML 2024 Workshop +refs: + - concepts/systematicity + - concepts/compositionality + - entities/jerry-fodor +sourceLine: Dhar & Søgaard arXiv:2407.13419 ICML 2024 Workshop +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · DHAR & SØGAARD · ICML 2024 · LLM 组合性实证 · Fodor 预测重访 + + + +

From Words to Worlds: Compositionality for Cognitive Architectures

+

Dhar & Søgaard(ICML 2024 Workshop)——LLM 对 Fodor & Pylyshyn 1988 预测的实证检验

+
+ + + Fodor & Pylyshyn(1988)预言联结主义系统无法支持组合性。Dhar & Søgaard 用 12 个 LLM 测试三类组合性维度,发现:规模确实提升组合能力——部分否定了 Fodor 的悲观预测;但指令微调普遍降低组合能力——这与 Fodor 的核心关切一致:联结主义的系统性是训练偶然的,不是架构保证的。 + + + +
+ 三个组合性维度 +
+ 可替换性(ANTAILS) + 同义词替换不改变意义——最基础的组合性要求 +
+
+ 系统性(PLANE) + 在新语境中重组已知组合模式——直接对应 Fodor & Pylyshyn 的系统性概念 +
+
+ 过度泛化(COMPCOMB) + 区分组合性(trenchcoat=coat)和外心复合词(turncoat≠coat) +
+
+
+ 核心发现 + 4 个模型家族一致:规模增大,组合能力提升——联结主义并非完全无法支持组合性 + RLHF 优化目标与组合语义不对齐——Mistral 可替换性从 0.50 降至 0.30 + 「好舞者」的处理——类似儿童发展中更晚习得这类形容词 + 指令微调降低组合性与轨迹偏差机制相同——符号层约束与联结主义动力学的摩擦 +
+
+ + +
+ → Systematicity · Compositionality · Jerry Fodor · Paul Smolensky + ICML 2024 arXiv:2407.13419 +
+
+ + diff --git a/site/src/content/cards/zh/sources/2501.05435-neurosymbolic-ai-2024-systematic-review.mdx b/site/src/content/cards/zh/sources/2501.05435-neurosymbolic-ai-2024-systematic-review.mdx new file mode 100644 index 0000000..5bcd28b --- /dev/null +++ b/site/src/content/cards/zh/sources/2501.05435-neurosymbolic-ai-2024-systematic-review.mdx @@ -0,0 +1,90 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Neurosymbolic AI in 2024 - Systematic Review +titleAlt: Neurosymbolic AI 2024 Systematic Review PRISMA +tagline: PRISMA 167篇论文 · 五维功能分类 · 元认知仅5% · AlphaGeometry全谱案例 · 2025 +refs: + - concepts/neurosymbolic-ai + - concepts/neurosymbolic-ai-taxonomy + - concepts/system-1-vs-system-2 +sourceLine: arXiv:2501.05435 (2025) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · NSAI 2024 SYSTEMATIC REVIEW · PRISMA · 167 篇论文 · 五维分类 + + + +

Neuro-Symbolic AI in 2024: Systematic Review

+

PRISMA 系统综述(2025)——2020–2024 年 167 篇神经符号 AI 论文的功能分类与研究分布

+
+ + + 对 1,428 篇初始候选论文筛选出 167 篇(有公开代码库的同行评审),提出五维功能性分类——补充 Kautz 六类架构分类。最重要发现:元认知(Meta-Cognition)仅占 5%(8 篇),却被认为是通往 AGI 的关键门控能力。 + + + +
+ 五维功能分类(2020–2024 研究分布) +
+ 63% + 学习与推理(Learning & Inference) + 端到端可微推理,多源知识推理 +
+
+ 44% + 知识表示(Knowledge Representation) + 常识知识图谱,语义接地 +
+
+ 35% + 逻辑与推理(Logic & Reasoning) + 逻辑-概率集成,多跳推理 +
+
+ 28% + 可解释性与可信度(XAI) + 透明推理,偏见检测——严重欠缺 +
+
+ 5% + 元认知(Meta-Cognition) + 监控/评估/调整自身推理——最欠缺,但通往 AGI 的关键 +
+
+
+ AlphaGeometry:唯一全谱案例 + 学习推理 + 知识表示 + 逻辑推理 + 可解释性——唯一同时覆盖四个主区域的项目 + System 1/2「在大脑中并不真正存在」——框架有用但过简化,元认知比 S1/S2 切换更复杂 +
+
+ + +
+ → Neurosymbolic AI · Kautz Taxonomy · System 1 vs 2 + arXiv:2501.05435 (2025) +
+
+ + diff --git a/site/src/content/cards/zh/sources/2503.04421-revisiting-othello-world-model-hypothesis.mdx b/site/src/content/cards/zh/sources/2503.04421-revisiting-othello-world-model-hypothesis.mdx new file mode 100644 index 0000000..13d7a22 --- /dev/null +++ b/site/src/content/cards/zh/sources/2503.04421-revisiting-othello-world-model-hypothesis.mdx @@ -0,0 +1,73 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Revisiting the Othello World Model Hypothesis +titleAlt: Yuan Sogaard Revisiting OthelloGPT +tagline: Yuan & Søgaard · 7个LLM · Procrustes对齐93-96% · 2-hop退化 · ICLR 2025 +refs: + - concepts/othello-world-model-hypothesis + - concepts/world-models + - entities/neel-nanda +sourceLine: Yuan & Søgaard arXiv:2503.04421 ICLR 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · YUAN & SØGAARD · ICLR 2025 · OthelloGPT 重访 · 跨架构对齐 + + + +

Revisiting the Othello World Model Hypothesis

+

Yuan & Søgaard(哥本哈根大学,ICLR 2025)——跨架构 Procrustes 对齐验证世界模型假说

+
+ + + 将 OthelloGPT 实验扩展到 7 个 LLM(GPT-2、T5、Bart、Flan-T5、Mistral、LLaMA-2、Qwen2.5),用 Procrustes 表征对齐替代探针:无监督对齐精度达 96.1%——不同架构在序列预测压力下收敛到了相同的底层表征吸引子。但发现关键局限:2-hop 连续预测显著退化。 + + + +
+ 跨架构对齐结果 +
+ 有监督对齐(GPT-2 → Bart) + 93.1% 余弦相似度 +
+
+ 无监督对齐(Bart → Mistral) + 96.1% 余弦相似度 +
+
7 个模型:解码器(GPT-2, Mistral)+ 编码器-解码器(T5, Bart)均收敛到相同表征吸引子
+
+
+ 关键张力与解读 + 1-hop 着手预测近乎完美,2-hop 显著退化——棋盘表征精度 ≠ 战略规划能力 + MATS「Bag of Heuristics」:表征可以精确,但计算表征的机制仍然是分布式启发式规则聚合——两个层次的问题 + 潜在着手投影:预测的前 5 合法着手在嵌入空间中与目标格的空间相邻格最近——不仅学规则,还学棋盘几何 + Procrustes 对齐揭示全局表征组织,而非单一特征的存在性——比探针更强的方法论 +
+
+ + +
+ → Othello World Model Hypothesis · World Models · Neel Nanda + ICLR 2025 arXiv:2503.04421 +
+
+ + diff --git a/site/src/content/cards/zh/sources/agenticos-workshop-asplos-2026.mdx b/site/src/content/cards/zh/sources/agenticos-workshop-asplos-2026.mdx new file mode 100644 index 0000000..470e4e0 --- /dev/null +++ b/site/src/content/cards/zh/sources/agenticos-workshop-asplos-2026.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AgenticOS Workshop @ ASPLOS 2026 +titleAlt: AgenticOS Workshop ASPLOS 2026 +tagline: ASPLOS 2026 · Agent基础设施OS级设计 · Fork-Explore-Commit · Mobile-MCP · 执行问题 +refs: + - concepts/agent-os + - concepts/harness-engineering + - entities/asplos +sourceLine: AgenticOS Workshop ASPLOS 2026-03-23 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · AGENTICOS WORKSHOP · ASPLOS 2026 · OS 级 Agent 基础设施 · 系统社区首次 + + + +

AgenticOS Workshop @ ASPLOS 2026

+

学术系统社区首次聚焦 AI agent 基础设施的 OS 级设计——2026-03-23,匹兹堡

+
+ + + 核心观点:「Agents Are Not Just a Model Problem. They Are an Execution Problem.」大部分 agent 失败不是因为模型不够强,而是因为执行基础设施不匹配。传统 OS 抽象(进程、线程、文件)从未为动态的、语义丰富的 agent 负载而设计——OS 本身需要变得 agentic。 + + + +
+ 关键论文 +
+ Fork, Explore, Commit + OS 原语支持 agent 探索式执行——git 分支语义的系统级实现 +
+
+ Skill OS + 技能是新的应用程序——OS 级的技能管理和编排(上海交大) +
+
+ Mobile-MCP + Android IPC 机制实现 MCP——将工具协议扩展至移动端原生应用 +
+
+ Execute-Only Agents + 「规划」和「执行」分离到不同安全域——架构级 prompt injection 防御 +
+
+
+ OS 研究议题全景 + 将 Linux cgroup 资源控制扩展到 agent 负载——CPU/内存/IO 的 agent 感知管理 + 面向动态多 agent 负载的资源管理——传统调度器不理解 token 生成语义 + 实时观测 agent 调用链——不修改 agent 代码的非侵入式监控 +
+
+ + +
+ → Agent OS · Harness Engineering · ASPLOS · MCP + ASPLOS 2026 Workshop +
+
+ + diff --git a/site/src/content/cards/zh/sources/ai21-jamba.mdx b/site/src/content/cards/zh/sources/ai21-jamba.mdx new file mode 100644 index 0000000..82e0b43 --- /dev/null +++ b/site/src/content/cards/zh/sources/ai21-jamba.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AI21 Jamba +titleAlt: Jamba SSM-Transformer Hybrid +tagline: AI21 · Mamba-Transformer混合 · 1/8注意力层 · 256K上下文 · Mixtral 3倍吞吐 +refs: + - concepts/ssm-hybrid-architecture + - concepts/context-management + - concepts/long-running-agents +sourceLine: AI21 Jamba Blog 2024-03-28 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · AI21 JAMBA · SSM-Transformer 混合 · MoE · 256K Context · 2024 + + + +

Jamba: AI21's SSM-Transformer Hybrid

+

AI21(2024-03-28)——首个生产级 Mamba-Transformer 混合架构模型,Apache 2.0 开源

+
+ + + Jamba 通过将 SSM 层(Mamba)与 Transformer 注意力层和 MoE 层混合,在吞吐量、内存效率和质量三维同时优化。关键比例:每 8 层中 1 层为 Transformer attention,其余 7 层为 Mamba——与理论最优比例吻合,是 SSM 混合架构从研究走向生产的里程碑。 + + + +
+ 架构参数 +
+
+ 注意力/Mamba 比例 + 1/8 Transformer + 7/8 Mamba(每 8 层) +
+
+ 参数规模 + 总参数 52B,推理时激活 12B(MoE 稀疏激活) +
+
+ 上下文长度 + 256K context window,单 80GB GPU 可容纳 140K context +
+
+ 吞吐量 + 长 context 场景下是 Mixtral 8x7B 的 3 倍 +
+
+
+
+ 对 Agent 工程的意义 + 256K window 减少 compaction 需求——长时运行 agent 的上下文压力显著降低 + Mamba 层无二次复杂度开销——agent loop 的经济性改善 + Cartesia Mamba-3 论文的「混合架构将成主流」判断的早期生产验证 +
+
+ + +
+ → SSM Hybrid Architecture · Context Management · Long-Running Agents + AI21 Blog (2024-03-28) +
+
+ + diff --git a/site/src/content/cards/zh/sources/aios-llm-agent-operating-system.mdx b/site/src/content/cards/zh/sources/aios-llm-agent-operating-system.mdx new file mode 100644 index 0000000..dabdc50 --- /dev/null +++ b/site/src/content/cards/zh/sources/aios-llm-agent-operating-system.mdx @@ -0,0 +1,78 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: AIOS - LLM Agent Operating System +titleAlt: AIOS LLM Agent Operating System +tagline: Rutgers · OS六大模块完整实现 · 2.1x吞吐 · Logits快照 · COLM 2025 +refs: + - entities/aios + - concepts/virtual-context-management + - concepts/harness-engineering +sourceLine: Mei et al. arXiv:2403.16971 COLM 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · AIOS · Rutgers · OS 六大模块 LLM 映射 · 并发 Agent · COLM 2025 + + + +

AIOS: LLM Agent Operating System

+

Mei 等(Rutgers,COLM 2025)——并发 LLM agent 的 OS 级资源管理,2.1x 吞吐提升

+
+ + + 当多个 agent 共享同一 LLM 时,面临的问题——调度、隔离、中断恢复、内存管理——与 1960 年代 OS 面对 CPU 的问题同构。AIOS 将传统 OS 六大模块逐一映射到 LLM agent 管理,是 Karpathy「LLM = CPU」类比的最完整工程实现。 + + + +
+ OS → AIOS 模块映射 +
+
传统 OS
+
AIOS 对应
+
CPU 核心
+
LLM Core(模型实例抽象)
+
进程调度
+
Agent Scheduler(FIFO/Round Robin)
+
虚拟内存/上下文切换
+
Context Manager(推理快照与恢复)
+
RAM 管理
+
Memory Manager(LRU-K 换页)
+
系统调用
+
AIOS Syscall(标准化接口)
+
权限控制
+
Access Manager(agent 间隔离)
+
+
+
+ 实验结果(单 GPU,250 个 agent 并发) + Reflexion + Llama-3.1-8b——Round Robin 调度使 agent 并发执行 + 保存搜索树状态(候选 token + 概率)——中断恢复的第三条路,比 compaction 无损 + 工具冲突通过 hashmap 排队解决 +
+
+ + +
+ → AIOS · Virtual Context Management · Harness Engineering · MemGPT + COLM 2025 arXiv:2403.16971 +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-biology-large-language-model.mdx b/site/src/content/cards/zh/sources/anthropic-biology-large-language-model.mdx new file mode 100644 index 0000000..63895e5 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-biology-large-language-model.mdx @@ -0,0 +1,85 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: On the Biology of a Large Language Model +titleAlt: Anthropic Biology of LLM +tagline: Anthropic Transformer Circuits · Claude 3.5 Haiku解剖 · 10大案例 · CoT忠实性 · 2025 +refs: + - concepts/mechanistic-interpretability + - concepts/circuit-tracing + - entities/anthropic +sourceLine: Anthropic transformer-circuits.pub 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · ANTHROPIC · BIOLOGY OF LLM · Circuit Tracing · Claude 3.5 Haiku 解剖 + + + +

On the Biology of a Large Language Model

+

Anthropic Transformer Circuits Team(2025)——将 circuit tracing 应用于 Claude 3.5 Haiku 的 10 大行为案例研究

+
+ + + 如同生物学用显微镜研究有机体,本文对 Claude 3.5 Haiku 进行「解剖学」研究。归因图在约 25% 的 prompt 上产生满意洞察,所有发现通过扰动实验(抑制/注入)验证。核心比喻:「Dallas → Texas → Austin」存在真实中间特征跳转,而非死记硬背。 + + + +
+ 10 大案例研究(节选) +
+ 多步推理 + Dallas→Texas→Austin:真实中间特征,非查表 +
+
+ 幻觉机制 + 拒绝是默认行为——「已知实体」特征抑制此默认,误触发导致幻觉 +
+
+ CoT 忠实性 + 可区分三种模式:真实推理、无中生有、动机推理(从答案反推步骤) +
+
+ 安全拒绝 + 微调产生通用「有害请求」特征——从预训练具体有害特征聚合而来 +
+
+ 越狱分析 + 语法连贯性特征与安全机制的张力——完成语法结构后才能「拒绝」 +
+
+
+ 方法论特点 + 跨语言共享抽象概念特征——Claude 3.5 Haiku 共享比例是小模型 2 倍+ + 行首就激活韵脚候选词——兼具前瞻和回溯规划 + 许多机制是无预设假说时发现的——归因图本身引导探索 +
+
+ + +
+ → Mechanistic Interpretability · Circuit Tracing · Anthropic + transformer-circuits.pub (2025) +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-building-agents-claude-agent-sdk.mdx b/site/src/content/cards/zh/sources/anthropic-building-agents-claude-agent-sdk.mdx new file mode 100644 index 0000000..e23c50b --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-building-agents-claude-agent-sdk.mdx @@ -0,0 +1,84 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Building Agents with the Claude Agent SDK +titleAlt: Anthropic Claude Agent SDK Building Agents +tagline: Thariq Shihipar · Give Claude a Computer · 隐式循环三步 · Gather/Act/Verify · 2024 +refs: + - concepts/implicit-loop-architecture + - entities/claude-agent-sdk + - concepts/context-management +sourceLine: Anthropic Engineering Blog anthropic.com/engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · CLAUDE AGENT SDK · Thariq Shihipar · Give Claude a Computer · 隐式循环 + + + +

Building Agents with the Claude Agent SDK

+

Thariq Shihipar(Anthropic)——Claude Agent SDK 设计哲学:给 agent 一台计算机

+
+ + + 核心设计原则:「Give Claude a Computer」——程序员需要什么工具,Claude 就需要什么工具。Agent 在 gather context → take action → verify work → repeat 的反馈循环中运行——不是预定义的图结构,而是模型自主决定下一步:隐式循环架构。 + + + +
+ Agent 能力三层 +
+ 1. Gather Context(获取上下文) +
+ Agentic search:文件系统结构 + bash(文件夹结构是 context engineering 的一种形式) + Subagents:并行化 + context 隔离,只返回相关信息给 orchestrator + Compaction:context 接近上限时自动压缩历史 +
+
+
+ 2. Take Action(执行操作) +
+ Tools:agent 的主要执行构件,在 context 中占据显著位置影响模型决策 + Bash & scripts + Code generation + MCP 外部服务集成 +
+
+
+ 3. Verify Work(验证工作) +
+ Rules-based(lint)→ Visual feedback(截图多模态)→ LLM-as-judge +
+
+
+
+ 设计原则 + 语义检索快但不透明;先用 agentic search,它更准确且维护成本低 + 工具定义要像给初级开发者写的文档——ACI 与 HCI 同等重要 +
+
+ + +
+ → Implicit Loop Architecture · Claude Agent SDK · Context Management + Anthropic Engineering Blog +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-building-effective-agents.mdx b/site/src/content/cards/zh/sources/anthropic-building-effective-agents.mdx new file mode 100644 index 0000000..8814874 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-building-effective-agents.mdx @@ -0,0 +1,86 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Building Effective AI Agents +titleAlt: Anthropic Building Effective Agents +tagline: Schluntz & Zhang · Workflows vs Agents · 五种workflow模式 · 从简单开始 · 2024-12-20 +refs: + - concepts/prompt-chaining + - concepts/orchestrator-workers + - concepts/augmented-llm +sourceLine: Anthropic Schluntz & Zhang 2024-12-20 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · BUILDING EFFECTIVE AGENTS · Schluntz & Zhang · Anthropic 2024 + + + +

Building Effective AI Agents

+

Schluntz & Zhang(Anthropic,2024-12-20)——基于数十个客户团队的 agent 工程经验总结

+
+ + + 核心论点:最成功的实现不依赖复杂框架,而是用简单、可组合的模式构建。基础构建块是「增强型 LLM」——检索 + 工具 + 记忆,通过 MCP 等协议标准化接口。单次 LLM 调用 + 检索 + 上下文示例通常已经够用——只在有证据表明复杂度能改善结果时才增加复杂度。 + + + +
+ 五种 Workflow + 一种 Agent 模式 +
+ Prompt Chaining + 任务分解为顺序步骤,中间可加检查门(gate) +
+
+ Routing + 输入分类后导向专门化处理——语义路由 +
+
+ Parallelization + 分段并行(sectioning)+ 投票集成(voting) +
+
+ Orchestrator-Workers + 中央 LLM 动态分解任务、分发给工作模型、综合结果 +
+
+ Evaluator-Optimizer + 生成-评估循环迭代——反馈驱动改进 +
+
+ Agent(自主决策) + LLM 动态指挥自身流程——开放式问题、步骤数不可预测 +
+
+
+ ACI 设计原则 + 工具定义要像写给初级开发者的文档一样清晰——agent 是工具的主要用户 +
+
+ + +
+ → Prompt Chaining · Orchestrator-Workers · Augmented LLM · ACI + Anthropic (2024-12-20) +
+
+ + From bdd957bce3f6f8dc81db284fc7640ff44fa00b6b Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 20:38:39 +0800 Subject: [PATCH 36/48] feat(cards): sources/anthropic-[circuit-tracing-methods,claude-code-permissions] (2 cards) Co-Authored-By: Claude Opus 4.7 (1M context) --- .../anthropic-circuit-tracing-methods.mdx | 83 +++++++++++++++++++ .../anthropic-claude-code-permissions.mdx | 80 ++++++++++++++++++ 2 files changed, 163 insertions(+) create mode 100644 site/src/content/cards/zh/sources/anthropic-circuit-tracing-methods.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-claude-code-permissions.mdx diff --git a/site/src/content/cards/zh/sources/anthropic-circuit-tracing-methods.mdx b/site/src/content/cards/zh/sources/anthropic-circuit-tracing-methods.mdx new file mode 100644 index 0000000..036372f --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-circuit-tracing-methods.mdx @@ -0,0 +1,83 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Circuit Tracing - Revealing Computational Graphs in LLMs +titleAlt: Anthropic Circuit Tracing Methods +tagline: Anthropic · 跨层转码器CLT · 归因图 · 扰动验证 · transformer-circuits.pub 2025 +refs: + - concepts/mechanistic-interpretability + - concepts/circuit-tracing + - entities/anthropic +sourceLine: Anthropic transformer-circuits.pub 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · CIRCUIT TRACING · Anthropic Transformer Circuits · CLT · 归因图 · 2025 + + + +

Circuit Tracing: Revealing Computational Graphs in Language Models

+

Anthropic Transformer Circuits Team(2025)——从特征发现到电路追踪的完整 MI 工作流

+
+ + + 构建「可解释替代模型」:用跨层转码器(CLT)替换 MLP 层,追踪稀疏激活特征之间的线性因果链路,生成「归因图」。前向传播中特征间的直接交互是线性的——CLT 桥接 MLP,注意力模式冻结。最大 CLT 在 50% 的 prompt 上匹配底层模型的 top-1 token。 + + + +
+ 五步工作流 +
+ 1 + SAE/CLT 提取特征——从残差流读入,向后续层 MLP 输出写入 +
+
+ 2 + 构建局部替代模型——固定注意力模式,加入误差调整项,精确还原原模型输出 +
+
+ 3 + 生成归因图——节点=活跃特征/token/误差/logit;边=线性效应 +
+
+ 4 + 剪枝简化——保留最大贡献子图,典型压缩率 10x 节点,损失 20% 解释力 +
+
+ 5 + 扰动验证——抑制/注入特征,观察下游效应,验证因果链路 +
+
+
+ 方法局限 + 方法捕获 OV-circuits 的信息流,但不解释「为什么注意该位置」 + 仅约 25% 的 prompt 产生满意洞察——适合探索性研究,不适合批量分析 + 当特征的作用是「阻止」某输出时,归因图更难解读 +
+
+ + +
+ → Mechanistic Interpretability · Circuit Tracing · Anthropic Biology of LLM + transformer-circuits.pub (2025) +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-claude-code-permissions.mdx b/site/src/content/cards/zh/sources/anthropic-claude-code-permissions.mdx new file mode 100644 index 0000000..61c7afe --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-claude-code-permissions.mdx @@ -0,0 +1,80 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Claude Code Permissions System +titleAlt: Anthropic Claude Code Permissions +tagline: Anthropic官方 · 三类工具分层 · deny-first规则 · 六种权限模式 · 五层作用域 · 2026 +refs: + - concepts/settings-scope-hierarchy + - concepts/guardrails + - entities/claude-code +sourceLine: Anthropic Claude Code Docs 2026-04-08 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 来源 · CLAUDE CODE PERMISSIONS · Anthropic 官方 · deny-first · 六种模式 · 五层作用域 + + + +

Claude Code 权限系统

+

Anthropic 官方文档——精确控制 agent 被允许做什么、不能做什么的核心安全机制

+
+ + + 三类工具 × 三种规则 × 六种模式 × 五层作用域构成 Claude Code 的完整权限体系。核心语义:deny-first——评估顺序 deny → ask → allow,第一个匹配的规则生效,deny 总是优先。任意层级的 deny 不可被其他层的 allow 覆盖。 + + + +
+ 三类工具分层 +
+
工具类型
+
示例
+
审批要求
+
只读工具
+
文件读取、Grep
+
不需要
+
文件修改
+
编辑/写入
+
会话级
+
Bash 命令
+
Shell 执行
+
永久级(保存到 settings)
+
+
+
+ 六种权限模式 + 首次使用时提示确认 + 自动接受文件编辑(受保护目录除外) + 自动审批 + 分类器模型后台验证安全性 + 跳过所有权限提示(仅限容器/VM 隔离环境) + Bash(npm run *) 通配符,Read(./.env) 精确路径,WebFetch(domain:x.com) 按域名 + Read 规则阻止读工具,但不阻止 Bash 中的 cat——沙箱补足 OS 级强制隔离 +
+
+ + +
+ → Settings Scope Hierarchy · Guardrails · Claude Code + Anthropic Docs (2026-04-08) +
+
+ + From 47d052f387ea69d1c0f908a617d44c0d9a14b80f Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 20:48:11 +0800 Subject: [PATCH 37/48] =?UTF-8?q?feat(cards):=20batch=2014/18=20=E2=80=94?= =?UTF-8?q?=20sources/anthropic-[effective-harnesses=E2=86=92tracing-thoug?= =?UTF-8?q?hts]=20(9=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 9 Anthropic source cards, each with a distinct layout approach: - effective-harnesses: dual-column agent flow (Initializer | Coder) - emergent-introspective-awareness: rule-stack of 4 experiments - equipping-agents-agent-skills: hero-pyramid SVG (3-layer progressive disclosure) - harness-design-long-running-apps: metrics-table hero (Solo/Full/Simplified) - harnessing-claudes-intelligence: band-rhythm 3 patterns + bitter-lesson punchline - introducing-claude-opus-4-6: hero-number "1M" release announcement - managed-agents: Brain-Hands SVG decoupling diagram - structured-outputs: compare-matrix (OpenAI vs Anthropic) - tracing-thoughts: 6-finding mosaic grid Co-Authored-By: Claude Opus 4.7 (1M context) --- ...ffective-harnesses-long-running-agents.mdx | 112 +++++++++++++++ ...ropic-emergent-introspective-awareness.mdx | 109 ++++++++++++++ ...nthropic-equipping-agents-agent-skills.mdx | 94 ++++++++++++ ...ropic-harness-design-long-running-apps.mdx | 132 +++++++++++++++++ ...hropic-harnessing-claudes-intelligence.mdx | 110 ++++++++++++++ .../anthropic-introducing-claude-opus-4-6.mdx | 135 ++++++++++++++++++ .../zh/sources/anthropic-managed-agents.mdx | 108 ++++++++++++++ .../sources/anthropic-structured-outputs.mdx | 128 +++++++++++++++++ ...hropic-tracing-thoughts-language-model.mdx | 123 ++++++++++++++++ 9 files changed, 1051 insertions(+) create mode 100644 site/src/content/cards/zh/sources/anthropic-effective-harnesses-long-running-agents.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-emergent-introspective-awareness.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-equipping-agents-agent-skills.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-harness-design-long-running-apps.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-harnessing-claudes-intelligence.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-introducing-claude-opus-4-6.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-managed-agents.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-structured-outputs.mdx create mode 100644 site/src/content/cards/zh/sources/anthropic-tracing-thoughts-language-model.mdx diff --git a/site/src/content/cards/zh/sources/anthropic-effective-harnesses-long-running-agents.mdx b/site/src/content/cards/zh/sources/anthropic-effective-harnesses-long-running-agents.mdx new file mode 100644 index 0000000..6537097 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-effective-harnesses-long-running-agents.mdx @@ -0,0 +1,112 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Effective Harnesses for Long-Running Agents +titleAlt: Anthropic Effective Harnesses +tagline: Anthropic · 双 Agent 架构 · Initializer + Coder · feature JSON · 状态外部化 · 2026 +author: Justin Young (Anthropic) +year: 2026 +url: https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents +refs: + - concepts/harness-engineering + - concepts/long-running-agents + - concepts/feature-tracking +sourceLine: Anthropic Engineering 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · LONG-RUNNING HARNESS · Anthropic Engineering · 2026 + + + +

长时 Agent 的 Harness 设计

+

当任务超出单个 context window——双 agent 架构 + 外部状态交接

+
+ + + 两类失败模式同源:one-shotting(耗尽 context 留半成品)和 premature victory(误判已完成)。解法是把「一次性完成」改成「增量推进 + 状态交接」——Initializer 搭好脚手架,Coder 逐个 feature 推进。 + + + +
+
① INITIALIZER
+
一次性
+
    +
  • init.sh(开发环境启动)
  • +
  • 创建 claude-progress.txt
  • +
  • 生成 JSON feature list(200+ 条)
  • +
  • 初始 git commit
  • +
+
+
+
② CODER
+
每个 session
+
    +
  • 读进度 + git log 恢复状态
  • +
  • 选一个 feature 端到端实现
  • +
  • Puppeteer MCP 验证
  • +
  • commit + 更新 passes 字段
  • +
+
+
+ + +
+ 交接物 + init.sh · claude-progress.txt · features.json · git log +
+
+ 关键约束 + agent 只能改 passes——JSON 比 Markdown 更抗「顺手改」 +
+
+ + +
+ → harness-engineering · long-running-agents · feature-tracking + anthropic.com/engineering +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-emergent-introspective-awareness.mdx b/site/src/content/cards/zh/sources/anthropic-emergent-introspective-awareness.mdx new file mode 100644 index 0000000..225a9c0 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-emergent-introspective-awareness.mdx @@ -0,0 +1,109 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Emergent Introspective Awareness in LLMs +titleAlt: Anthropic Emergent Introspection 2025 +tagline: Anthropic · 概念注入 · 四项实验 · 内省随能力涌现 · Opus 4.1 ~20% · 2025 +author: Jack Lindsey (Anthropic) +year: 2025 +url: https://transformer-circuits.pub/2025/introspection/index.html +refs: + - concepts/mechanistic-interpretability + - concepts/agentic-systems + - entities/anthropic +sourceLine: Anthropic Transformer Circuits 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · INTROSPECTION · Anthropic Transformer Circuits · 2025 + + + +

LLM 的涌现内省觉察

+

用「概念注入」探测模型对自身内部状态的有限但真实的觉察能力

+
+ + + 核心方法——把已知概念的激活模式注入模型内部,观察它能否检测、识别并报告被注入的状态。Opus 4/4.1 在最佳层/强度下约 20% 成功率——失败仍是常态,但足以证明「内省能力随模型能力涌现」。 + + + +
+ 01 +
+
注入思维检测 ~20%
+
告知模型「可能有人工思维被注入」,观察能否识别——Opus 4.1 在最佳层最佳强度下达到约 20% 成功率
+
+
+
+ + +
+ 02 +
+
思维 vs 文本区分 显著
+
能否同时转录输入文本并报告被注入的「思维」?所有模型均显著高于随机——说明对「这不是输入」有内部表征
+
+
+
+ + +
+ 03 +
+
非意图输出检测 可控
+
预填充非自然回复后——模型能通过回看自身激活来判断「这不是我说的」;而注入相应概念向量后,它会接受预填充为自主产生
+
+
+
+ + +
+ 04 +
+
内部状态控制 全面
+
指令模型「想着某词」写句子——所有模型在指令「想」时激活增强、「不想」时减弱。表明能主动调制内部状态
+
+
+
+ + +
+ → mechanistic-interpretability · agentic-systems · anthropic + transformer-circuits.pub (2025) +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-equipping-agents-agent-skills.mdx b/site/src/content/cards/zh/sources/anthropic-equipping-agents-agent-skills.mdx new file mode 100644 index 0000000..d0360c3 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-equipping-agents-agent-skills.mdx @@ -0,0 +1,94 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Equipping Agents with Agent Skills +titleAlt: Anthropic Agent Skills +tagline: Anthropic · 三层渐进式披露 · 理论上无限 context · 代码即文档 · 2026 +author: Barry Zhang, Keith Lazuka, Mahesh Murag (Anthropic) +year: 2026 +url: https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills +refs: + - concepts/agent-skills + - concepts/aci + - concepts/tool-design +sourceLine: Anthropic Engineering 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · AGENT SKILLS · Anthropic Engineering · 渐进式披露 · 2026 + + + +

Agent Skills:为 Agent 装备现实世界

+

把领域知识打包为可发现、可加载的可组合资源——不是定制新 agent,而是为「新员工」准备入职指南

+
+ + +
+ + + + + + + + + + + + + LAYER 1 + name + description + + LAYER 2 + SKILL.md — agent 判断相关时才读 + lazy load · ~chars + + LAYER 3 + reference.md · forms.md · scripts / ... + on-demand · theoretically unlimited + +
+
预加载到 system prompt
+
按需进入 context
+
不进 context,代码执行
+
+
+
+ + + Progressive disclosure——技能理论上可以打包任意量的 context,因为 agent 有文件系统和代码执行能力,不需要一次性读入全部内容。某些操作(排序、PDF 解析)用代码比用 token 更高效——代码同时是工具和文档。 + + + +
+ → agent-skills · aci · tool-design · context-management + anthropic.com/engineering +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-harness-design-long-running-apps.mdx b/site/src/content/cards/zh/sources/anthropic-harness-design-long-running-apps.mdx new file mode 100644 index 0000000..c4c30cd --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-harness-design-long-running-apps.mdx @@ -0,0 +1,132 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Harness Design for Long-Running App Development +titleAlt: Anthropic Harness Design 2026 +tagline: Anthropic · GAN 式 Generator-Evaluator · Planner · 三Agent · harness 随模型进化 · 2026 +author: Prithvi Rajasekaran (Anthropic Labs) +year: 2026 +url: https://www.anthropic.com/engineering/harness-design-long-running-apps +refs: + - concepts/harness-engineering + - concepts/evaluator-optimizer + - concepts/long-running-agents +sourceLine: Anthropic Engineering 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · HARNESS DESIGN · Anthropic Labs · GAN 式 · 2026 + + + +

长时应用开发的 Harness 设计

+

GAN 启发的 Generator-Evaluator 架构——把生成与评估分离为独立 agent,解决「自评偏乐观」

+
+ + + 三 agent 架构:Planner(1-4 句 prompt → 200+ feature spec)、Generator(逐 sprint 实现 + 自评)、Evaluator(Playwright MCP 实际操作应用验证)。核心洞察:agent 评估自己天然偏乐观,分离评估者后更容易调校为严格的批评者。 + + + +
+ +
+
+
Solo Agent
+
Opus 4.5
+
+
20min
+
$9
+
核心功能损坏
+
+
+
+
Full Harness
+
Opus 4.5 + Planner/Gen/Eval
+
+
6hr
+
$200
+
功能完整 · 设计一致
+
+
+
+
Simplified Harness
+
Opus 4.6(sprint 已退场)
+
+
3:50hr
+
$125
+
更少组件 · 同质量
+
+
+
+ + +
+ 方法论 + harness 每个组件都编码了「模型做不到什么」的假设——随模型升级持续检验并修剪。Planner 始终有价值;Evaluator 视任务是否在能力边界;Sprint 结构在 Opus 4.6 后不再必要。 +
+
+ + +
+ → harness-engineering · evaluator-optimizer · long-running-agents + anthropic.com/engineering +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-harnessing-claudes-intelligence.mdx b/site/src/content/cards/zh/sources/anthropic-harnessing-claudes-intelligence.mdx new file mode 100644 index 0000000..b71ac9a --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-harnessing-claudes-intelligence.mdx @@ -0,0 +1,110 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Harnessing Claude's Intelligence — 3 Key Patterns +titleAlt: Anthropic Harnessing Claude's Intelligence +tagline: Anthropic · 三大模式 · Use/Stop/Boundaries · Agent Bitter Lesson · 2026-04-02 +author: Lance Martin (Anthropic) +year: 2026 +url: https://claude.com/blog/harnessing-claudes-intelligence +refs: + - concepts/harness-engineering + - concepts/agent-skills + - concepts/context-management +sourceLine: Anthropic · Claude Platform · 2026-04-02 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · HARNESS PATTERNS · Anthropic Platform · 2026-04-02 +

驾驭 Claude 的智能

+

Three patterns for building apps that keep up with Claude

+
+ + +
+
+
+
USE what Claude knows
+
用 Claude 已熟悉的通用工具
+
bash + text editor 胜过为每个场景定制专用工具。Claude Code 的 SWE-bench 进化证明:同一工具集上能力持续提升。Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合。
+
+
+
+ + +
+
+
+
ASK "what can I stop doing?"
+
主动剥离过时假设
+
让 Claude 编排自身操作(代码执行 ≫ 回流 context)——BrowseComp 45.3% → 61.6%;让 Claude 管理自身 context(skills + context editing);让 Claude 持久化自身 context(compaction + memory folder)。Opus 4.6 compaction 达 84%,Sonnet 4.5 仅 43%。
+
+
+
+ + +
+
+
+
SET boundaries carefully
+
小心设置边界
+
Cache 优化(静态优先、不换模型、慎改工具)· 声明式工具(不可逆操作提升为 typed 工具)· 持续重评估(auto-mode 用第二个 Claude 判断 bash 安全性,可减少专用工具)
+
+
+
+ + +
+
"应用中的结构或边界应基于『我可以停止做什么?』来修剪——因为它们可能成为 Claude 性能的瓶颈。"
+
—— Bitter Lesson 的 Agent 版本
+
+
+ + +
+ → harness-engineering · agent-skills · context-management + claude.com/blog +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-introducing-claude-opus-4-6.mdx b/site/src/content/cards/zh/sources/anthropic-introducing-claude-opus-4-6.mdx new file mode 100644 index 0000000..b9c69d3 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-introducing-claude-opus-4-6.mdx @@ -0,0 +1,135 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Introducing Claude Opus 4.6 +titleAlt: Anthropic Opus 4.6 Release +tagline: Anthropic · 首个 Opus 级 1M context · MRCR 18.5→76% · Adaptive thinking · 2026 +author: Anthropic +year: 2026 +url: https://www.anthropic.com/news/claude-opus-4-6 +refs: + - concepts/long-context + - concepts/harness-engineering + - entities/anthropic +sourceLine: Anthropic News 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import KV from '~/components/card/blocks/KV.astro'; + + + 源头 · CLAUDE OPUS 4.6 · Anthropic News · 2026 + + + +
+
CONTEXT WINDOW
+
+ 1M + tokens +
+
首个 Opus 级百万上下文(beta)
+
+ Sonnet 4.5 · 18.5% + + Opus 4.6 · 76% + MRCR v2 · 8-needle · 1M 版本 +
+
+
+ + +

Claude Opus 4.6

+

Agentic 编码全面升级 · 长上下文质变 · 过度拒绝率全家最低

+
+ + +
+
Adaptive thinking
+
模型自判何时深度推理,取代二元开关
+
+
+
Effort 控制
+
low / medium / high / max 四级
+
+
+
Context compaction
+
接近阈值时自动摘要替换旧 context(beta)
+
+
+
Agent teams
+
Claude Code 多 agent 并行协作(研究预览)
+
+
+
128k 输出 token
+
Terminal-Bench 2.0 · Humanity's Last Exam · GDPval-AA 达 SOTA
+
+
+ + +
+ → long-context · harness-engineering · anthropic + anthropic.com/news +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-managed-agents.mdx b/site/src/content/cards/zh/sources/anthropic-managed-agents.mdx new file mode 100644 index 0000000..5da6b3d --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-managed-agents.mdx @@ -0,0 +1,108 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Managed Agents — Decoupling the Brain from the Hands +titleAlt: Anthropic Managed Agents Architecture +tagline: Anthropic · Brain/Hands 解耦 · Session 外部化 · Pet→Cattle · Meta-Harness · 2026 +author: Lance Martin, Gabe Cemaj, Michael Cohen (Anthropic) +year: 2026 +url: https://www.anthropic.com/engineering/managed-agents +refs: + - concepts/harness-engineering + - concepts/agent-sandboxing + - concepts/llm-os-analogy +sourceLine: Anthropic Engineering 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · MANAGED AGENTS · Anthropic Engineering · Meta-Harness · 2026 + + + +

Managed Agents:大脑与手的解耦

+

把 agent 组件虚拟化为稳定接口——对接口有主张,对实现无主张

+
+ + + OS 虚拟化硬件为「尚未被构想的程序」提供通用抽象——Managed Agents 虚拟化 agent 组件(session / harness / sandbox)为未来 harness 提供通用接口。核心是「元 harness」:提供接口,不规定实现。 + + + +
+ + + BRAIN + Claude + + harness + decides + + + + + + execute(name, input) + → string + + + HAND · 1 + container + + + HAND · 2 + phone + + + HAND · N + pokemon sim + + + + + SESSION + 独立事件日志 · wake(sessionId) · getEvents(range) · context window 之外的可查询对象 + +
+
+ + +
+
Pet → Cattle
+
单一容器「不可失去的宠物」→ 组件解耦为可独立替换的「牲畜」。brain 启动不再等 container provisioning,p50 TTFT ↓60% · p95 ↓90%
+
+
+
安全边界结构化
+
凭证永不进入 sandbox——git token 注入 remote,OAuth 存 vault 经专用代理访问。prompt injection 说服不了「读不到」的东西。
+
+
+ + +
+ → harness-engineering · agent-sandboxing · llm-os-analogy · bitter-lesson + anthropic.com/engineering +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-structured-outputs.mdx b/site/src/content/cards/zh/sources/anthropic-structured-outputs.mdx new file mode 100644 index 0000000..c9d2c52 --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-structured-outputs.mdx @@ -0,0 +1,128 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Anthropic Structured Outputs +titleAlt: Anthropic Structured Outputs Docs +tagline: Anthropic 官方 · grammar-constrained sampling · 24h 缓存 · 可选参数 ×2 状态空间 · PHI 隐患 +author: Anthropic +year: 2026 +url: https://docs.anthropic.com/en/docs/build-with-claude/structured-outputs +refs: + - concepts/structured-outputs + - concepts/constrained-decoding + - concepts/context-free-grammar-llm +sourceLine: Anthropic Docs +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · STRUCTURED OUTPUTS · Anthropic 官方文档 · grammar-constrained sampling + + + +

Anthropic 结构化输出

+

JSON outputs · strict tool use · 底层 grammar-constrained sampling——与 OpenAI 实现的关键差异

+
+ + +
+
+
维度
+
OpenAI
+
Anthropic
+
+
+
响应格式
+
response_format: {`{ type: "json_schema" }`}
+
output_config: {`{ format: { type: "json_schema" } }`}
+
+
+
文法描述
+
context-free grammar (CFG)
+
grammar(不区分 CFG vs FSM)
+
+
+
缓存有效期
+
未明确
+
24 小时(从上次使用计)
+
+
+
缓存失效
+
schema 变更
+
结构变更(name / description 不触发)
+
+
+
复杂度模型
+
schema 子集 + 首次延迟
+
明确预算:每个可选参数约 ×2 状态空间
+
+
+
+ + +
+
+ Grammar 作用域 + 仅约束 Claude 直接输出;不影响工具调用参数、工具结果或 thinking。Grammar state resets between sections——thinking 自由,响应受约束。 +
+
+ PHI / HIPAA 警告 + Schema 被单独缓存,不同隐私级别。不要在 property names / enum / const / pattern regex 中放 PHI——schema 不是消息内容,是系统层制品。 +
+
+
+ + +
+ → structured-outputs · constrained-decoding · context-free-grammar-llm · prefix-caching + docs.anthropic.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/anthropic-tracing-thoughts-language-model.mdx b/site/src/content/cards/zh/sources/anthropic-tracing-thoughts-language-model.mdx new file mode 100644 index 0000000..4a7c44f --- /dev/null +++ b/site/src/content/cards/zh/sources/anthropic-tracing-thoughts-language-model.mdx @@ -0,0 +1,123 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Tracing the Thoughts of a Large Language Model +titleAlt: Anthropic Tracing Thoughts 2025 +tagline: Anthropic · 为 AI 构建显微镜 · 六项关键发现 · Claude 3.5 Haiku · 2025 +author: Anthropic +year: 2025 +url: https://www.anthropic.com/research/tracing-thoughts-language-model +refs: + - concepts/mechanistic-interpretability + - concepts/circuit-tracing + - entities/anthropic +sourceLine: Anthropic Research 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · TRACING THOUGHTS · Anthropic Research · 神经科学式显微镜 · 2025 + + + +

追踪 LLM 的思维

+

Circuit Tracing + Biology of LLM 两篇论文综述——十种关键行为的内部机制

+
+ + + 核心比喻:为 AI 构建「显微镜」,类似神经科学对大脑的研究方法。用 Circuit Tracing 方法论应用于 Claude 3.5 Haiku,直接看见模型在特定任务中走过的计算路径。 + + + +
+
+
01
+
多语言共享表征
+
不同语言间共享概念特征——先在抽象「思维语言」空间运算,再翻译为具体语言输出
+
+
+
02
+
前瞻规划
+
写押韵诗时,开始新行前就预选韵脚词,然后「朝目标写」——推翻「逐词即兴」假说
+
+
+
03
+
推理忠实性
+
有时从目标答案反向构造推理(motivated reasoning)——可解释性工具「当场抓现行」
+
+
+
04
+
幻觉机制
+
默认行为是拒绝,「已知实体」特征抑制拒绝;特征误触发 → 产生幻觉
+
+
+
05
+
越狱分析
+
语法连贯性特征 × 安全机制张力——模型倾向完成已开始的语法结构,即使检测到危险
+
+
+
06
+
心算策略
+
发展出自己的并行计算(近似值 + 精确末位)——与其「解释」中声称的标准算法不同
+
+
+
+ + +
+ 局限 + 归因图仅捕获部分计算量 · 需数小时人工分析 · 替代模型可能引入与底层不同的机制 · 未来需规模化与长 CoT 扩展 +
+
+ + +
+ → mechanistic-interpretability · circuit-tracing · biology-of-llm + anthropic.com/research +
+
+ + From 50f0c8bf47de76dba48e6b36e68b9cefc8169fb2 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 21:01:20 +0800 Subject: [PATCH 38/48] =?UTF-8?q?feat(cards):=20batch=2015/18=20=E2=80=94?= =?UTF-8?q?=20sources/openai+karpathy+model-research=20(14=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 14 cards covering OpenAI harness/Codex/structured-outputs + Karpathy LLM foundations + Meta I-JEPA + Cartesia Mamba-3 + NVIDIA EDLM + Google A2A + LangGraph, each with a distinct layout approach. Co-Authored-By: Claude Opus 4.7 (1M context) --- .../cards/zh/sources/cartesia-mamba-3.mdx | 131 ++++++++++++++ .../cards/zh/sources/google-a2a-protocol.mdx | 137 ++++++++++++++ ...arpathy-intro-to-large-language-models.mdx | 137 ++++++++++++++ .../karpathy-llm-cpu-agent-os-kernel.mdx | 123 +++++++++++++ .../karpathy-software-is-changing-again.mdx | 144 +++++++++++++++ .../zh/sources/langgraph-documentation.mdx | 165 +++++++++++++++++ .../content/cards/zh/sources/meta-i-jepa.mdx | 127 +++++++++++++ .../nvidia-energy-based-diffusion-lm.mdx | 147 +++++++++++++++ .../zh/sources/openai-harness-engineering.mdx | 126 +++++++++++++ .../zh/sources/openai-introducing-codex.mdx | 113 ++++++++++++ .../openai-introducing-structured-outputs.mdx | 168 ++++++++++++++++++ ...openai-practical-guide-building-agents.mdx | 135 ++++++++++++++ .../openai-unlocking-codex-harness.mdx | 148 +++++++++++++++ .../openai-unrolling-codex-agent-loop.mdx | 125 +++++++++++++ 14 files changed, 1926 insertions(+) create mode 100644 site/src/content/cards/zh/sources/cartesia-mamba-3.mdx create mode 100644 site/src/content/cards/zh/sources/google-a2a-protocol.mdx create mode 100644 site/src/content/cards/zh/sources/karpathy-intro-to-large-language-models.mdx create mode 100644 site/src/content/cards/zh/sources/karpathy-llm-cpu-agent-os-kernel.mdx create mode 100644 site/src/content/cards/zh/sources/karpathy-software-is-changing-again.mdx create mode 100644 site/src/content/cards/zh/sources/langgraph-documentation.mdx create mode 100644 site/src/content/cards/zh/sources/meta-i-jepa.mdx create mode 100644 site/src/content/cards/zh/sources/nvidia-energy-based-diffusion-lm.mdx create mode 100644 site/src/content/cards/zh/sources/openai-harness-engineering.mdx create mode 100644 site/src/content/cards/zh/sources/openai-introducing-codex.mdx create mode 100644 site/src/content/cards/zh/sources/openai-introducing-structured-outputs.mdx create mode 100644 site/src/content/cards/zh/sources/openai-practical-guide-building-agents.mdx create mode 100644 site/src/content/cards/zh/sources/openai-unlocking-codex-harness.mdx create mode 100644 site/src/content/cards/zh/sources/openai-unrolling-codex-agent-loop.mdx diff --git a/site/src/content/cards/zh/sources/cartesia-mamba-3.mdx b/site/src/content/cards/zh/sources/cartesia-mamba-3.mdx new file mode 100644 index 0000000..928b95b --- /dev/null +++ b/site/src/content/cards/zh/sources/cartesia-mamba-3.mdx @@ -0,0 +1,131 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Mamba-3 — Inference-First State Space Model +titleAlt: Cartesia Mamba-3 2026 +tagline: Cartesia · 推理优先 SSM · 三大改进 · 超越 Transformer vLLM · 2026 +author: Albert Gu (Cartesia) +year: 2026 +url: https://blog.cartesia.ai/p/mamba-3 +refs: + - concepts/state-space-models + - concepts/long-running-agents + - concepts/inference-optimization +sourceLine: Cartesia Research 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · MAMBA-3 · Cartesia · 推理优先 SSM · 经典控制论启发 · 2026 + + + +

Mamba-3:推理优先的状态空间模型

+

Mamba-2 为训练效率设计 · Mamba-3 明确为推理优先——响应 agentic 工作流的爆发需求

+
+ + + 三项改进均受启发于经典控制论和状态空间模型文献——逆当前线性注意力/测试时训练潮流。核心洞察:线性模型解码步骤计算量太少,GPU 大部分时间在搬内存——增加每步 FLOPs 对推理延迟几乎无影响 + + + +
+
+
+ + 更丰富的递归 +
+
指数梯形离散化
+
提升 SSM 表达力 · 隐式卷积取代外部短卷积
+
+
+
+ + 复数值 SSM +
+
通过 RoPE 实现复数转移矩阵
+
增强状态追踪能力
+
+
+
+ + MIMO SSM +
+
多输入多输出并行 SSM
+
不增状态大小 · 提升检索能力
+
+
+ +
+
1.5B 规模 · 最快 prefill + decode
+
+
Mamba-3 SISO
+
Mamba-2
+
Gated DeltaNet
+
Transformer vLLM
+
+
+
+ + +
+ 混合架构预测 + "线性层将来主要与全局自注意力层结合使用"——SSM 的记忆性 + 注意力的精确存储,经验上优于纯模型 +
+
+ + +
+ → state-space-models · long-running-agents · inference-optimization · hybrid-architecture + blog.cartesia.ai +
+
+ + diff --git a/site/src/content/cards/zh/sources/google-a2a-protocol.mdx b/site/src/content/cards/zh/sources/google-a2a-protocol.mdx new file mode 100644 index 0000000..87dcff6 --- /dev/null +++ b/site/src/content/cards/zh/sources/google-a2a-protocol.mdx @@ -0,0 +1,137 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Google A2A Protocol +titleAlt: Agent2Agent Protocol v1.0 +tagline: Google · Linux Foundation · agent↔agent 跨框架互操作 · JSON-RPC 2.0 · v1.0.0 +author: Google / Linux Foundation +year: 2026 +url: https://a2aproject.github.io/A2A/latest/ +refs: + - concepts/a2a-protocol + - concepts/agent-card + - concepts/task-lifecycle +sourceLine: a2aproject.github.io · 2026-04-07 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · A2A PROTOCOL · Google → Linux Foundation · v1.0.0 · 2026 + + + +

Agent2Agent 协议

+

多 agent 生态跨厂商、跨框架通信的开放标准——agent 不是工具

+
+ + + MCP 标准化 agent → tool,A2A 标准化 agent → agent。工具无状态执行固定函数;agent 有自主性、需多轮协商、委派、上下文传递。 + + + +
+
Agent 技术栈层次
+
+
模型
+
LLM · 推理能力
+
+
+
+
框架
+
ADK · LangGraph · CrewAI · agent 构建
+
+
+
+
MCP
+
agent → tool/data 接口
+
+
+
+
A2A
+
agent → agent 接口(本协议位置)
+
+
+
+
跨组织网络
+
Agent 生态互联
+
+
+
+ + +
五大核心概念
+
+
1Agent Card数字名片 · /.well-known/agent-card
+
2Task工作单元 · 完整状态机
+
3Message/Part模态无关 · text/raw/url/data
+
4Artifact可交付成果 · 可流式增量
+
5Context跨会话逻辑分组
+
+
+ + +
+ → a2a-protocol · agent-card · task-lifecycle · mcp · agent-interoperability + a2aproject.github.io +
+
+ + diff --git a/site/src/content/cards/zh/sources/karpathy-intro-to-large-language-models.mdx b/site/src/content/cards/zh/sources/karpathy-intro-to-large-language-models.mdx new file mode 100644 index 0000000..6c469cc --- /dev/null +++ b/site/src/content/cards/zh/sources/karpathy-intro-to-large-language-models.mdx @@ -0,0 +1,137 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Intro to Large Language Models (1hr Talk) +titleAlt: Karpathy Intro to LLMs 2023 +tagline: Karpathy · 两个文件 · 三阶段训练 · LLM OS 原型 · YouTube 2023-11-22 +author: Andrej Karpathy +year: 2023 +url: https://www.youtube.com/watch?v=zjkBMFhNj_g +refs: + - concepts/llm-os-analogy + - concepts/llm-training-pipeline + - entities/andrej-karpathy +sourceLine: Karpathy 1hr Talk · YouTube · 2023-11-22 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · INTRO TO LLMS · Karpathy · 1hr Talk · 2023-11-22 + + + +

大语言模型入门(1 小时讲座)

+

LLM 科普史上最有影响力的单次演讲——从「两个文件」讲到 LLM OS

+
+ + +
+
"I don't think it's accurate to think of LLMs as a chatbot...
It's a lot more correct to think about it as the kernel process of an emerging operating system."
+
—— LLM OS 类比首次系统提出
+
+
+ + +
+ LLM 是什么 · 两个文件 +
+
+
140 GB
+
参数文件(Llama 2 70B)
+
+
+
+
+
~500 行
+
C 代码推理实现
+
+
+
互联网文本的有损压缩 · 压缩比 ~100× · 下一词预测迫使网络编码世界知识
+
+ +
+ 三阶段训练流水线 +
+
+
预训练
+
~10TB · 6000 GPU×12 天 · ~$2M → Base model
+
+
+
+
+
微调
+
~100K 人工 Q&A → Assistant model(格式改变,非知识)
+
+
+
+
+
RLHF
+
人工比较标签 → 对齐优化(判断比生成便宜)
+
+
+
+
+ + +
+ → llm-os-analogy · llm-training-pipeline · augmented-llm · scaling-laws + youtube.com · Karpathy +
+
+ + diff --git a/site/src/content/cards/zh/sources/karpathy-llm-cpu-agent-os-kernel.mdx b/site/src/content/cards/zh/sources/karpathy-llm-cpu-agent-os-kernel.mdx new file mode 100644 index 0000000..4614051 --- /dev/null +++ b/site/src/content/cards/zh/sources/karpathy-llm-cpu-agent-os-kernel.mdx @@ -0,0 +1,123 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LLM = CPU, Agent = OS Kernel +titleAlt: Karpathy CPU-Kernel Tweet 2026 +tagline: Karpathy 回复 Guido · 不是组件描述,是架构层次定位 · 2026-03-31 +author: Andrej Karpathy +year: 2026 +url: https://x.com/karpathy/status/2039054981719089202 +refs: + - concepts/llm-os-analogy + - concepts/agentic-systems + - entities/andrej-karpathy +sourceLine: X (Twitter) · 2026-03-31 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; + + + 源头 · KARPATHY REPLIES GUIDO · X · 2026-03-31 + + + +

LLM = CPU · Agent = OS Kernel

+

不是在描述 agent 的组件——而是在定位它在系统架构中的角色

+
+ + +
+
+
传统计算
+
+
Agent 系统
+
+
+
CPU
+
+
LLM
+
+
+
OS Kernel
+
+
Agent
+
+
+
bytes
+
+
tokens
+
+
+
deterministic
+
+
stochastic
+
+
+
+ + +
+
数据单元转换
+
byte(程序赋予语义)→ token(天然携带统计语义、缺精确性)——不是量的差异,是计算范式的根本转变
+
+
+
动态特性转变
+
同输入同输出 → 同输入可能不同——agent 必须处理来自底层「硬件」本身的不确定性
+
+
+ + +
+ → llm-os-analogy · agentic-systems · implicit-loop-architecture · harness-engineering + x.com/karpathy +
+
+ + diff --git a/site/src/content/cards/zh/sources/karpathy-software-is-changing-again.mdx b/site/src/content/cards/zh/sources/karpathy-software-is-changing-again.mdx new file mode 100644 index 0000000..78d25ac --- /dev/null +++ b/site/src/content/cards/zh/sources/karpathy-software-is-changing-again.mdx @@ -0,0 +1,144 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Software Is Changing (Again) +titleAlt: Karpathy YC AI Startup School 2025 +tagline: Karpathy · Software 1.0/2.0/3.0 三代 · LLM is OS · 部分自主产品 · 2025-06-19 +author: Andrej Karpathy +year: 2025 +url: https://www.ycombinator.com/library/MW-andrej-karpathy-software-is-changing-again +refs: + - concepts/software-3-0 + - concepts/llm-os + - concepts/autonomy-slider +sourceLine: YC AI Startup School 2025-06-19 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · SOFTWARE IS CHANGING · Karpathy · YC AI Startup School · 2025-06-19 + + + +

软件正在(再次)改变

+

70 年来最根本的变革——三代软件共存 · LLM 是新操作系统

+
+ + +
+
+
+ 1.0 + Software +
+
+
代码(C++/Python)
+
→ 传统 CPU
+
GitHub
+
+
+
+
+ 2.0 + Software +
+
+
神经网络权重
+
→ GPU / TPU
+
Hugging Face
+
+
+
+
+ 3.0 + Software +
+
+
自然语言 prompt
+
→ LLM
+
尚未出现的 GitHub 等价物
+
+
+
+
+ + + LLM 同具三种属性——utility(metered access · 宕机即「智力停电」)+ fab(高 capex · 深科技树)+ OS(闭源 vs 开源 = Windows/macOS vs Linux)。"We're in the 1960s of LLMs"——中心化、time sharing、GUI 尚未被发明。 + + + +
+
部分自主产品
+
不是纯 agent——造战甲(augmentation),不是机器人。Cursor/Perplexity 四特征:context + 多 LLM 编排 + 专用 GUI + autonomy slider
+
+
+
Gen-Verify Loop
+
AI 生成 · 人类验证——加速验证(GUI + 可视化)+ 约束 AI(小增量、保持 leash)。不要让 AI 生成 10k 行 diff
+
+
+ + +
+ → software-3-0 · llm-os · autonomy-slider · harness-engineering · aci + ycombinator.com/library +
+
+ + diff --git a/site/src/content/cards/zh/sources/langgraph-documentation.mdx b/site/src/content/cards/zh/sources/langgraph-documentation.mdx new file mode 100644 index 0000000..4b1dcfe --- /dev/null +++ b/site/src/content/cards/zh/sources/langgraph-documentation.mdx @@ -0,0 +1,165 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: LangGraph Documentation +titleAlt: LangChain LangGraph Framework +tagline: LangChain · 显式图架构 · Durable Execution · 与隐式循环的范式对立 · 2026 +author: LangChain +year: 2026 +url: https://langchain-ai.github.io/langgraph/ +refs: + - concepts/agentic-systems + - concepts/implicit-loop-architecture + - concepts/harness-engineering +sourceLine: LangChain Docs · 2026-04-07 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · LANGGRAPH · LangChain · 显式图架构 · Klarna / Uber / J.P. Morgan 采用 + + + +

LangGraph:有状态 Agent 的显式图架构

+

StateGraph 定义节点和边——与 Claude SDK / Codex 的隐式循环形成鲜明对比

+
+ + + Durable execution · Human-in-the-loop · 短期工作记忆 + 长期会话记忆 · LangSmith 可视化追踪——显式图 vs 隐式循环,是 agentic systems 内部的范式分歧。 + + + +
+
+
+ 显式图 + LangGraph +
+
+
graph = StateGraph(MessagesState)
+
graph.add_node(mock_llm)
+
graph.add_edge(START, "mock_llm")
+
graph.add_edge("mock_llm", END)
+
+
+
+
+ 隐式循环 + Claude SDK / Codex +
+
+
while not done:
+
response = model(prompt)
+
if tool_call: execute()
+
else: done = True
+
+
+
+ +
+
+
+
显式图
+
隐式循环
+
+
+
可预测性
+
高 · 编译时确定
+
低 · 模型自主
+
+
+
灵活性
+
受拓扑限制
+
高 · 应对未预见
+
+
+
调试
+
易 · 可视化转换
+
难 · 推理决策链
+
+
+
模型依赖
+
低 · 代码控制
+
高 · 依赖能力
+
+
+
+ + +
+ 长期取向 + 流程固定场景(审批、合规)→ 显式图;模型能力提升 + harness engineering 趋势减少硬编码结构 → 隐式循环可能在长期占优 +
+
+ + +
+ → agentic-systems · implicit-loop-architecture · harness-engineering · durable-execution + langchain-ai.github.io/langgraph +
+
+ + diff --git a/site/src/content/cards/zh/sources/meta-i-jepa.mdx b/site/src/content/cards/zh/sources/meta-i-jepa.mdx new file mode 100644 index 0000000..4b6bf9c --- /dev/null +++ b/site/src/content/cards/zh/sources/meta-i-jepa.mdx @@ -0,0 +1,127 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: I-JEPA — Image Joint Embedding Predictive Architecture +titleAlt: Meta I-JEPA LeCun 2023 +tagline: Meta AI · 预测抽象表征而非像素 · 原始世界模型 · 2-10× 训练效率 · 2023 +author: Meta AI +year: 2023 +url: https://ai.meta.com/blog/yann-lecun-ai-model-i-jepa/ +refs: + - concepts/world-models + - concepts/self-supervised-learning + - entities/yann-lecun +sourceLine: Meta AI Blog 2023 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · I-JEPA · Meta AI · LeCun 世界模型愿景 · 2023 + + + +

I-JEPA:预测表征而非像素

+

"基于 LeCun 愿景的首个 AI 模型"——构建原始世界模型

+
+ + +
+ + + + CONTEXT + + + + + + masked regions + + + + + + + encode + + + + PREDICTOR + 原始 + 世界模型 + + + + + + + + + TARGET + + ≠ pixels + 抽象表征 + semantic level + + + + 在表征空间而非像素空间预测——避免过度关注无关细节 + self-supervised · multi-block masking · ViT backbone + +
+
+ + +
+
+
632M
+
ViT 参数
+
+
+
16 A100
+
<72 小时
+
+
+
12/类
+
ImageNet low-shot SOTA
+
+
+
2-10×
+
GPU 时间节省
+
+
+
+ + +
+ → world-models · self-supervised · yann-lecun + ai.meta.com/blog +
+
+ + diff --git a/site/src/content/cards/zh/sources/nvidia-energy-based-diffusion-lm.mdx b/site/src/content/cards/zh/sources/nvidia-energy-based-diffusion-lm.mdx new file mode 100644 index 0000000..8255866 --- /dev/null +++ b/site/src/content/cards/zh/sources/nvidia-energy-based-diffusion-lm.mdx @@ -0,0 +1,147 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Energy-Based Diffusion Language Models +titleAlt: NVIDIA EDLM ICLR 2025 +tagline: NVIDIA/Stanford · EBM 修正离散扩散 · 并行采样 · 挑战自回归范式 · ICLR 2025 +author: Xu · Geffner · Kreis · Nie (Stanford / NVIDIA) +year: 2025 +url: https://research.nvidia.com/publication/2025-01_energy-based-diffusion-language-models-text-generation +refs: + - concepts/diffusion-language-models + - concepts/autoregressive-models + - concepts/energy-based-models +sourceLine: ICLR 2025 · NVIDIA Research +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · EDLM · NVIDIA / Stanford · ICLR 2025 · 挑战 AR 范式 + + + +

能量模型 × 扩散语言模型

+

在每个扩散步骤引入残差 EBM——修正近似误差 · 减步数不退化

+
+ + +
+
+
+ 主流 + Autoregressive +
+
+ + + + + + + + + + t₀ + t₁ + t₂ + ... + +
+
逐 token 串行 · 顺序依赖
+
+
+
+ 挑战 + Diffusion + EBM +
+
+ + + + + + + + + + +
+
并行生成 · EBM 每步修正
+
+
+ +
+ 核心创新 +
+ 残差式 EBM + 在每个扩散步骤全序列级评估,修正底层近似误差——解决减步数时性能退化 +
+
+ 参数来源 + 从预训练 AR 模型获取,或通过噪声对比估计微调双向 Transformer +
+
+ 高效采样 + 并行重要性采样 · 比现有扩散模型加速 1.3× +
+
+
+ + +
+ 定位 + 挑战「所有 LLM 都是自回归」假设——困惑度尚未追平 AR,但正在接近。代表 LLM 架构多元化的趋势。 +
+
+ + +
+ → diffusion-lm · autoregressive-models · energy-based-models + research.nvidia.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-harness-engineering.mdx b/site/src/content/cards/zh/sources/openai-harness-engineering.mdx new file mode 100644 index 0000000..ec86469 --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-harness-engineering.mdx @@ -0,0 +1,126 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Harness Engineering — Leveraging Codex in an Agent-First World +titleAlt: OpenAI Harness Engineering 2026 +tagline: OpenAI · 5个月 零人工编码 · 100万行 · 1500+PR · Humans steer / Agents execute · 2026 +author: Ryan Lopopolo (OpenAI) +year: 2026 +url: https://openai.com/index/harness-engineering/ +refs: + - concepts/harness-engineering + - concepts/agent-legibility + - concepts/long-running-agents +sourceLine: OpenAI Engineering 2026 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · HARNESS ENGINEERING · OpenAI · 5 个月零人工编码实验 · 2026 + + + +

为 Agent-First 世界设计 Harness

+

工程师不再写代码——设计环境、表达意图、构建反馈回路

+
+ + +
+
"
+
Humans steer.
Agents execute.
+
当 agent 卡住时,不是"再试一次"——而是问「缺什么能力,怎么让它对 agent 可读且可执行」
+
+
+ + +
+
+
1M
+
行代码
+
+
+
1500+
+
PR
+
+
+
3.5
+
PR/人/天
+
+
+
6hr+
+
单次 Codex 运行
+
+
+
+ + +
+
Repository as Knowledge
+
AGENTS.md = 目录(~100 行)+ 结构化 docs/ + 渐进披露 + linter 机械验证新鲜度
+
+
+
Agent Legibility
+
Slack/GDocs 的知识对 agent 不可见——运行时访问不到 = 不存在
+
+
+
Enforce Invariants
+
Types→Config→Repo→Service→Runtime→UI,依赖方向机械化执行
+
+
+
熵的垃圾回收
+
golden principles 编码 + 后台 agent 扫描偏差 + 自动开修复 PR
+
+
+ + +
+ → harness-engineering · agent-legibility · long-running-agents + openai.com/index/harness-engineering +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-introducing-codex.mdx b/site/src/content/cards/zh/sources/openai-introducing-codex.mdx new file mode 100644 index 0000000..3e6ae62 --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-introducing-codex.mdx @@ -0,0 +1,113 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Introducing Codex +titleAlt: OpenAI Codex Release +tagline: OpenAI · 云端软件工程 agent · 并行多任务 · codex-1(o3 微调)· AGENTS.md 引导 +author: OpenAI +year: 2025 +url: https://openai.com/index/introducing-codex/ +refs: + - entities/codex + - concepts/harness-engineering + - entities/openai +sourceLine: OpenAI News +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; + + + 源头 · INTRODUCING CODEX · OpenAI · 产品发布公告 + + + +
+
Codex
+
云端软件工程 agent
+
+ 基础 + 基于 codex-1——o3 针对软件工程的 RL 微调版;每个任务在独立沙箱中运行,预装用户仓库 +
+ +
+
+
AGENTS.md 引导
+
仓库内文本文件指导 agent 如何导航代码、跑测试、守规范
+
+
+
RL 微调
+
在真实编码任务上训练——产出更接近人类风格的代码
+
+
+
可验证性
+
terminal logs · test outputs 提供操作证据链
+
+
+
安全设计
+
不确定时明确沟通——用户需审查所有生成的代码
+
+
+
+
+ + +
+ 并行多任务 · 沙箱隔离 · 可审计日志——云端软工 agent的产品化入场券 +
+
+ + +
+ → codex · harness-engineering · openai + openai.com/index/introducing-codex +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-introducing-structured-outputs.mdx b/site/src/content/cards/zh/sources/openai-introducing-structured-outputs.mdx new file mode 100644 index 0000000..eb08224 --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-introducing-structured-outputs.mdx @@ -0,0 +1,168 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Introducing Structured Outputs in the API +titleAlt: OpenAI Structured Outputs +tagline: OpenAI · JSON Schema → CFG → token masking · 40% → 100% 合规 · 2024-08-06 +author: OpenAI +year: 2024 +url: https://openai.com/index/introducing-structured-outputs-in-the-api/ +refs: + - concepts/structured-outputs + - concepts/constrained-decoding + - concepts/context-free-grammar-llm +sourceLine: OpenAI News 2024-08-06 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · STRUCTURED OUTPUTS · OpenAI · CFG + token masking · 2024-08-06 + + + +

JSON Schema × CFG × Token Masking

+

在推理层面的硬性约束——符号规则削减神经生成的自由度

+
+ + +
+
+
gpt-4-0613
+
+
+
+
~40%
+
+
+
+
gpt-4o-2024-08-06
+
+
+
+
100%
+
+
Schema 合规率 · evals
+
+
+ + +
+
+
1
+
JSON Schema
+
开发者提供期望格式
+
+
+
+
2
+
→ CFG(上下文无关文法)
+
预处理并缓存;支持 FSM 无法处理的递归结构
+
+
+
+
3
+
每步 Token 采样
+
根据已生成 token + CFG 规则动态计算合法 next-token 集合
+
+
+
+
4
+
Token Masking
+
非法 token 概率 mask 为 0——模型在合法子集上选择
+
+
+
+ + +
+
tools strict: true——约束 function calling 参数
+
response_format json_schema——直接约束生成内容
+
+
+ + +
+ → structured-outputs · constrained-decoding · context-free-grammar-llm · aci + openai.com/index +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-practical-guide-building-agents.mdx b/site/src/content/cards/zh/sources/openai-practical-guide-building-agents.mdx new file mode 100644 index 0000000..02085b0 --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-practical-guide-building-agents.mdx @@ -0,0 +1,135 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: A Practical Guide to Building Agents +titleAlt: OpenAI Practical Agent Guide +tagline: OpenAI · Model+Tools+Instructions 三件套 · 单 Agent 优先 · 分层 Guardrails +author: OpenAI +year: 2025 +url: https://openai.com/business/guides-and-resources/a-practical-guide-to-building-ai-agents/ +refs: + - concepts/agentic-systems + - concepts/guardrails + - concepts/tool-design +sourceLine: OpenAI Business Guide +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · PRACTICAL AGENT GUIDE · OpenAI 业务指南 + + + +

构建 Agent 的实务指南

+

从单 agent 开始 · 证据驱动升级 · guardrails 作为一等概念

+
+ + + 三件套——Model(先最强、再替换)× Tools(Data / Action / Orchestration 三类)× Instructions(从文档生成、分解为小步骤)。编排定律:先最大化单 agent 能力,再考虑拆分。 + + + +
+
SINGLE
+
单 Agent
+
一个 model + tools + instructions 在循环中运行。用 prompt templates 管理复杂度。
+
默认起点——只有性能下降才拆分
+
+
+
MULTI
+
多 Agent
+
Manager(中央 tool call 调度)或 Decentralized(peer handoff)。
+
条件分支过多 / 工具重叠时启用
+
+
+ + +
Guardrails · 分层防御 · Optimistic Execution
+
+
+ 01Relevance过滤离题输入 +
+
+ 02Safetyjailbreak / prompt injection 检测 +
+
+ 03PII Filter防个人信息泄露 +
+
+ 04Moderation有害内容过滤 +
+
+ 05Tool Safeguards按风险等级分级工具 +
+
+ 06Rules-Basedblocklist · 长度限制 · regex +
+
+ 07Output Validation品牌一致性检查 +
+
+
+ + +
+ → agentic-systems · guardrails · tool-design · handoff + openai.com/business/guides +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-unlocking-codex-harness.mdx b/site/src/content/cards/zh/sources/openai-unlocking-codex-harness.mdx new file mode 100644 index 0000000..9dfc19f --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-unlocking-codex-harness.mdx @@ -0,0 +1,148 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Unlocking the Codex Harness — App Server +titleAlt: OpenAI Codex App Server +tagline: OpenAI · JSON-RPC over stdio · Thread ⊃ Turn ⊃ Item · 多客户端统一接口 +author: Celia Chen (OpenAI) +year: 2026 +url: https://openai.com/index/unlocking-the-codex-harness/ +refs: + - entities/codex + - concepts/implicit-loop-architecture + - concepts/harness-engineering +sourceLine: OpenAI Engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CODEX APP SERVER · OpenAI · JSON-RPC over stdio + + + +

解锁 Codex Harness

+

双向 JSON-RPC over stdio · 统一驱动 CLI / IDE / Web / Desktop

+
+ + + 会话原语三层嵌套:Thread(持久容器,可 fork/归档)⊃ Turn(一次完整输入-输出)⊃ Item(原子 I/O 带生命周期) + + + +
+
+
THREAD · 持久容器
+
create / resume / fork / archive
+
+
TURN · 一轮
+
user input → agent 完成输出
+
+
ITEM · 原子单元
+
+ user msg + agent msg + tool exec + approval + diff +
+
生命周期 · started → delta → completed
+
+
+
+
+
+ + +
+
+
表面
+
集成方式
+
+
+
IDE / Desktop
+
捆绑平台二进制 · 长驻子进程 + stdio
+
+
+
Web
+
容器内启动 App Server · HTTP + SSE
+
+
+
TUI / CLI
+
重构为标准 App Server 客户端
+
+
+
+ + +
+ → codex · implicit-loop-architecture · harness-engineering · mcp + openai.com/index +
+
+ + diff --git a/site/src/content/cards/zh/sources/openai-unrolling-codex-agent-loop.mdx b/site/src/content/cards/zh/sources/openai-unrolling-codex-agent-loop.mdx new file mode 100644 index 0000000..277b68c --- /dev/null +++ b/site/src/content/cards/zh/sources/openai-unrolling-codex-agent-loop.mdx @@ -0,0 +1,125 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Unrolling the Codex Agent Loop +titleAlt: OpenAI Codex Agent Loop +tagline: OpenAI · 循环机制 · Prompt 7 层优先级 · Prompt Caching · Compaction 演进 +author: OpenAI Codex Team +year: 2026 +url: https://openai.com/index/unrolling-the-codex-agent-loop/ +refs: + - concepts/implicit-loop-architecture + - entities/codex + - concepts/context-management +sourceLine: OpenAI Engineering +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CODEX AGENT LOOP · OpenAI · 循环机制 + Prompt 层级 + + + +

拆解 Codex Agent Loop

+

循环由模型 tool call 驱动——以 assistant message 结束 turn

+
+ + +
+ + + + + PROMPT + 构建 + + + + MODEL + Responses API + + + + TOOL + call 执行 + + + + ASSISTANT MSG + turn 结束信号 + + + + + + + + + + loop until final + +
+
+ + + PROMPT 构建 · 优先级递减 +
+
1System messageserver 控制
+
2Instructionsgpt-5.2-codex_prompt.md
+
3ToolsCodex 内建 + Responses API + MCP
+
4Developer messagesandbox 权限 · 审批模式
+
5User instructionsAGENTS.md 层级聚合 · skills
+
6Env contextcwd · shell
+
7User message本轮输入
+
+
+ + +
+ Prompt Caching + 后续请求是前序的精确前缀——O(n²) 采样成本 → O(n)。破坏 cache:改 tools · 切模型 · 改 sandbox。MCP tools/list_changed 尤其棘手 +
+
+ + +
+ → implicit-loop-architecture · codex · context-management · prompt-caching + openai.com/index +
+
+ + From 8be003833fd1a3c3465fa4329b2c5720bcc72aa3 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 21:09:51 +0800 Subject: [PATCH 39/48] =?UTF-8?q?feat(cards):=20batch=2016/18=20=E2=80=94?= =?UTF-8?q?=20sources/reliability+context-engineering+harness-practice=20(?= =?UTF-8?q?14=20cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 14 cards on reliability science, context engineering practice, and harness engineering: pets-vs-cattle + beyond-pass@1 / ReliabilityBench + context-rot / Manus / Factory compression / dont-break-the-cache + cli-anything / swe-evo / george-zhang / schneier / memgpt / llmstxt. Co-Authored-By: Claude Opus 4.7 (1M context) --- ...beyond-pass-at-1-reliability-framework.mdx | 127 ++++++++++++++ .../sources/bias-pets-vs-cattle-summary.mdx | 124 +++++++++++++ .../cards/zh/sources/bias-pets-vs-cattle.mdx | 119 +++++++++++++ .../cards/zh/sources/chroma-context-rot.mdx | 134 ++++++++++++++ .../content/cards/zh/sources/cli-anything.mdx | 138 +++++++++++++++ .../cards/zh/sources/dont-break-the-cache.mdx | 165 ++++++++++++++++++ ...factory-evaluating-context-compression.mdx | 150 ++++++++++++++++ ...-zhang-harness-engineering-cybernetics.mdx | 152 ++++++++++++++++ .../sources/llmstxt-org-the-llms-txt-file.mdx | 161 +++++++++++++++++ .../zh/sources/manus-context-engineering.mdx | 135 ++++++++++++++ ...mgpt-towards-llms-as-operating-systems.mdx | 115 ++++++++++++ .../cards/zh/sources/reliabilitybench.mdx | 124 +++++++++++++ .../sources/schneier-ooda-loop-agentic-ai.mdx | 119 +++++++++++++ site/src/content/cards/zh/sources/swe-evo.mdx | 153 ++++++++++++++++ 14 files changed, 1916 insertions(+) create mode 100644 site/src/content/cards/zh/sources/beyond-pass-at-1-reliability-framework.mdx create mode 100644 site/src/content/cards/zh/sources/bias-pets-vs-cattle-summary.mdx create mode 100644 site/src/content/cards/zh/sources/bias-pets-vs-cattle.mdx create mode 100644 site/src/content/cards/zh/sources/chroma-context-rot.mdx create mode 100644 site/src/content/cards/zh/sources/cli-anything.mdx create mode 100644 site/src/content/cards/zh/sources/dont-break-the-cache.mdx create mode 100644 site/src/content/cards/zh/sources/factory-evaluating-context-compression.mdx create mode 100644 site/src/content/cards/zh/sources/george-zhang-harness-engineering-cybernetics.mdx create mode 100644 site/src/content/cards/zh/sources/llmstxt-org-the-llms-txt-file.mdx create mode 100644 site/src/content/cards/zh/sources/manus-context-engineering.mdx create mode 100644 site/src/content/cards/zh/sources/memgpt-towards-llms-as-operating-systems.mdx create mode 100644 site/src/content/cards/zh/sources/reliabilitybench.mdx create mode 100644 site/src/content/cards/zh/sources/schneier-ooda-loop-agentic-ai.mdx create mode 100644 site/src/content/cards/zh/sources/swe-evo.mdx diff --git a/site/src/content/cards/zh/sources/beyond-pass-at-1-reliability-framework.mdx b/site/src/content/cards/zh/sources/beyond-pass-at-1-reliability-framework.mdx new file mode 100644 index 0000000..9b2efae --- /dev/null +++ b/site/src/content/cards/zh/sources/beyond-pass-at-1-reliability-framework.mdx @@ -0,0 +1,127 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Beyond pass@1 — Reliability Science for Long-Horizon Agents +titleAlt: Reliability Framework arXiv 2603.29231 +tagline: Khanal et al. · 四指标 RDC/VAF/GDS/MOP · 可靠性 ≠ 能力 · arXiv 2603.29231 +author: Khanal · Tao · Zhou (NKU) +year: 2026 +url: https://arxiv.org/abs/2603.29231 +refs: + - concepts/reliability-decay + - concepts/long-running-agents + - concepts/agent-reliability-evaluation +sourceLine: arXiv 2603.29231 · 2026-03-31 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · BEYOND pass@1 · arXiv 2603.29231 · 可靠性科学 · 2026-03-31 + + + +

超越 pass@1 · 长时 Agent 的可靠性科学

+

pass@1 衡量能力 · 生产部署需要的是跨时长、跨领域的一致成功

+
+ + + 可靠性 ≠ 能力。四指标框架——RDC 衰减曲线 · VAF 方差放大因子 · GDS 优雅退化 · MOP 熔断起始点——各自捕获 pass@1 丢失的维度。 + + + +
+
+
+ RDC + Reliability Decay Curve +
+
pass^k 随任务时长的衰减曲线——越平越好
+
线性回归斜率 RDS 作标量摘要
+
+
+
+ VAF + Variance Amplification Factor +
+
长 / 短任务 pass@1 方差比——高 VAF ≥ 2.37 是能力标志
+
反直觉:稳定失败 ≠ 好
+
+
+
+ GDS + Graceful Degradation Score +
+
部分完成的加权评分(0-1)——pass@1→0 时仍区分模型
+
二进制评估丢掉的信息越来越多
+
+
+
+ MOP + Meltdown Onset Point +
+
工具调用分布熵突然飙升——agent 进入无序状态
+
悖论:前沿模型熔断率最高
+
+
+
+ + +
+
衰减形态76.3% → 52.1% · 超过独立错误的几何衰减 · 错误正相关
+
领域决定斜率SE 代码 GDS 0.90→0.44 · DP 文档 0.74→0.71 · 不能同等看待
+
记忆脚手架全败6 坏 / 4 平 / 0 好——便签本占 context 的代价 > 收益
+
+
+ + +
+ → reliability-decay · long-running-agents · agent-reliability-evaluation · reliabilitybench + arXiv 2603.29231 +
+
+ + diff --git a/site/src/content/cards/zh/sources/bias-pets-vs-cattle-summary.mdx b/site/src/content/cards/zh/sources/bias-pets-vs-cattle-summary.mdx new file mode 100644 index 0000000..d557f1c --- /dev/null +++ b/site/src/content/cards/zh/sources/bias-pets-vs-cattle-summary.mdx @@ -0,0 +1,124 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Pets vs Cattle — Summary +titleAlt: bias-pets-vs-cattle 摘要 +tagline: 可处置性是核心 · 从 infra 迁移到 agent 架构 · managed-agents 引用的 meme 源 +author: wiki 摘要(基于 Randy Bias 2016) +year: 2026 +url: https://cloudscaling.com/blog/cloud-computing/the-history-of-pets-vs-cattle/ +refs: + - concepts/bias-pets-vs-cattle + - concepts/agent-sandboxing +sourceLine: wiki 摘要 · Randy Bias 2016 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头摘要 · PETS vs CATTLE · wiki 综合 · Bias 2016 + + + +

Pets vs Cattle 摘要

+

云时代术语——2026 年被引入 agent 架构

+
+ + +
+
+ Bias(2011-2012)将 Bill Baker 的 scale-up / scale-out 类比重新定位为可处置性——
+ "服务器是不可失去的唯一个体,还是可随时替换的群体成员?" +
+
+ 关键纠偏:k8s Pet Sets 把 Cassandra/Kafka 等 cattle 架构叫「pet」是误用—— + pets ≠ stateful,cattle = designed-for-failure +
+
+
+ + + 向 Agent 架构的迁移 +
+
+ 单容器 session + + Brain / Hands / Session 解耦 +
+
+ 容器故障 = 丢 session + + session 外部化 · wake() 恢复 +
+
+ 凭证进容器 + + 凭证永不进 sandbox +
+
+ 参考 + Anthropic Managed Agents 把这个模式从 infra 引入 agent +
+
+
+ + +
+ → bias-pets-vs-cattle · managed-agents · agent-sandboxing + wiki 摘要 +
+
+ + diff --git a/site/src/content/cards/zh/sources/bias-pets-vs-cattle.mdx b/site/src/content/cards/zh/sources/bias-pets-vs-cattle.mdx new file mode 100644 index 0000000..b8b9e47 --- /dev/null +++ b/site/src/content/cards/zh/sources/bias-pets-vs-cattle.mdx @@ -0,0 +1,119 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The History of Pets vs Cattle +titleAlt: Randy Bias 2016 — Pets vs Cattle Canonical Definition +tagline: Randy Bias · cloudscaling · 可处置性 vs 独特性 · 2011→2016 规范史 · cloud meme 之源 +author: Randy Bias +year: 2016 +url: https://cloudscaling.com/blog/cloud-computing/the-history-of-pets-vs-cattle/ +refs: + - concepts/bias-pets-vs-cattle + - concepts/agent-sandboxing +sourceLine: cloudscaling.com 2016-09-19 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · PETS vs CATTLE · Randy Bias · cloudscaling · 2016 + + + +

宠物 vs 牲畜——云时代的分水岭

+

Bias 将 Bill Baker 的 scale-up/out 类比重解为「可处置性 vs 独特性」

+
+ + + + "In the old way, we treat servers like pets — Bob the mail server. If Bob goes down, it's all hands on deck. In the new way, servers are numbered like www001 to www100. When one goes down, it's taken out back, shot, and replaced on the line." + + + + +
+
🐕
+
PETS
+
被当作不可或缺、独特的系统——从不宕机
+
    +
  • 手工搭建、人工照料
  • +
  • Bob, the mail server · 实名
  • +
  • 主机 · HA loadbalancer · master/slave DB
  • +
  • 宕机 = 紧急事件
  • +
+
+
+
🐂
+
CATTLE
+
>2 台服务器的阵列,自动化构建,为失败而设计
+
    +
  • 自动化构建、设计为可失败
  • +
  • www001 ~ www100 · 编号
  • +
  • Web 阵列 · Cassandra 集群 · 多 master
  • +
  • 宕机 = 自动路由绕过
  • +
+
+
+ + +
+ 核心不是扩展方向 + 可处置性(disposability)与独特性(uniqueness)才是分水岭——k8s Pet Sets 把 Cassandra 叫 pet 是误用 +
+
+ + +
+ → bias-pets-vs-cattle · managed-agents · agent-sandboxing + cloudscaling.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/chroma-context-rot.mdx b/site/src/content/cards/zh/sources/chroma-context-rot.mdx new file mode 100644 index 0000000..c1f2802 --- /dev/null +++ b/site/src/content/cards/zh/sources/chroma-context-rot.mdx @@ -0,0 +1,134 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Context Rot — How Input Length Impacts LLM Performance +titleAlt: Chroma Context Rot 2025 +tagline: Chroma Research · 18 前沿 LLM · 三种退化机制 · NIAH 基准不够 · 2025 +author: Hong · Troynikov · Huber (Chroma) +year: 2025 +url: https://research.trychroma.com/context-rot +refs: + - concepts/context-rot + - concepts/context-management + - concepts/long-running-agents +sourceLine: Chroma Research 2025 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CONTEXT ROT · Chroma Research · 18 LLM 系统实验 · 2025 + + + +

Context Rot · 上下文腐烂

+

模型性能随输入长度增长可测量地退化——即使在极简单任务上

+
+ + + 方法论贡献——保持任务难度不变、仅变化输入长度,隔离输入长度本身作为性能退化变量。所有 18 个前沿模型无一例外:更多 token = 性能退化。 + + + +
三种退化机制
+
+
+
+
+
Needle-Question Similarity
+
低相似度配对在短 context 下可成功、在长 context 下退化——退化不源于任务难度,而源于输入长度
+
+
+
+
+
+
Distractor Interference
+
单个 distractor 即降低性能,四个更糟——不同 distractor 影响非均匀,随输入长度放大
+
+
+
+
+
+
Haystack Structure Effect
+
反直觉——连贯结构的 haystack 反而比随机打乱更损害性能,注意力机制对输入结构敏感
+
+
+
+ +
+ 模型行为差异 · 同压力下的策略分野 +
+ Claude + 保守——不确定倾向弃权("找不到答案"),幻觉率最低 +
+
+ GPT + 自信——面对 distractor 倾向生成似是而非的错误答案,幻觉率最高 +
+
+
+ + +
+ 关键启示 + NIAH 基准仅测词汇级检索——高分不代表长 context 能力可靠。信息如何呈现与信息是否在 context 中同等重要。 +
+
+ + +
+ → context-rot · context-management · long-running-agents · mechanistic-interpretability + research.trychroma.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/cli-anything.mdx b/site/src/content/cards/zh/sources/cli-anything.mdx new file mode 100644 index 0000000..7a6e2c2 --- /dev/null +++ b/site/src/content/cards/zh/sources/cli-anything.mdx @@ -0,0 +1,138 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: CLI-Anything — Making All Software Agent-Native +titleAlt: HKUDS CLI-Anything +tagline: HKUDS · 29.8K ★ · 7 阶段流水线 · 20+ CLI · CLI-Hub · Agent-Native Software 宣言 +author: HKUDS +year: 2026 +url: https://github.com/HKUDS/CLI-Anything +refs: + - concepts/agent-native-software + - concepts/cli-vs-gui-automation + - concepts/repl-for-agents +sourceLine: HKUDS / CLI-Anything · 2026-04 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CLI-ANYTHING · HKUDS · 29.8K ★ · Agent-Native Software · 2026-04 + + + +
+
+ "Today's software serves humans.
+ Tomorrow's users will be agents." +
+
+ 不要等 agent 变聪明(会点鼠标)——让软件变得 agent 听话。 +
+
+
+ + +

CLI-Anything · 软件的 Agent 化

+

7 阶段流水线把任意 GUI 软件转为 agent 可驱动的 CLI · 2130 测试 · 100% 通过

+
+ + + 7 阶段自动生成流水线 +
+
1Analyze扫描源码 · 识别 backend engine · GUI → API 映射
+
2Design命令分组 · 状态模型 · 输出格式
+
3ImplementClick + REPL + JSON + undo/redo
+
4Plan TestsTEST.md · 单元 + E2E 计划
+
5Write Tests无 graceful degradation · 真实后端验证
+
6Document跑测试 · 更新 TEST.md 结果
+
6.5Skill Gen自动生成 SKILL.md——agent 可发现
+
7Publishpip install -e . · 命中 PATH
+
+
+ + +
+
Why CLI
+
    +
  • 结构化可组合
  • +
  • 自描述(--help 免费)
  • +
  • Agent-First(--json
  • +
  • 确定性可预测
  • +
+
+
+
核心原则
+
    +
  • Authentic integration
  • +
  • 双模式(REPL + subcmd)
  • +
  • ReplSkin 统一皮肤
  • +
  • Agent-native 设计
  • +
+
+
+ + +
+ → agent-native-software · cli-vs-gui-automation · repl-for-agents · aci · tool-design + github.com/HKUDS/CLI-Anything +
+
+ + diff --git a/site/src/content/cards/zh/sources/dont-break-the-cache.mdx b/site/src/content/cards/zh/sources/dont-break-the-cache.mdx new file mode 100644 index 0000000..dd3e3ca --- /dev/null +++ b/site/src/content/cards/zh/sources/dont-break-the-cache.mdx @@ -0,0 +1,165 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Don't Break the Cache — Prompt Caching in Long-Horizon Agents +titleAlt: arXiv 2601.06007 Prompt Caching Evaluation +tagline: arXiv 2601.06007 · 500+ session · system-prompt-only 最一致 · 成本 ↓45-80% +author: arXiv preprint +year: 2026 +url: https://arxiv.org/html/2601.06007v1 +refs: + - concepts/prefix-caching + - concepts/context-compression + - concepts/harness-engineering +sourceLine: arXiv 2601.06007 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · DON'T BREAK THE CACHE · arXiv 2601.06007 · DeepResearchBench 500+ session + + + +

不要破坏缓存

+

长 horizon agent 任务的 prompt caching 评估——策略选择的经济学

+
+ + +
三种缓存策略 · DeepResearchBench 对照
+
+
+
Full-Context
+
缓存整个不断增长的消息历史(含工具结果)
+
写入频繁 · 命中极少 · 悖论性增加延迟
+
+
+
System-Prompt-Only
+
只缓存稳定的 system prompt + 工具定义
+
成本 ↓45–80% · TTFT ↓13–31%
+
+
+
No Caching
+
不启用——每次全量 prefill
+
基线
+
+
+ +
+ Agent 中破坏 Cache 的四类来源 +
1system prompt 嵌入的时间戳 · 日期字符串 · session ID
+
2每个 session 动态发现的工具(tools 数组每次不同)
+
3早期 prompt 位置的 UUID / session 特定工具结果
+
4agent loop 迭代间的任何前缀变更
+
+
+ + +
+
+
Provider
+
机制
+
成本节省
+
+
+
Anthropic
+
显式 cache_control · lookback 20 block
+
45–80%
+
+
+
OpenAI
+
自动 · ≥1024 token · 128 token 粒度
+
45–80%
+
+
+
Moonshot
+
自动 + x-session-affinity
+
45–80%
+
+
+
+ + +
+ 现实期望 + 13–31% TTFT ≪ 厂商宣传的 80%——长 session 整体延迟主要由 decode 时间决定,不是 prefill +
+
+ + +
+ → prefix-caching · context-compression · harness-engineering · manus-context-engineering + arXiv 2601.06007 +
+
+ + diff --git a/site/src/content/cards/zh/sources/factory-evaluating-context-compression.mdx b/site/src/content/cards/zh/sources/factory-evaluating-context-compression.mdx new file mode 100644 index 0000000..6d78872 --- /dev/null +++ b/site/src/content/cards/zh/sources/factory-evaluating-context-compression.mdx @@ -0,0 +1,150 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Evaluating Context Compression for AI Agents +titleAlt: Factory Compression Evaluation 2025 +tagline: Factory Research · probe-based 评估 · Factory 3.70 vs Anthropic 3.44 vs OpenAI 3.35 · 2025-12 +author: Factory Research +year: 2025 +url: https://factory.ai/news/evaluating-compression +refs: + - concepts/context-compression + - concepts/context-management + - entities/factory-ai +sourceLine: Factory Research 2025-12-16 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CONTEXT COMPRESSION EVAL · Factory Research · 2025-12-16 + + + +

AI Agent 的 Context 压缩评估

+

36000+ 消息真实 session · 三种生产级方案 · probe-based 功能质量测试

+
+ + + 结构化摘要在不牺牲压缩效率前提下保留更多有用信息。压缩率是错误目标——正确目标是 tokens per task,而非 tokens per request。 + + + +
+
+
01
+
Factory
+
锚定式迭代摘要
+
3.70
+
+
+
+
02
+
Anthropic
+
Claude SDK 内建
+
3.44
+
+
+
+
03
+
OpenAI
+
/responses/compact
+
3.35
+
+
+
+ +
+
Probe Types · 四类功能探针
+
Recall事实保留:"原始错误信息是什么?"
+
Artifact文件追踪:"修改了哪些文件?"(所有方法仅 2.19–2.45
+
Continuation任务规划:"下一步该做什么?"
+
Decision推理链:"我们对 Redis 的决策是什么?"
+
+
+ + +
+ 核心洞察 + 结构迫使保留——文件路径从信息论看是低熵,但恰是 agent 继续工作所需。显式 section 防止自由格式摘要的静默漂移。 +
+
+ + +
+ → context-compression · context-management · factory-ai · context-rot + factory.ai/news +
+
+ + diff --git a/site/src/content/cards/zh/sources/george-zhang-harness-engineering-cybernetics.mdx b/site/src/content/cards/zh/sources/george-zhang-harness-engineering-cybernetics.mdx new file mode 100644 index 0000000..1c6e795 --- /dev/null +++ b/site/src/content/cards/zh/sources/george-zhang-harness-engineering-cybernetics.mdx @@ -0,0 +1,152 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Harness Engineering as the Cybernetics of the Agent Era +titleAlt: George Zhang Harness × Cybernetics +tagline: George Zhang · OpenClaw · 三次同构(瓦特/K8s/Agent)· 人从执行者变设计者 · 控制论视角 +author: George Zhang (OpenClaw) +year: 2026 +url: https://jimo.studio/blog/harness-engineering-why-it-is-the-cybernetics-of-the-agent-era/ +refs: + - concepts/harness-engineering + - concepts/cybernetics + - concepts/guardrails +sourceLine: jimo.studio/blog · George Zhang +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · HARNESS = CYBERNETICS · George Zhang · OpenClaw + + + +

Harness Engineering 是 Agent 时代的控制论

+

三次同构——瓦特离心调速器 → K8s controller → Agent harness

+
+ + +
+
+
时代
+
控制对象
+
控制机制
+
人类角色
+
+ +
+
+
+
工业革命
+
1788
+
+
蒸汽机转速
+
离心调速器 (Watt Governor)
+
手动拧阀门 设计调速器
+
+ +
+
+
+
云计算
+
2014
+
+
服务状态
+
K8s controller (reconcile loop)
+
手动重启 编写目标 spec
+
+ +
+
+
+
Agent 时代
+
2025-
+
+
代码库
+
Harness (feedback loops)
+
手写代码 设计环境与规则
+
+
+
+ + + 共同模式——人从执行者变为设计者,从直接操控变为设定约束。Wiener 控制论的核心词 κυβερνήτης(舵手)精确描述了这个角色转变。 + + + +
+ 关键洞察 + "Agent 不会自主学习进化。如果不把知识写出来,agent 第一百次犯的错会和第一次一模一样。"——LLM 首次让架构一致性、设计方案正确性这些高层反馈回路可以闭合 +
+
+ + +
+ → harness-engineering · cybernetics · guardrails · aci + jimo.studio +
+
+ + diff --git a/site/src/content/cards/zh/sources/llmstxt-org-the-llms-txt-file.mdx b/site/src/content/cards/zh/sources/llmstxt-org-the-llms-txt-file.mdx new file mode 100644 index 0000000..a683aca --- /dev/null +++ b/site/src/content/cards/zh/sources/llmstxt-org-the-llms-txt-file.mdx @@ -0,0 +1,161 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The /llms.txt File — Agent-Native Web Convention +titleAlt: llmstxt.org Specification +tagline: Jeremy Howard (Answer.AI) · 网站为 LLM 策展的 Markdown 入口 · robots.txt 的 LLM 版 +author: Jeremy Howard +year: 2024 +url: https://llmstxt.org/ +refs: + - concepts/aci + - concepts/context-engineering + - entities/jeremy-howard +sourceLine: llmstxt.org · 2024-09-03 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · /llms.txt · Jeremy Howard · Answer.AI · 2024-09-03 + + + +

/llms.txt · 给 LLM 准备的网站入口

+

网站根路径的 Markdown 文件——为 LLM 提供结构化、精简的文档入口

+
+ + + 问题——LLM 的 context window 装不下整站内容,HTML 对 LLM 信噪比低。解法——在根路径放 /llms.txt,用 Markdown 策展一组 LLM 可读的"入口链接"。 + + + +
+
+ FILE FORMAT + /llms.txt · 固定顺序 +
+
+
H1 必填# 项目名
+
BLOCKQUOTE> 项目简介
+
段落 0+可选说明文字
+
H2 + LIST## 文档
+
- [文档标题](https://url): 可选说明
+
H2 "Optional"## Optional
+
- 可跳过以节约 context
+
+ +
+ 配套约定 · 与现有标准的互补 +
+
+
llms.txt
+
robots.txt
+
sitemap.xml
+
+
+
目标
+
推理时内容导航
+
爬取访问控制
+
搜索引擎索引
+
+
+
读者
+
LLM
+
爬虫
+
搜索引擎
+
+
+
粒度
+
策展子集
+
许可/禁止
+
全站页面
+
+
+
+
+ + +
+ 附加约定 + 适合 LLM 阅读的页面在原 URL 后加 .md(或 index.html.md)——直接提供干净 Markdown,跳过 HTML 解析 +
+
+ + +
+ → aci · context-engineering · jeremy-howard · answer-ai + llmstxt.org +
+
+ + diff --git a/site/src/content/cards/zh/sources/manus-context-engineering.mdx b/site/src/content/cards/zh/sources/manus-context-engineering.mdx new file mode 100644 index 0000000..0a2c5d7 --- /dev/null +++ b/site/src/content/cards/zh/sources/manus-context-engineering.mdx @@ -0,0 +1,135 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Manus — Context Engineering for AI Agents +titleAlt: Manus Context Engineering Lessons +tagline: Manus · Stochastic Graduate Descent · prefill/decode 100:1 · 五维框架 · 2025 +author: Yichao "Peak" Ji (Manus) +year: 2025 +url: https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus +refs: + - concepts/context-engineering + - concepts/prefix-caching + - concepts/context-management +sourceLine: Manus Blog +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · MANUS CONTEXT ENGINEERING · 四次重建总结 · 2025 + + + +

Manus 的 Context Engineering

+

Agent loop prefill/decode ≈ 100:1——KV cache 命中率是首要经济指标

+
+ + +
+ 成本差 10× + Claude Sonnet 缓存 $0.30/MTok vs 未缓存 $3.00/MTok——cache miss 的边际成本在 agent 场景被放大两个数量级 +
+
+ + +
+
+
+
KV Cache 是第一优先级
+
消除动态时间戳 · append-only 序列化 · Session ID 路由
+
+
+
+
掩蔽而非移除
+
工具始终留在 tools 数组 · 解码阶段屏蔽 logits 约束动作空间
+
+
+
+
文件系统为无限 Memory
+
URL / 路径必须保留——不可恢复压缩 = 数据销毁
+
+
+
+
todo.md 注意力操控
+
每轮更新——把全局目标推入近期位置的高注意力区
+
+
+
+
错误刻意保留
+
堆栈和错误信息 = 免费的 belief update · 清除 = 消除恢复能力
+
+
+
+
防 Few-shot 模式崩溃
+
在序列化模板/措辞上引入结构化变异——打破单一模式强化
+
+
+
+ + + 五维 Context Engineering 框架 · ZenML 整理 +
+
Offloading移出 context · 文件系统为主存
+
Reduction压缩/摘要 · 仅限可恢复
+
Retrieval按需检索 · 文件搜索
+
Isolation子 agent 独立 context
+
Cachingstable prefix + session affinity
+
+
+ + +
+ → context-engineering · prefix-caching · context-management · context-compression + manus.im/blog +
+
+ + diff --git a/site/src/content/cards/zh/sources/memgpt-towards-llms-as-operating-systems.mdx b/site/src/content/cards/zh/sources/memgpt-towards-llms-as-operating-systems.mdx new file mode 100644 index 0000000..a4cce4a --- /dev/null +++ b/site/src/content/cards/zh/sources/memgpt-towards-llms-as-operating-systems.mdx @@ -0,0 +1,115 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: MemGPT — Towards LLMs as Operating Systems +titleAlt: MemGPT arXiv 2310.08560 +tagline: UC Berkeley · 虚拟上下文管理 · RAM↔磁盘类比 · LLM-OS 工程化开端 · 2023-10 +author: Packer · Wooders · Lin · Fang · Patil · Stoica · Gonzalez +year: 2023 +url: https://arxiv.org/abs/2310.08560 +refs: + - concepts/virtual-context-management + - concepts/llm-os-analogy + - concepts/context-management +sourceLine: arXiv 2310.08560 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · MEMGPT · UC Berkeley · arXiv 2310.08560 · 2023-10-12 + + + +

MemGPT · LLM 作为操作系统

+

虚拟上下文管理——借鉴 OS 层次化内存突破 context window 约束

+
+ + + 不只是比喻——MemGPT 把虚拟内存管理的具体机制(分页、中断、层次化存储)映射到 LLM 上下文管理。中断 + 函数调用 = page fault 机制,实现 context 内外的自动数据迁移。 + + + +
+ + + + RAM + fast · limited + context window + ~128k tokens + main context · working set + + + + + DISK + slow · unbounded + external storage + archival · recall memory + persistent · addressable + + + + + + + + + page fault + evict + + + + 映射机制 · MAPPING + + + • LLM context window + = RAM + • archival / recall memory + = disk + • 函数调用 + = page fault + • 中断机制 + = 控制流调度 + + +
+
+ + +
+
长文档分析处理远超单个 context window 的文档
+
多会话聊天跨长期交互记忆、反思、动态演化的对话 agent
+
+
+ + +
+ → virtual-context-management · llm-os-analogy · context-management · long-running-agents + arXiv 2310.08560 +
+
+ + diff --git a/site/src/content/cards/zh/sources/reliabilitybench.mdx b/site/src/content/cards/zh/sources/reliabilitybench.mdx new file mode 100644 index 0000000..197d43b --- /dev/null +++ b/site/src/content/cards/zh/sources/reliabilitybench.mdx @@ -0,0 +1,124 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: ReliabilityBench — 3D Reliability Surface +titleAlt: ReliabilityBench arXiv 2601.06112 +tagline: Aayush Gupta · 三维评估 R(k,ε,λ) · 一致性/鲁棒性/容错性 · arXiv 2601.06112 +author: Aayush Gupta +year: 2026 +url: https://arxiv.org/abs/2601.06112 +refs: + - concepts/reliability-surface + - concepts/chaos-engineering-for-agents + - concepts/action-metamorphic-relations +sourceLine: arXiv 2601.06112 · 2026-01-03 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · RELIABILITYBENCH · arXiv 2601.06112 · 生产级压力评估 + + + +

ReliabilityBench · 三维可靠性曲面

+

首个系统性评估 agent 在生产级压力下可靠性的基准

+
+ + +
+ + + + + + + + + + k + 重复次数 + ε + 扰动 + λ + 故障率 + + + + + + + + + + + R(k, ε, λ) · 可靠性曲面 + + +
+
+ k · 一致性 + 重复执行同一任务的成功稳定度(pass^k) +
+
+ ε · 鲁棒性 + 输入扰动(同义替换、干扰注入)· 8.8% 退化 +
+
+ λ · 容错性 + 基础设施故障(超时、限流)· 比 ε 退化更陡 +
+
+
+
+ + +
+
+ 简单更抗压 + ReAct(0.900)> Reflexion(0.875)——反思机制在故障下反而放大错误 · 恢复 80.9% vs 67.3% +
+
+ 成本脱钩 + GPT-4o 成本是 Gemini Flash 的 82× · 可靠性仅差 0.6% +
+
+
+ + +
+ → reliability-surface · chaos-engineering-for-agents · action-metamorphic-relations · error-cascade + arXiv 2601.06112 +
+
+ + diff --git a/site/src/content/cards/zh/sources/schneier-ooda-loop-agentic-ai.mdx b/site/src/content/cards/zh/sources/schneier-ooda-loop-agentic-ai.mdx new file mode 100644 index 0000000..7154b03 --- /dev/null +++ b/site/src/content/cards/zh/sources/schneier-ooda-loop-agentic-ai.mdx @@ -0,0 +1,119 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Schneier's Blog Snapshot — Cognitive Security Taxonomy +titleAlt: Schneier OODA Loop Snapshot 2026-04 +tagline: Bruce Schneier · 博客首页截取 · 五层认知安全模型 · OODA 内容未覆盖 · 2026-04 +author: Bruce Schneier +year: 2026 +url: https://www.schneier.com/ +refs: + - concepts/guardrails + - concepts/ooda-loop + - concepts/llm-security +sourceLine: schneier.com 首页截取 · 2026-04-07 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · SCHNEIER SNAPSHOT · 博客首页 · 2026-04-07 + + + +

Schneier 博客快照(2026-04)

+

注:源文件为首页截取——原计划的 OODA 专题未覆盖,内容以认知安全为主

+
+ + +
+ 源限 + 本次 ingest 的是博客首页聚合,不是原计划的 "OODA Loop and Agentic AI" 专题文章。对 agent 工程有价值的点:认知安全分类 × Hackback 与 agent 安全边界 +
+
+ + + K. Melton 五层认知安全模型 · 与 Guardrails 分层平行 +
+
+
+
感知接口
+
输入传感层——类比 LLM 的 prompt 输入解析
+
+
+
+
神经编译器(System 1)
+
快速直觉加工——可绕过心核直接输出行为
+
+
+
+
心核(System 2)
+
慢速审慎推理——被动接受 System 1 输出或介入干预
+
+
+
+
网格
+
社会/组织层——多 agent 交互的涌现行为
+
+
+
+
文化基底
+
长时尺度的背景假设与价值观
+
+
+
+ + +
+ 结构对应 + 神经编译器绕过心核 ≈ LLM 越狱中语法连贯性特征绕过安全机制;多层各有独立漏洞 ≈ Guardrails 的输入/执行/输出分层 +
+
+ + +
+ → guardrails · ooda-loop · llm-security · hackback + schneier.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/swe-evo.mdx b/site/src/content/cards/zh/sources/swe-evo.mdx new file mode 100644 index 0000000..494417d --- /dev/null +++ b/site/src/content/cards/zh/sources/swe-evo.mdx @@ -0,0 +1,153 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: SWE-EVO — Long-Horizon Software Evolution Benchmark +titleAlt: SWE-EVO arXiv 2512.18470 +tagline: FPT Software AI · 48 任务 · 21 文件/任务 · 从 72% 断崖至 25% · 误差级联实证 · 2026 +author: Pham · Le · Manh · Phan · Bui (FPT Software AI) +year: 2026 +url: https://arxiv.org/abs/2512.18470 +refs: + - concepts/error-cascade + - concepts/long-running-agents + - concepts/harness-engineering +sourceLine: arXiv 2512.18470 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · SWE-EVO · FPT Software AI · arXiv 2512.18470 · 多步软件演进 + + + +

SWE-EVO · 多步软件演进基准

+

从「单点修复」升级为「版本演进」——48 任务 · 21 文件/任务 · 874 测试/任务

+
+ + + 从 SWE-Bench(单 issue)到 SWE-EVO(跨 release notes 演进),是量级跨越——强模型 72% → 25%。误差级联的直接证据:前一步小错在后续步骤被放大,多步成功率远低于单步的乘积。 + + + +
+
断崖式能力差距
+
+
+
GPT-5.4
+
+
SWE-Bench · 未测
+
SWE-EVO · 25.00%
+
+
+
+
GPT-5.2
+
+
SWE-Bench · 72.80%
+
SWE-EVO · 18.75–22.92%
+
+
+
+
GPT-5
+
+
SWE-Bench · 65.00%
+
SWE-EVO · 18.75–20.83%
+
+
+
+
DeepSeek V3p2
+
+
SWE-Bench · 70.00%
+
SWE-EVO · 20.83–23.40%
+
+
+
+
+ +
+ 失败模式分层 +
+ 强模型 + 主要失败在指令遵循(60%+)——理解歪了 release notes 的意图 +
+
+ 弱模型 + 基础语法错误、工具使用、陷入循环 +
+
SWE-EVO 的难度来自语义推理而非接口操作
+
+
+ + +
+ 模型 × 框架 + GLM-5 在 SWE-agent 上 37.5%(超 GPT-5.4),在 OpenHands 仅 8.33%——agent 能力是模型 × 框架的函数 +
+
+ + +
+ → error-cascade · long-running-agents · harness-engineering · feature-tracking + arXiv 2512.18470 +
+
+ + From d66688d4485f4e71cecc8b223830f7e8a668092a Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 21:18:20 +0800 Subject: [PATCH 40/48] =?UTF-8?q?feat(cards):=20batch=2017/18=20=E2=80=94?= =?UTF-8?q?=20sources/philosophy+causal-theory+symbol-connection=20(14=20c?= =?UTF-8?q?ards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 14 cards on philosophy of causation, symbolic/connectionist cognition: 6 SEP entries (Aristotle, metaphysics, regularity, counterfactual, Hume, induction), Pearl 2010, Wikipedia (causal-model, coastline-paradox, PSSH), Fodor-Pylyshyn 1988, Smolensky 1988, Newell-Simon 1975, Kautz 2022. Co-Authored-By: Claude Opus 4.7 (1M context) --- ...8-connectionism-cognitive-architecture.mdx | 142 ++++++++++++++ ...2022-third-ai-summer-engelmore-lecture.mdx | 174 ++++++++++++++++++ ...omputer-science-empirical-inquiry-1975.mdx | 133 +++++++++++++ .../pearl-intro-causal-inference-2010.mdx | 143 ++++++++++++++ .../zh/sources/sep-aristotle-causality.mdx | 122 ++++++++++++ .../zh/sources/sep-causation-metaphysics.mdx | 145 +++++++++++++++ .../zh/sources/sep-causation-regularity.mdx | 130 +++++++++++++ .../sources/sep-counterfactual-causation.mdx | 125 +++++++++++++ .../cards/zh/sources/sep-david-hume.mdx | 117 ++++++++++++ .../zh/sources/sep-problem-of-induction.mdx | 138 ++++++++++++++ ...ky-1988-proper-treatment-connectionism.mdx | 137 ++++++++++++++ .../zh/sources/wikipedia-causal-model.mdx | 167 +++++++++++++++++ .../sources/wikipedia-coastline-paradox.mdx | 144 +++++++++++++++ .../wikipedia-physical-symbol-system.mdx | 127 +++++++++++++ 14 files changed, 1944 insertions(+) create mode 100644 site/src/content/cards/zh/sources/fodor-pylyshyn-1988-connectionism-cognitive-architecture.mdx create mode 100644 site/src/content/cards/zh/sources/kautz-2022-third-ai-summer-engelmore-lecture.mdx create mode 100644 site/src/content/cards/zh/sources/newell-simon-computer-science-empirical-inquiry-1975.mdx create mode 100644 site/src/content/cards/zh/sources/pearl-intro-causal-inference-2010.mdx create mode 100644 site/src/content/cards/zh/sources/sep-aristotle-causality.mdx create mode 100644 site/src/content/cards/zh/sources/sep-causation-metaphysics.mdx create mode 100644 site/src/content/cards/zh/sources/sep-causation-regularity.mdx create mode 100644 site/src/content/cards/zh/sources/sep-counterfactual-causation.mdx create mode 100644 site/src/content/cards/zh/sources/sep-david-hume.mdx create mode 100644 site/src/content/cards/zh/sources/sep-problem-of-induction.mdx create mode 100644 site/src/content/cards/zh/sources/smolensky-1988-proper-treatment-connectionism.mdx create mode 100644 site/src/content/cards/zh/sources/wikipedia-causal-model.mdx create mode 100644 site/src/content/cards/zh/sources/wikipedia-coastline-paradox.mdx create mode 100644 site/src/content/cards/zh/sources/wikipedia-physical-symbol-system.mdx diff --git a/site/src/content/cards/zh/sources/fodor-pylyshyn-1988-connectionism-cognitive-architecture.mdx b/site/src/content/cards/zh/sources/fodor-pylyshyn-1988-connectionism-cognitive-architecture.mdx new file mode 100644 index 0000000..74ff9b6 --- /dev/null +++ b/site/src/content/cards/zh/sources/fodor-pylyshyn-1988-connectionism-cognitive-architecture.mdx @@ -0,0 +1,142 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Connectionism and Cognitive Architecture — A Critical Analysis +titleAlt: Fodor-Pylyshyn 1988 Systematicity Argument +tagline: Fodor & Pylyshyn 1988 · 系统性论证 · LOT · 联结主义无法替代经典架构 · 4000+ 引用 +author: Jerry A. Fodor · Zenon W. Pylyshyn +year: 1988 +url: https://doi.org/10.1016/0010-0277(88)90031-5 +refs: + - concepts/systematicity + - concepts/language-of-thought + - concepts/neurosymbolic-ai +sourceLine: Cognition 28(1–2), 3–71, 1988 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · FODOR-PYLYSHYN 1988 · Cognition · 系统性论证 · 经典架构 vs 联结主义 + + + +

联结主义与认知架构 · 批判性分析

+

联结主义因缺乏符号级组合句法-语义结构,无法解释人类认知的系统性

+
+ + + + 两层次区分——联结主义在认知架构层(本文批判对象)无法替代经典符号架构;但可以作为实现层理论,研究经典计算如何在神经底层实现。 + + + + +
+
系统性论证 · 核心
+
+ 能思考"John loves Mary",就必然能思考"Mary loves John"——这种关联不是偶然的,而是必然的。 +
+
+
+
+ 经典 + LOT + 组合性 +
+
"John loves Mary" 的心理表征包含 JOHN、LOVES、MARY 作为组成部分——自动具备形成 "Mary loves John" 所需的全部成分
+
✓ 解释系统性
+
+
+
+ 联结主义 + 分布式向量 +
+
两个句子的表征可能不共享任何单元、任何激活模式、任何结构要素——能否处理结构相关句子完全依赖训练数据
+
✗ 暴力偶然性
+
+
+
+ 若系统性是认知的非偶然特征,任何使其成为偶然的架构就是错误的架构 +
+
+
+ + +
+ 当代回响 + 约束解码、RANLP 2025「隐藏成本」、轨迹偏差——工程层面强行把符号规则叠加到神经系统上产生的摩擦,是系统性论证的当代实证 +
+
+ + +
+ → systematicity · language-of-thought · physical-symbol-system · neurosymbolic-ai · trajectory-bias + doi.org/10.1016/0010-0277(88)90031-5 +
+
+ + diff --git a/site/src/content/cards/zh/sources/kautz-2022-third-ai-summer-engelmore-lecture.mdx b/site/src/content/cards/zh/sources/kautz-2022-third-ai-summer-engelmore-lecture.mdx new file mode 100644 index 0000000..a834191 --- /dev/null +++ b/site/src/content/cards/zh/sources/kautz-2022-third-ai-summer-engelmore-lecture.mdx @@ -0,0 +1,174 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Third AI Summer — Kautz Engelmore Lecture +titleAlt: Kautz 2022 Third AI Summer +tagline: Henry Kautz · AAAI 2020 Engelmore 讲座 · 六类神经符号分类法 · 第三个冬天不会来 +author: Henry Kautz +year: 2022 +url: https://ojs.aaai.org/aimagazine/index.php/aimagazine/article/view/19122 +refs: + - concepts/neurosymbolic-ai-taxonomy + - concepts/ai-summers-history + - entities/henry-kautz +sourceLine: AI Magazine 43(1) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · THIRD AI SUMMER · AAAI 2020 Engelmore 讲座 · Kautz + + + +

第三个 AI 夏天

+

将 AI 历史重构为神经与符号的"共同演化"——而非对立竞争

+
+ + +
+
三个夏天 · 一个预言
+
+
1948–1966
+
第一夏
+
神经 + 逻辑同步出现 · A* 算法 · 过度承诺
+
🔚 → 第一个冬天
+
+
+
1968–1987
+
第二夏
+
专家系统商业成功 · 概率推理局限
+
🔚 → 第二个冬天
+
+
+
2012–今
+
第三夏
+
AlexNet · AlphaGo · 深度学习主导
+
🌞 预言:不会有第三个冬天
+
+
+ +
+
六类神经符号架构分类法 · Kautz 分类
+
+
+ 1 + Symbolic_Neuro_Symbolic + Transformer NLP + 最松 +
+
+ 2 + Symbolic[Neuro] + AlphaGo + +
+
+ 3 + Neuro;Symbolic + NS-CL · deepProbLog + +
+
+ 4 + Neuro:Symbolic→Neuro + Logical Neural Networks + 较紧 +
+
+ 5 + Neuro_Symbolic + Logic Tensor Networks + +
+
+ 6 + Neuro[Symbolic] + 理想目标 · 未实现 + 最紧 +
+
+
+
+ + + + 耦合谱 = 可学习性(端到端梯度)↔ 可验证性(逻辑保证)的权衡设计空间。Kahneman System 1/2 不只是比喻,而是设计模板——Type 6 目标是在 System 1(神经)内部实现 System 2(符号)推理。 + + + + +
+ → neurosymbolic-ai-taxonomy · ai-summers-history · henry-kautz · system-1-vs-system-2 + AI Magazine 43(1) +
+
+ + diff --git a/site/src/content/cards/zh/sources/newell-simon-computer-science-empirical-inquiry-1975.mdx b/site/src/content/cards/zh/sources/newell-simon-computer-science-empirical-inquiry-1975.mdx new file mode 100644 index 0000000..bc29a1e --- /dev/null +++ b/site/src/content/cards/zh/sources/newell-simon-computer-science-empirical-inquiry-1975.mdx @@ -0,0 +1,133 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Computer Science as Empirical Inquiry — Symbols and Search +titleAlt: Newell-Simon Turing Lecture 1975 +tagline: Newell · Simon · ACM 图灵奖讲座 · PSSH + 启发式搜索 · 定性结构律 · 1976 +author: Allen Newell · Herbert A. Simon +year: 1976 +url: https://home.csulb.edu/~cwallis/382/readings/482/Newell&Simonpssh.1976.html +refs: + - concepts/physical-symbol-system + - concepts/heuristic-search + - concepts/means-ends-analysis +sourceLine: Communications of the ACM · 1976 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + +
+ 源头 · 图灵奖 1975 · CACM 1976 +
+ 🏆 + Turing Award +
+
+
+

Newell · Simon

+

Computer Science as Empirical Inquiry — Symbols and Search

+
+
+ + +

计算机科学作为经验探究

+

两个定性结构律奠定 AI 与认知科学的概念地基

+
+ + +
+
+
+
+
物理符号系统假说 (PSSH)
+
"一个物理符号系统具备通用智能行为的充分必要条件"
+
符号 → 结构 → 过程 · 指称(designation)+ 解释(interpretation)
+
+
+
+
+
+
启发式搜索假说
+
物理符号系统通过搜索来行使其求解问题的智能——生成并递进修改符号结构
+
问题空间 · 手段-目的分析 · 弱方法 / 强方法
+
+
+
+ +
+ "定性结构律" · 与其他科学的范例 +
+
生物学细胞学说
+
地质学板块构造
+
化学原子论
+
计算机科学PSSH
+
+
+
+ + + + "搜索——连续生成候选解——是符号系统行使智能的根本方面,但搜索量不是智能量的度量。"——国际象棋悖论:程序生成数百万节点,人类大师不超过 100 个分支,但大师下得更好。 + + + + +
+ → physical-symbol-system · heuristic-search · means-ends-analysis · problem-space · allen-newell · herbert-simon + Communications of the ACM 19(3) +
+
+ + diff --git a/site/src/content/cards/zh/sources/pearl-intro-causal-inference-2010.mdx b/site/src/content/cards/zh/sources/pearl-intro-causal-inference-2010.mdx new file mode 100644 index 0000000..2f7974d --- /dev/null +++ b/site/src/content/cards/zh/sources/pearl-intro-causal-inference-2010.mdx @@ -0,0 +1,143 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: An Introduction to Causal Inference +titleAlt: Pearl 2010 · Int'l Journal of Biostatistics +tagline: Judea Pearl · SCM 权威综述 · Define-Assume-Identify-Estimate · do 算子 +author: Judea Pearl +year: 2010 +url: https://pmc.ncbi.nlm.nih.gov/articles/PMC2836213/ +refs: + - concepts/causal-models + - concepts/do-calculus + - entities/judea-pearl +sourceLine: Int'l Journal of Biostatistics 2010 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CAUSAL INFERENCE · Judea Pearl · SCM 权威综述 · 2010 + + + +

因果推理导论 · Pearl 2010

+

从关联到因果的范式跃迁——结构因果模型(SCM)的统一框架

+
+ + + 一条脆而清晰的分界线——关联概念可从观测分布定义(相关、回归、条件独立),因果概念不能(随机化、效应、干预、归因)。每一个因果主张至少依赖一个因果前提。 + + + +
+
四步方法论 · Define–Assume–Identify–Estimate
+
+
+
01
+
Define
+
将目标因果量 Q(M) 定义为可在任意完全指定模型上计算的算法——与参数化形式无关
+
+
+
02
+
Assume
+
用图和结构方程编码因果假设——缺失的箭头比存在的箭头更重要
+
+
+
03
+
Identify
+
判断目标量能否从观测数据估计——将 do 表达式转换为 do-free 表达式
+
+
+
04
+
Estimate
+
用统计方法估计已识别的量;检验模型的可检验蕴含
+
+
+
+ +
+ 核心工具 +
do 算子"模型手术"——删除指向被干预变量的方程,用常数替代
+
后门准则充分调整集——不含 X 后代、阻断所有后门路径
+
前门准则混淆不可观测时,经可观测中介两步估计
+
反事实三步溯因 → 行动 → 预测(modify M_x,求解)
+
+
+ + +
+ 对 Rubin 框架的定位 + 潜在结果框架是 SCM 的受限特例——"黑箱"范式,缺乏过程模型指导;条件可忽略性假设几乎无法经验判断真假 +
+
+ + +
+ → causal-models · do-calculus · judea-pearl · ladder-of-causation + pmc.ncbi.nlm.nih.gov +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-aristotle-causality.mdx b/site/src/content/cards/zh/sources/sep-aristotle-causality.mdx new file mode 100644 index 0000000..fb5a04d --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-aristotle-causality.mdx @@ -0,0 +1,122 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Aristotle on Causality — The Four Causes +titleAlt: SEP Aristotle Causality +tagline: SEP · 亚里士多德四因说 · 质料/形式/动力/目的 · 因果多元主义 · 铜像例证 +author: Stanford Encyclopedia of Philosophy +year: 2023 +url: https://plato.stanford.edu/entries/aristotle-causality/ +refs: + - concepts/aitia + - concepts/four-causes +sourceLine: SEP · 2006 / 2023 修订 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · ARISTOTLE ON CAUSALITY · SEP · 亚氏四因说 + + + +

亚里士多德论因果性 · 四因说

+

成功的科学探究产生因果知识——对 aitia(原因/解释)的认识

+
+ + + 因果多元主义——同一事物可以有多于一种的非偶然原因。四种原因不是竞争关系,而是共同构成完整的解释(Phys. II 3, 195 a 3–5)。 + + + +
+
+
+ Ⅰ · 质料因 + material · hulē +
+
由什么构成?
+
铜像 · 青铜
+
+
+
+ Ⅱ · 形式因 + formal · eidos +
+
它是什么?
+
雕像的形状 / 本质
+
+
+
+ Ⅲ · 动力因 + efficient · archē +
+
变化从何而来?
+
铸铜术 technē(非工匠个人)
+
+
+
+ Ⅳ · 目的因 + final · telos +
+
为了什么的善?
+
雕像本身(解释优先性)
+
+
+
+ + +
+ 目的因的核心论证 + 自然现象的规律性(前齿尖利、臼齿宽厚的稳定模式)需要解释——巧合不是解释,目的因是对规律性的最佳解释 +
+
+ + +
+ → aitia · four-causes · harness-engineering · teleology + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-causation-metaphysics.mdx b/site/src/content/cards/zh/sources/sep-causation-metaphysics.mdx new file mode 100644 index 0000000..5cbdff0 --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-causation-metaphysics.mdx @@ -0,0 +1,145 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Metaphysics of Causation +titleAlt: SEP Causation Metaphysics +tagline: SEP · 五大因果理论 × 四种测试案例 · 没有单一理论能处理所有案例 +author: Stanford Encyclopedia of Philosophy +year: 2001 +url: https://plato.stanford.edu/entries/causation-metaphysics/ +refs: + - concepts/regularity-theory + - concepts/counterfactual-theory + - concepts/interventionist-theory +sourceLine: SEP · 2001 / 修订 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CAUSATION METAPHYSICS · SEP · 五大理论综述 + + + +

因果形而上学 · 五大理论矩阵

+

关系项是什么?关系是几元?先占 / 预防 / 开关如何挑战各理论?

+
+ + +
+
五大理论
+
先占
+
预防
+
开关
+
+ +
+
+
① 规则性理论
+
Hume — 因果 = 恒常连接 · 类型优先个例
+
?
+
+
+
② 反事实理论
+
Lewis — c 不发生则 e 不发生
+
?
+
+
+
③ 干预主义
+
Woodward · Pearl — 通过 do(X) 定义
+
+
+
+
④ 概率因果
+
Eells · Suppes — 原因提高结果概率
+
??
+
+
+
⑤ 过程理论
+
Salmon · Dowe — 能量/动量传递
+
+
+
+
+ + + + 关系项选择(事件 / 事实 / 变量值)× 元数(二元 vs 对比四元)× 常态性(语用 or 客观)——没有单一理论能通吃。因果模型(结构方程)提供统一形式框架。 + + + + +
+ 四种测试案例 · 理论的试金石 +
先占 Preemption早期 / 晚期 / 凌驾——原因不必是结果的必要条件
+
预防 Prevention缺席作原因 · 双重预防
+
开关 Switches因果传递性的反例
+
常态性 Normality原因 vs 背景条件的区分
+
+
+ + +
+ → regularity-theory · counterfactual-theory · interventionist-theory · causal-models + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-causation-regularity.mdx b/site/src/content/cards/zh/sources/sep-causation-regularity.mdx new file mode 100644 index 0000000..d2f5f24 --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-causation-regularity.mdx @@ -0,0 +1,130 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Regularity and Inferential Theories of Causation +titleAlt: SEP Causation Regularity +tagline: SEP · HRT → MRT → INUS → 当代 · 推断性理论谱系 · 差异制造 +author: Stanford Encyclopedia of Philosophy +year: 2026 +url: https://plato.stanford.edu/entries/causation-regularity/ +refs: + - concepts/regularity-theory + - concepts/inus-condition + - concepts/difference-making +sourceLine: SEP · 2021 / 2026 修订 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · REGULARITY × INFERENTIAL · SEP · 因果理论谱系 + + + +

规则性与推断性因果理论

+

从 Hume 到当代——规则性理论并未过时,推断性是自然继承

+
+ + +
+
+
Hume
+
HRT
+
邻近 + 时间先后 + 恒常连结
+
+
+
+
Mill
+
MRT
+
法则式规律 · 正因子/负因子总体
+
+
+
+
Mackie
+
INUS
+
不充分但非冗余的不必要但充分条件组成
+
+
+
+
2001-2024
+
当代
+
Graßhoff-May · Baumgartner · Andreas-Günther · 结构方程
+
+
+
+ + + 推断性理论谱系——Ramsey 变项假说 · DN 模型 · Spohn 排名函数 · 加强版 Ramsey 测试 · Kairetic(Strevens)· 因果模型方法。差异制造(difference-making)是当代规则性/推断性理论的共同核心。 + + + +
+ 五个关键结论 +
    +
  • 规则性理论并未过时——已克服 Lewis 1973 的经典批评
  • +
  • 推断性理论是规则性理论的自然继承者——推断关系替代规律瞬例化
  • +
  • INUS 条件是连接规则性与推断性传统的枢纽概念
  • +
  • 当代版本能处理过决定、早期/晚期先占和开关案例
  • +
  • 最佳系统法则观(Ramsey-Lewis)提供了区分法则与偶然规律的基础
  • +
+
+
+ + +
+ → regularity-theory · inus-condition · difference-making · causation-hume + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-counterfactual-causation.mdx b/site/src/content/cards/zh/sources/sep-counterfactual-causation.mdx new file mode 100644 index 0000000..7f303cd --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-counterfactual-causation.mdx @@ -0,0 +1,125 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Counterfactual Theories of Causation +titleAlt: SEP Counterfactual Causation +tagline: SEP · Lewis 1973 → 2000 → SEF · 反事实因果四十年演化 · 先占挑战 +author: Stanford Encyclopedia of Philosophy +year: 2024 +url: https://plato.stanford.edu/entries/causation-counterfactual/ +refs: + - concepts/counterfactual-theory + - concepts/preemption + - entities/david-lewis +sourceLine: SEP · 2001 / 2024 修订 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · COUNTERFACTUAL THEORIES · SEP · Lewis 奠基 · 四十年演化 + + + +

反事实因果理论

+

c 是 e 的原因 ⇔ 若 c 未发生,e 也不发生——四十年演化的研究纲领

+
+ + +
+
+
1973
+
Lewis 奠基
+
+
· 因果依赖:e 依赖 c ⇔ "if ¬c, then ¬e"
+
· 因果链:依赖的传递闭包
+
· 可能世界语义 + 时间不对称性
+
+
+
+
2000
+
Lewis 修订
+
+
· 从"依赖"转向"影响"(influence)
+
· c 改变(时间/方式)→ e 相应改变
+
· 事件的"变体"(alteration)
+
⚠ 虚假因果 + 度量标准问题
+
+
+
+
2001-
+
结构方程框架 (SEF)
+
+
· Hitchcock · Halpern & Pearl · Woodward
+
· ⟨V, E⟩ 手术干预 · 活跃因果路线
+
· 冻结路径外变量 → 检验依赖
+
✓ 处理晚期先占 & 凌驾先占
+
+
+
+
+ + + 晚期先占(Billy-Suzy 扔石头)和凌驾先占是反事实理论最持久的挑战。SEF 通过"冻结变量 + 活跃路线"技术提供比 Lewis 原始理论更强大的处理工具。 + + + +
+ 语境问题 + 不变主义(Lewis)/ 对比主义(Schaffer "c 而非 c* 导致 e 而非 e*")/ 语境主义——至今未解 +
+
+ + +
+ → counterfactual-theory · preemption · david-lewis · causal-models + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-david-hume.mdx b/site/src/content/cards/zh/sources/sep-david-hume.mdx new file mode 100644 index 0000000..759a91b --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-david-hume.mdx @@ -0,0 +1,117 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: David Hume +titleAlt: SEP David Hume +tagline: SEP · 1711-1776 · 心灵地理学 · 归纳问题 · 恒常连结 · 理性是激情的奴隶 +author: Stanford Encyclopedia of Philosophy +year: 2023 +url: https://plato.stanford.edu/entries/hume/ +refs: + - concepts/induction-problem + - concepts/constant-conjunction + - entities/david-hume +sourceLine: SEP · David Hume +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + +
+ 源头 · 哲学 · SEP +
+
+
+

David Hume

+

1711–1776 · 英语世界最重要的哲学家之一

+
+
+ + +
+
生卒1711 爱丁堡 — 1776
+
主要著作《人性论》1739-40 · 《人类理解研究》1748
+
方法论心灵地理学——将牛顿实验方法引入"道德科学"
+
门徒Kant 称被休谟"从独断论迷梦中唤醒" · Darwin 视其为进化论中心影响
+
+
+ + + 核心贡献 · 批判 → 建构 +
+
+
因果性理论
+
批判:理性无法解释因果推理——经验推理循环(齐一性原则需自己证明)/ 建构习惯(custom/habit)是因果推理的真正驱动力
+
+
+
必然联系的观念
+
来自我们自身——习惯性联想中产生的"心灵的决定感"(felt determination)
+
+
+
归纳问题
+
"过去一直如此 → 未来也将如此"既非演绎亦非概率论证——动摇因果推理的理性基础
+
+
+
道德哲学
+
情感主义——"理性只是激情的奴隶"——道德观念源于情感,通过同情机制运作
+
+
+
+ + +
+ 与 LLM 的隔代回声 + LLM 从数据中学的"知识"本质上是恒常连结的统计编码,而非必然联系的把握——与休谟的习惯论同构 +
+
+ + +
+ → induction-problem · constant-conjunction · causation-hume · david-hume + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/sep-problem-of-induction.mdx b/site/src/content/cards/zh/sources/sep-problem-of-induction.mdx new file mode 100644 index 0000000..b66e8b7 --- /dev/null +++ b/site/src/content/cards/zh/sources/sep-problem-of-induction.mdx @@ -0,0 +1,138 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Problem of Induction +titleAlt: SEP Problem of Induction +tagline: SEP · 休谟两角 · 演示循环 vs 概率循环 · 300 年前的模型泛化问题 · No Free Lunch +author: Stanford Encyclopedia of Philosophy +year: 2022 +url: https://plato.stanford.edu/entries/induction-problem/ +refs: + - concepts/induction-problem + - concepts/uniformity-principle + - concepts/meta-induction +sourceLine: SEP · 2018 / 2022 修订 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · PROBLEM OF INDUCTION · SEP · 休谟的两角 + 300 年回应 + + + +

归纳问题 · 1739 年提出 · 至今未解

+

"所有观察到的 A 都是 B → 下一个 A 也将是 B"——理性辩护何在?

+
+ + + 现代回响——这是 300 年前版本的"模型泛化问题"。你的 LLM 在训练数据上发现了模式——为什么它应该在生产环境中成立?休谟的论证结构与 No Free Lunch 定理完全同构。 + + + +
+
休谟的两角
+
+
+
+
演示性论证失败
+
归纳结论的否定不构成矛盾——自然进程可能改变。先验推理无法建立齐一性原则
+
+
+
+
概率论证循环
+
任何经验论证都预设了齐一性原则本身——恶性循环
+
+
+
+ 休谟的解答 + 归纳不由理性驱动,而由习惯驱动——一种自然本能,可能比理性更可靠 +
+
+ +
+ 12 条回应路线 +
+
+
攻击第一角(先验)
+
· 康德的综合先验
+
· 最佳解释推理(IBE)
+
· 贝叶斯概率论
+
· Williams/Stove 组合方案
+
+
+
攻击第二角(经验)
+
· 规则循环 ≠ 恶性循环
+
· 无规则方案(Norton)
+
+
+
替代辩护
+
· 铰链命题(Wittgenstein)
+
· 实用辩护(Reichenbach)
+
· 形式学习理论
+
+
+
接受怀疑
+
· 证伪主义(Popper)
+
· 元归纳(Schurz)
+
+
+
+
+ + +
+ → induction-problem · uniformity-principle · meta-induction · grue-problem · falsificationism + plato.stanford.edu +
+
+ + diff --git a/site/src/content/cards/zh/sources/smolensky-1988-proper-treatment-connectionism.mdx b/site/src/content/cards/zh/sources/smolensky-1988-proper-treatment-connectionism.mdx new file mode 100644 index 0000000..663fdd8 --- /dev/null +++ b/site/src/content/cards/zh/sources/smolensky-1988-proper-treatment-connectionism.mdx @@ -0,0 +1,137 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: On the Proper Treatment of Connectionism +titleAlt: Smolensky 1988 +tagline: Smolensky 1988 · 亚概念层 · 调和理论 · 软约束 vs 硬规则 · 同年回应 Fodor-Pylyshyn +author: Paul Smolensky +year: 1988 +url: https://doi.org/10.1017/S0140525X00052432 +refs: + - concepts/subconceptual-level + - concepts/harmony-theory + - concepts/neurosymbolic-ai +sourceLine: Behavioral and Brain Sciences 11(1) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · PROPER TREATMENT OF CONNECTIONISM · Smolensky 1988 + + + +

联结主义的正确理解

+

亚概念层——位于神经生物学与符号认知之间的中间层次

+
+ + +
+
三层描述 · 类比热力学 vs 统计力学
+
+
概念/符号层
+
符号 · 规则
+
逻辑 · 语言学
+
+
+
亚概念层 ← 本文定位
+
联结主义单元
+
激活模式 · 权重
+
+
+
神经层
+
神经元 · 突触
+
生物物理学
+
+
+ +
+ 调和理论 · Harmony Theory +
+ H(a) + = + Σi,j wij · ai · aj +
+
认知 = 通过收敛到高调和状态进行——约束满足而非规则应用(Hopfield · Boltzmann)
+
+
+ + + + 四假说——分布式表征 + 亚概念语义(微特征)+ 上下文敏感 + 调和最大化。符号模型不是错的,是对底层联结主义计算的涌现行为的宏观近似——如热力学是统计力学的涌现。 + + + + +
+
软约束每个约束对全局调和贡献一定量——解释优雅退化(graceful degradation)
+
能力-表现统一语法规则作为调和函数的吸引子,表现模式作为调和优化的直接输出
+
+
+ + +
+ → subconceptual-level · harmony-theory · systematicity · neurosymbolic-ai · constrained-decoding + Behavioral and Brain Sciences +
+
+ + diff --git a/site/src/content/cards/zh/sources/wikipedia-causal-model.mdx b/site/src/content/cards/zh/sources/wikipedia-causal-model.mdx new file mode 100644 index 0000000..58aa621 --- /dev/null +++ b/site/src/content/cards/zh/sources/wikipedia-causal-model.mdx @@ -0,0 +1,167 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Causal Model (Wikipedia) +titleAlt: Wikipedia Causal Model +tagline: Wikipedia · 因果之梯 Association/Intervention/Counterfactual · 三种基本连接模式 +author: Wikipedia contributors +year: 2026 +url: https://en.wikipedia.org/wiki/Causal_model +refs: + - concepts/causal-models + - concepts/do-calculus + - concepts/causal-dag +sourceLine: Wikipedia · Causal model +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CAUSAL MODEL · Wikipedia · 2026 + + + +

因果模型 · 结构因果模型(SCM)

+

Pearl 的 ⟨U, V, E⟩ 形式化——超越统计相关性的因果推理

+
+ + +
+
因果之梯 · Ladder of Causation
+
+
+
+
反事实 Counterfactual
+
想象层——构建解释因果机制的理论,推演未发生的情景
+
P(Y_x | X', Y')
+
+
+
+
+
+
干预 Intervention
+
行动层——预测刻意行动的效果
+
P(Y | do(X))
+
+
+
+
+
+
关联 Association
+
观察层——发现数据中的规律和相关性
+
P(Y | X)
+
+
+
+ +
+ 三种基本连接模式 + + + + + A + + B + + C + + + + + 链 · A→B→C(中介) + + + + B + + A + + C + + + + + 叉 · A←B→C(混淆) + + + + B + + A + + C + + + + + 对撞 · A→B←C + + + +
条件化中间节点阻断链/叉;条件化对撞反而打开虚假相关
+
+
+ + +
+
后门调整控制满足后门准则的变量集 · 阻断所有非因果路径
+
前门调整混淆不可观测时 · 经前门路径中介变量估计
+
+
+ + +
+ → causal-models · do-calculus · causal-dag · ladder-of-causation + en.wikipedia.org +
+
+ + diff --git a/site/src/content/cards/zh/sources/wikipedia-coastline-paradox.mdx b/site/src/content/cards/zh/sources/wikipedia-coastline-paradox.mdx new file mode 100644 index 0000000..387e12f --- /dev/null +++ b/site/src/content/cards/zh/sources/wikipedia-coastline-paradox.mdx @@ -0,0 +1,144 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Coastline Paradox +titleAlt: Wikipedia Coastline Paradox +tagline: Wikipedia · Richardson 效应 · 分形维数 · L(ε) ~ F·ε^(1-D) · 1951-1967 +author: Wikipedia contributors +year: 2026 +url: https://en.wikipedia.org/wiki/Coastline_paradox +refs: + - concepts/fractal-dimension + - concepts/richardson-effect + - concepts/statistical-self-similarity +sourceLine: Wikipedia · 2026-04-08 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; +import Formula from '~/components/card/blocks/Formula.astro'; + + + 源头 · COASTLINE PARADOX · Wikipedia · Mandelbrot 分形起点 + + + +

海岸线悖论

+

海岸线没有确定的长度——测量精度越高,测得的海岸线越长

+
+ + + 常规光滑曲线可求长(rectifiable),总长度收敛——海岸线则不同,每个尺度都展现新细节,不存在收敛极限。这使海岸线具有 1 < D < 2 的分形维数。 + + + +
+
Mandelbrot(1967)
+
+ L(ε) + ~ + F + ε1−D +
+
+ L—测量长度 · ε—单位 · F—常数 · D—分形维数 +
+
+ +
+ 不同海岸线的分形维数 · 南非 vs 英国 +
+ 南非海岸 +
+ D ≈ 1.02 + 相对光滑 +
+
+ 湖泊岸线(典型) +
+ D ≈ 1.28 + 中等粗糙 +
+
+ 英国西海岸 +
+ D ≈ 1.25 + 崎岖 +
+
+ +
+
+ 1951 + Richardson 发现葡萄牙/西班牙共同边界:987 km vs 1214 km(不同测量尺) +
+
+ 1967 + Mandelbrot "How Long Is the Coast of Britain?" 引入统计自相似性 +
+
+
+ + +
+ → fractal-dimension · richardson-effect · statistical-self-similarity · coastline-paradox + en.wikipedia.org +
+
+ + diff --git a/site/src/content/cards/zh/sources/wikipedia-physical-symbol-system.mdx b/site/src/content/cards/zh/sources/wikipedia-physical-symbol-system.mdx new file mode 100644 index 0000000..89b1723 --- /dev/null +++ b/site/src/content/cards/zh/sources/wikipedia-physical-symbol-system.mdx @@ -0,0 +1,127 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Physical Symbol System (PSSH) +titleAlt: Wikipedia PSSH +tagline: Wikipedia · Newell-Simon PSSH · 支持 vs 挑战 · 符号接地问题 · 神经符号混合 +author: Wikipedia contributors +year: 2026 +url: https://en.wikipedia.org/wiki/Physical_symbol_system +refs: + - concepts/physical-symbol-system + - concepts/symbol-grounding + - concepts/neurosymbolic-ai +sourceLine: Wikipedia · 2026-03-15 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · PHYSICAL SYMBOL SYSTEM · Wikipedia · PSSH 争论综述 + + + +

物理符号系统假说(PSSH)

+

操纵物理符号、组成结构、处理以生成新表达——通用智能的充分必要条件?

+
+ + + + PSSH 断言:物理符号系统具备通用智能行为的充分必要条件——人类认知通过符号操作运作,机器可以通过类似过程实现智能。 + + + + +
+
+
+ ✓ 支持 + 经验证据 +
+
    +
  • 心理学——Newell/Simon 实验:人类通过逐步符号操作解决逻辑问题
  • +
  • 早期 AI 成功(1950-60s):STUDENT · Logic Theorist · Samuel 跳棋 · ELIZA · SHRDLU
  • +
  • 形式逻辑传承:Frege · Russell · Turing machine · 存储程序 · LISP(1959-60)
  • +
+
+
+
+ ✗ 挑战 + 反对论证 +
+
    +
  • Dreyfus——专家依赖无意识直觉而非显式符号操作
  • +
  • 具身认知(Lakoff)——抽象推理根植于具身技能
  • +
  • 常识难题——frame / qualification / ramification problem
  • +
  • 莫拉维克悖论——感知运动技能 ≫ 抽象推理
  • +
  • Brooks——"世界是它自己最好的模型"
  • +
  • 深度学习(2012 AlexNet)——联结主义方法大幅超越符号系统
  • +
+
+
+
+ + +
+ 三个本质区分 +
语义符号 vs 动态信号PSSH 关注具指称意义的符号,非原始位或未解释激活
+
通用智能 vs 专用能力PSSH 针对 AGI——当前 AI 未实现,批评为前瞻性
+
智能行为 vs 意识仅关注行为层面——不涉及 Searle "强 AI" 论断
+
+
+ + +
+ → physical-symbol-system · symbol-grounding · neurosymbolic-ai · world-models · trajectory-bias + en.wikipedia.org +
+
+ + From 361462532b62b3e80d601a486070bb65657aa896 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 21:27:57 +0800 Subject: [PATCH 41/48] =?UTF-8?q?feat(cards):=20batch=2018/18=20=E2=80=94?= =?UTF-8?q?=20sources/fractal+bitter-lesson+interpretability+misc=20(14=20?= =?UTF-8?q?cards)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Final batch of 14 cards closing out sources coverage: fractal (cyclejs/Avatamsaka/Sumeru), Raymond Unix philosophy ×2, Sutton Bitter Lesson ×2, Simon Architecture of Complexity, RANLP trajectory-bias, MIT Tech Review MI, OthelloGPT bag-of-heuristics, Introl world-models race, Twitter reactions, Claude Code leak. 82/82 wiki sources now have one-shot cards. Co-Authored-By: Claude Opus 4.7 (1M context) --- .../sources/claude-code-source-leak-2026.mdx | 115 +++++++++++++++ .../sources/fractal-architecture-cyclejs.mdx | 104 +++++++++++++ .../fractal-buddhism-avatamsaka-sutra.mdx | 108 ++++++++++++++ .../sources/introl-world-models-race-2026.mdx | 139 ++++++++++++++++++ .../mit-mechanistic-interpretability-2026.mdx | 117 +++++++++++++++ .../othellogpt-bag-of-heuristics-mats2024.mdx | 123 ++++++++++++++++ ...-2025-hidden-cost-constrained-decoding.mdx | 138 +++++++++++++++++ .../raymond-unix-philosophy-summary.mdx | 110 ++++++++++++++ .../zh/sources/raymond-unix-philosophy.mdx | 111 ++++++++++++++ ...simon-architecture-of-complexity-notes.mdx | 121 +++++++++++++++ .../sources/sumeru-mustard-seed-buddhist.mdx | 118 +++++++++++++++ .../sources/sutton-bitter-lesson-summary.mdx | 103 +++++++++++++ .../cards/zh/sources/sutton-bitter-lesson.mdx | 117 +++++++++++++++ .../twitter-managed-agents-reactions.mdx | 134 +++++++++++++++++ 14 files changed, 1658 insertions(+) create mode 100644 site/src/content/cards/zh/sources/claude-code-source-leak-2026.mdx create mode 100644 site/src/content/cards/zh/sources/fractal-architecture-cyclejs.mdx create mode 100644 site/src/content/cards/zh/sources/fractal-buddhism-avatamsaka-sutra.mdx create mode 100644 site/src/content/cards/zh/sources/introl-world-models-race-2026.mdx create mode 100644 site/src/content/cards/zh/sources/mit-mechanistic-interpretability-2026.mdx create mode 100644 site/src/content/cards/zh/sources/othellogpt-bag-of-heuristics-mats2024.mdx create mode 100644 site/src/content/cards/zh/sources/ranlp-2025-hidden-cost-constrained-decoding.mdx create mode 100644 site/src/content/cards/zh/sources/raymond-unix-philosophy-summary.mdx create mode 100644 site/src/content/cards/zh/sources/raymond-unix-philosophy.mdx create mode 100644 site/src/content/cards/zh/sources/simon-architecture-of-complexity-notes.mdx create mode 100644 site/src/content/cards/zh/sources/sumeru-mustard-seed-buddhist.mdx create mode 100644 site/src/content/cards/zh/sources/sutton-bitter-lesson-summary.mdx create mode 100644 site/src/content/cards/zh/sources/sutton-bitter-lesson.mdx create mode 100644 site/src/content/cards/zh/sources/twitter-managed-agents-reactions.mdx diff --git a/site/src/content/cards/zh/sources/claude-code-source-leak-2026.mdx b/site/src/content/cards/zh/sources/claude-code-source-leak-2026.mdx new file mode 100644 index 0000000..0046b97 --- /dev/null +++ b/site/src/content/cards/zh/sources/claude-code-source-leak-2026.mdx @@ -0,0 +1,115 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Claude Code Source Leak 2026 +titleAlt: Claude Code v2.1.88 Source Leak +tagline: npm v2.1.88 · 51.2 万行 TypeScript 暴露 · Cache 边界 · autoCompact · anti-distillation · 2026-03-31 +author: 社区综合分析 +year: 2026 +url: https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/ +refs: + - concepts/context-management + - concepts/prefix-caching + - entities/claude-code +sourceLine: 社区综合 · 2026-03-31 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · CLAUDE CODE SOURCE LEAK · npm v2.1.88 · 2026-03-31 + + + +

Claude Code 源码泄露 · 内部机制研究

+

缺失 .npmignore 导致 .map 暴露——~1900 文件 · ~512K 行 TypeScript

+
+ + + + Anthropic 官方称"人为错误的打包问题,不是安全漏洞"——但社区分析揭示的内部工程实践成为 harness engineering 研究的重要一手材料。 + + + + +
+
+
01
+
Cache 边界标记
+
__SYSTEM_PROMPT_DYNAMIC_BOUNDARY__——标记之前全局缓存,之后 session 特定不缓存 · promptCacheBreakDetection.ts 14 向量检测 · sticky latches
+
+
+
02
+
autoCompact 机制
+
派次级 Claude 实例摘要 · <analysis> 推理后剥离仅插回摘要 · 生产 bug:1279 session 单 session 50+ 失败,每天浪费 25 万次 API 调用
+
+
+
03
+
Append-Only JSONL 历史
+
压缩前的消息永不删除 · 三种元数据标志 isCompactSummary/isVisibleInTranscriptOnly/isMeta 过滤 · 用户 transcript ≠ 模型 context
+
+
+
04
+
Anti-Distillation
+
anti_distillation: ['fake_tools']——服务端静默注入诱饵工具定义,污染通过录制 API 流量方式收集的训练数据
+
+
+
05
+
子 Agent Fork-Join KV Cache
+
子 agent 包含完整父 context 无需重新处理 · 并行化基本免费
+
+
+
06
+
系统提示动态组装
+
30+ 组件片段 · 按用户类型 / 工具 / 会话模式 / feature flag 条件渲染 · 51 版本变更日志
+
+
+ +
+
工具架构29K 行工具定义 · 默认 <20 · 完整 60+ · 46K 行查询引擎 · bashSecurity.ts 23 项安全检查
+
Undercover 模式undercover.ts ~90 行——为外部仓库贡献时剥除 Co-Authored-By,Anthropic 员工默认启用
+
+
+ + +
+ → context-management · prefix-caching · claude-code · implicit-loop-architecture + alex000kim / dbreunig / sabrina.dev / HN +
+
+ + diff --git a/site/src/content/cards/zh/sources/fractal-architecture-cyclejs.mdx b/site/src/content/cards/zh/sources/fractal-architecture-cyclejs.mdx new file mode 100644 index 0000000..627394e --- /dev/null +++ b/site/src/content/cards/zh/sources/fractal-architecture-cyclejs.mdx @@ -0,0 +1,104 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Fractal Architecture (Telesh 2016) +titleAlt: Anton Telesh Fractal Architecture +tagline: Anton Telesh · 四条分形架构规则 · React/Angular/Elm/Cycle.js 共性提炼 · 2016 +author: Anton Telesh +year: 2016 +url: http://antontelesh.github.io/architecture/2016/03/16/fractal-architecture.html +refs: + - concepts/fractal-architecture + - concepts/implicit-loop-architecture + - concepts/agent-skills +sourceLine: antontelesh.github.io · 2016-03-16 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · FRACTAL ARCHITECTURE · Anton Telesh · 前端框架共性 · 2016 + + + +

分形架构 · 前端组件化的共同基底

+

自相似性 + 统一 API = 任意子树都是有效的树

+
+ + + 如果你理解一个组件的工作方式,你就理解了所有组件——因为所有组件暴露相同的 API 形状,每个子树都是一个有效的完整树。 + + + +
+
+
+
+
应用是由相同 API 的组件组成的树
+
所有组件暴露统一接口——这是分形的自相似性条件
+
+
+
+
+
+
每个组件可以包含其他组件
+
组合是递归的——任意组件可嵌入任意上下文
+
+
+
+
+
+
顶层组件与其他组件无本质区别
+
根节点不享有特权——组件不知道自己是"根"还是"叶"
+
+
+
+
+
+
胶水代码与应用逻辑分离
+
引导 / 装配在组件体系之外完成——分形架构能成立的前提
+
+
+
+
+ + +
+
React / AngularXML 声明式组件 · bootstrap API
+
Elminit/update/view 三函数 + main 传入根
+
Cycle.js纯函数 observables → observables · 单独 wiring 层
+
+
+ + +
+ → fractal-architecture · implicit-loop-architecture · agent-skills · cycle-js + antontelesh.github.io +
+
+ + diff --git a/site/src/content/cards/zh/sources/fractal-buddhism-avatamsaka-sutra.mdx b/site/src/content/cards/zh/sources/fractal-buddhism-avatamsaka-sutra.mdx new file mode 100644 index 0000000..978e3e1 --- /dev/null +++ b/site/src/content/cards/zh/sources/fractal-buddhism-avatamsaka-sutra.mdx @@ -0,0 +1,108 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Fractal Buddhism — The Avatamsaka Sutra +titleAlt: 因陀罗网 · 华严经 +tagline: egregores · 华严经 · 因陀罗网 · Cook 1973 · 分形概念流行前就已完全分形 · 2009 +author: egregores +year: 2009 +url: https://egregores.wordpress.com/2009/05/12/fractal-buddhism-the-avatamsaka-sutra/ +refs: + - concepts/indra-net + - concepts/sumeru-mustard-seed + - entities/avatamsaka-sutra +sourceLine: egregores.wordpress.com · 2009-05-12 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · FRACTAL BUDDHISM · 华严经 · 因陀罗网 + + + +

华严经 · 分形佛学

+

"totally fractal long before being fractal was cool"——无碍互入的分形结构

+
+ + +
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 每颗宝珠映照网中所有宝珠——无限重复的相互关系 + simultaneous mutual identity and mutual causality + +
+
+ + + + 因陀罗网(Jewel Net of Indra)——帝释天居所中一张无限延伸的珠网,每个网眼镶嵌一颗宝珠。每颗宝珠的抛光表面映照其他所有宝珠,被映照的每颗又在映照所有其他——无限的映照过程。 + + + + +
+
Cook 1973Hua-Yen Buddhism: The Jewel Net of Indra
+
ClearyEntry into the Inconceivable
+
ChangThe Buddhist Teaching of Totality
+
+
+ + +
+ → indra-net · sumeru-mustard-seed · avatamsaka-sutra · fractal-architecture + egregores.wordpress.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/introl-world-models-race-2026.mdx b/site/src/content/cards/zh/sources/introl-world-models-race-2026.mdx new file mode 100644 index 0000000..25b28fc --- /dev/null +++ b/site/src/content/cards/zh/sources/introl-world-models-race-2026.mdx @@ -0,0 +1,139 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The World Models Race (2026) +titleAlt: Introl World Models Race AGI 2026 +tagline: Introl · LeCun AMI Labs €500M · Genie 3 / Marble / Cosmos / Sora 2 · 2026-01 +author: Blake Crosley (Introl) +year: 2026 +url: https://introl.com/blog/world-models-race-agi-2026 +refs: + - concepts/world-models + - entities/yann-lecun + - entities/ami-labs +sourceLine: introl.com/blog · 2026-01-03 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · WORLD MODELS RACE · Introl · 2025-2026 爆发 · 2026-01-03 + + + +

世界模型竞赛 · 2026

+

从文本处理 → 物理模拟 / 视频生成 / 具身推理的计算范式转移

+
+ + + + LeCun 核心主张——LLM 从文本中学习统计模式而非物理现实的理解,因此永远不会达到 AGI。具体局限:事实幻觉、物理推理失败、因果混淆、时序不一致。 + + + + +
五大参与者 · Leaderboard
+
+
+
01
+
+
AMI Labs
+
LeCun · 融资 €500M
+
I-JEPA 架构扩展
+
物理理解 · 持久记忆 · 行动规划
+
+
+
+
02
+
+
Genie 3
+
DeepMind
+
自回归帧生成
+
24fps 实时 3D · 自学物理
+
+
+
+
03
+
+
Marble
+
World Labs · 首个商用
+
文本/图像 → 3D 环境
+
可下载可编辑持久 3D 世界
+
+
+
+
04
+
+
Cosmos
+
NVIDIA · 200 万+ 下载
+
物理感知视频生成
+
自动驾驶 / 机器人合成训练数据
+
+
+
+
05
+
+
Sora 2
+
OpenAI
+
视频生成 + 物理合规
+
模拟物理约束下的智能体
+
+
+
+
+ + +
+ 与 LLM 互补非替代 + LLM 处理语言推理 + 工具使用 · 世界模型提供物理环境理解——对 agentic systems 多模态演进的方向有启示 +
+
+ + +
+ → world-models · yann-lecun · ami-labs · i-jepa · meta-i-jepa + introl.com/blog +
+
+ + diff --git a/site/src/content/cards/zh/sources/mit-mechanistic-interpretability-2026.mdx b/site/src/content/cards/zh/sources/mit-mechanistic-interpretability-2026.mdx new file mode 100644 index 0000000..e258a53 --- /dev/null +++ b/site/src/content/cards/zh/sources/mit-mechanistic-interpretability-2026.mdx @@ -0,0 +1,117 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: MIT Tech Review — Mechanistic Interpretability (2026 Breakthrough) +titleAlt: MIT Tech Review MI 2026 +tagline: MIT Tech Review · 2026 十大突破技术 · Anthropic → OpenAI → DeepMind 扩散 · 2026-01 +author: Will Douglas Heaven +year: 2026 +url: https://www.technologyreview.com/2026/01/12/1130003/ +refs: + - concepts/mechanistic-interpretability + - concepts/chain-of-thought + - entities/anthropic +sourceLine: MIT Technology Review · 2026-01-12 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · MECHANISTIC INTERPRETABILITY · MIT Tech Review · 2026 年十大突破 + + + +

机制可解释性 · 2026 年突破技术

+

MIT Tech Review 将 MI 列为 2026 年十大突破——从学术圈进入大众视野

+
+ + +
+
+ 2026 + BREAKTHROUGH +
+
+
Mechanistic Interpretability
+
Will Douglas Heaven · MIT Technology Review · 2026-01-12
+
+ 从 Anthropic 2024 特征发现(Golden Gate Bridge)→ 2025 电路追踪 → 2026 OpenAI/DeepMind 应用类似技术,interpretability 已从理论探索进入实用阶段。 +
+
+
+
+ + +
+
Mechanistic Interpretability
+
映射模型内部的特征与电路路径——Anthropic 的 Circuit Tracing / SAE / CLT
+
+
+
Chain-of-Thought Monitoring
+
监听推理模型的内部独白——OpenAI 用 CoT 监控抓住推理模型在编码测试中作弊
+
+
+ + +
+ 主要参与者 + Anthropic · Google DeepMind · Neuronpedia · OpenAI +
+
+ 领域分歧 + 有人认为 LLM 太复杂永远无法完全理解,但工具组合可逐步揭示更多 +
+
+ + +
+ → mechanistic-interpretability · chain-of-thought · anthropic · circuit-tracing + technologyreview.com +
+
+ + diff --git a/site/src/content/cards/zh/sources/othellogpt-bag-of-heuristics-mats2024.mdx b/site/src/content/cards/zh/sources/othellogpt-bag-of-heuristics-mats2024.mdx new file mode 100644 index 0000000..0177c36 --- /dev/null +++ b/site/src/content/cards/zh/sources/othellogpt-bag-of-heuristics-mats2024.mdx @@ -0,0 +1,123 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: OthelloGPT Learned a Bag of Heuristics +titleAlt: jylin04 MATS 2024 OthelloGPT +tagline: jylin04 (MATS 6.0) · 表征存在 ≠ 统一算法 · 局部启发式集合 · 2024 +author: jylin04 (Neel Nanda MATS 6.0) +year: 2024 +url: https://www.alignmentforum.org/posts/gcpNuEZnxAPayaKBY/othellogpt-learned-a-bag-of-heuristics-1 +refs: + - concepts/bag-of-heuristics + - concepts/othello-world-model-hypothesis + - concepts/mechanistic-interpretability +sourceLine: AI Alignment Forum · 2024-07-02 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · OTHELLOGPT BAG OF HEURISTICS · MATS 2024 · jylin04 + + + +

OthelloGPT 学到了一袋启发式规则

+

探针精度高证明表征存在——但计算机制是统一算法还是局部规则集合?

+
+ + + 核心洞见——(1) 表征意义(激活可被线性解码为棋盘状态)成立,不意味着 (2) 算法意义(模型实现了统一、可组合的棋盘状态计算过程)成立。 + + + +
+
+
+ ✓ 成立 + 表征意义 +
+
激活可被线性解码为棋盘状态
+
探针有效——Layer 6 激活上的分类器在未见游戏上准确率很高
+
+
+
+ ? 存疑 + 算法意义 +
+
模型实现了统一、可组合的棋盘状态计算过程
+
找不到简洁算法——推测是聚合多条启发式规则
+
+
+ +
+ 具体证据 · MLP 神经元 L1N421 +
+ 发现的规则 + "IF 刚落 A4 AND B4 非空 AND C4 非空 → 更新 B4+C4+D4 为'对方'" +
+
+
局部特定于棋盘小区域
+
位置特异A4 的规则不能平移到 B4
+
彼此独立无通用翻转规则 · 许多类似特异性神经元
+
+
+
+ + +
+ 注意力专化 + Mine-Heads 只关注当前玩家 · Yours-Heads 只关注对手——但此观察不能判断背后是统一世界模型还是启发式集合 +
+
+ + +
+ → bag-of-heuristics · othello-world-model-hypothesis · mechanistic-interpretability · probing-classifiers + alignmentforum.org +
+
+ + diff --git a/site/src/content/cards/zh/sources/ranlp-2025-hidden-cost-constrained-decoding.mdx b/site/src/content/cards/zh/sources/ranlp-2025-hidden-cost-constrained-decoding.mdx new file mode 100644 index 0000000..f8e6e87 --- /dev/null +++ b/site/src/content/cards/zh/sources/ranlp-2025-hidden-cost-constrained-decoding.mdx @@ -0,0 +1,138 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Hidden Cost of Structure — Trajectory Bias +titleAlt: RANLP 2025 Hidden Cost +tagline: Schall · de Melo · 约束解码的隐性代价 · 轨迹偏差 · 11 模型跨基准实验 · RANLP 2025 +author: Maximilian Schall · Gerard de Melo +year: 2025 +url: https://aclanthology.org/2025.ranlp-1.124/ +refs: + - concepts/constrained-decoding + - concepts/trajectory-bias + - concepts/structured-outputs +sourceLine: RANLP 2025 · pp. 1074–1084 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · HIDDEN COST OF STRUCTURE · RANLP 2025 · 轨迹偏差 + + + +

结构的隐性代价 · 轨迹偏差

+

即使句法完全合规——结构性约束系统性损害语义正确性

+
+ + + + 轨迹偏差(Trajectory Bias)——约束解码通过每步 token 的 mask + 重归一化,把模型的推理轨迹推向"更容易保持结构合法的前缀",即使这些前缀对应错误答案。 + + + + +
+
约束解码的两步扰动
+
+
1
+
掩码非法 token
+
将违反文法约束的 token 概率归零
+
+
+
2
+
重归一化
+
在剩余合法 token 集合上重新分配概率——当严格格式强制低熵语法决策时,重归一化变成大扰动
+
+ +
+
自然语言倾向
+
+
P(好)
+
P(quote)
+
P(brace)
+
other
+
+
↓ 约束解码
+
约束后分布(低置信度)
+
+
{'P(")'}
+
{'P({)'}
+
+
+
+
+ + +
+
基础模型 vs SFT基础模型对结构约束适应更好——SFT 的对话训练与结构约束冲突当前 SFT 可能无意间削弱结构化输出能力
+
Few-shot 非对称约束模型从 few-shot 获益斜率更陡——自然语言灵活性被剥夺后,few-shot 成主要代偿
+
训练时集成当前"训练流畅对话 + 推理时施加约束"范式存在根本性错位——需训练阶段集成
+
+
+ + +
+ → constrained-decoding · trajectory-bias · structured-outputs · system-1-vs-system-2 + aclanthology.org +
+
+ + diff --git a/site/src/content/cards/zh/sources/raymond-unix-philosophy-summary.mdx b/site/src/content/cards/zh/sources/raymond-unix-philosophy-summary.mdx new file mode 100644 index 0000000..bd34aa9 --- /dev/null +++ b/site/src/content/cards/zh/sources/raymond-unix-philosophy-summary.mdx @@ -0,0 +1,110 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Unix Philosophy Summary — Bridging to Managed Agents +titleAlt: Raymond Unix Philosophy Summary +tagline: Raymond 2003 摘要 · "programs as yet unthought of" · 接口最小化 → 适用性最大化 +author: wiki 摘要(基于 Raymond 2003) +year: 2026 +url: http://www.catb.org/esr/writings/taoup/html/ch03s01.html +refs: + - concepts/unix-philosophy + - concepts/aci +sourceLine: wiki 摘要 · TAOUP Ch.3 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头摘要 · UNIX PHILOSOPHY · 桥接到 Managed Agents + + + +

Unix 哲学摘要

+

Raymond 的统一思想分析——桥接到 Anthropic Managed Agents 的 meta-harness

+
+ + +
+
+
Unix 设计者的挑战
+
+ 如何设计一个系统,使其能容纳尚未被构想的程序? +
+
+ → "一切皆文件" 将所有 I/O 统一到 read() / write() +
+
+
+
+
Meta-Harness 的挑战
+
+ 如何设计一个 agent 平台,容纳尚未实现的 harness? +
+
+ → 将所有工具调用统一到 execute(name, input) → string +
+
+
+
+ + + + 共同设计哲学——通过接口最小化实现适用性最大化。两者都放弃了"预判所有可能组件"的野心,改为定义最小通用契约,让后续发展在契约内自由演化。 + + + + +
+
分析维度统一思想 · 多任务 · 协作进程 · 内部边界 · 文件属性 · 二进制透明 · 推荐语言
+
Unix 风格Ken Thompson:"design programs to operate with programs as yet unthought of"
+
+
+ + +
+ → unix-philosophy · aci · managed-agents · raymond-unix-philosophy + wiki 摘要 +
+
+ + diff --git a/site/src/content/cards/zh/sources/raymond-unix-philosophy.mdx b/site/src/content/cards/zh/sources/raymond-unix-philosophy.mdx new file mode 100644 index 0000000..9f6dd45 --- /dev/null +++ b/site/src/content/cards/zh/sources/raymond-unix-philosophy.mdx @@ -0,0 +1,111 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Elements of Operating-System Style (Raymond) +titleAlt: Raymond TAOUP Chapter 3 +tagline: Eric S. Raymond · The Art of Unix Programming · Unix vs anti-Unix · 2003 +author: Eric S. Raymond +year: 2003 +url: http://www.catb.org/esr/writings/taoup/html/ch03s01.html +refs: + - concepts/unix-philosophy + - concepts/everything-is-a-file + - concepts/aci +sourceLine: TAOUP Ch. 3 · 2003-09-19 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · OPERATING-SYSTEM STYLE · ESR · TAOUP Ch.3 · 2003 + + + +

操作系统风格的要素

+

Unix 的统一思想如何塑造开发风格——反面设计就是"完美反 Unix"

+
+ + + + "In Unix, one tries to design programs to operate not specifically with each other, but with programs as yet unthought of."——Ken Thompson + + + + +
七个维度 · Unix 风格 vs 反面设计
+
+
+
统一思想
+
"一切皆文件" + 管道
+
无统一思想 · 临时特性堆砌
+
+
+
多任务
+
抢占式 preemptive
+
不支持 · 或被限制到难以使用
+
+
+
协作进程
+
廉价 spawn + 灵活 IPC
+
昂贵 spawn · IPC 半吊子
+
+
+
内部边界
+
MMU + 用户权限 + 最小可信代码
+
弱权限组 · 大量可信代码
+
+
+
文件属性
+
无记录结构 · 字节流
+
笨重记录结构 · 重度依赖属性
+
+
+
文件格式
+
文本透明 · filter 生态
+
全部二进制 · 需重工具读写
+
+
+
首选界面
+
CLI + GUI 并重 · 可脚本
+
无 CLI · 重要功能不可脚本
+
+
+
+ + +
+ McIlroy 论管道 + "The pipe was technically trivial, but profound in its effect."——底层是统一的"进程作为自治计算单元 + 可编程控制" +
+
+ + +
+ → unix-philosophy · everything-is-a-file · aci · managed-agents + catb.org/esr/writings/taoup +
+
+ + diff --git a/site/src/content/cards/zh/sources/simon-architecture-of-complexity-notes.mdx b/site/src/content/cards/zh/sources/simon-architecture-of-complexity-notes.mdx new file mode 100644 index 0000000..8ffe8bd --- /dev/null +++ b/site/src/content/cards/zh/sources/simon-architecture-of-complexity-notes.mdx @@ -0,0 +1,121 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Architecture of Complexity (Simon 1962) +titleAlt: Herbert Simon Architecture of Complexity +tagline: Herbert Simon · 层级系统 · 钟表匠寓言 · 近可分解性 · 1962 +author: Herbert A. Simon +year: 1962 +url: https://www.infraculture.org/2020-09-10-text-notes-architecture-of-complexity/ +refs: + - concepts/hierarchical-systems + - concepts/near-decomposability + - entities/herbert-simon +sourceLine: Proc. American Philosophical Society 106(6) +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · ARCHITECTURE OF COMPLEXITY · Simon 1962 · 跨学科复杂性结构 + + + +

复杂性的架构 · Simon 1962

+

复杂系统的共有结构属性——不在内容,在架构

+
+ + +
+
+
+
层级系统
+
子系统嵌套子系统——社会/生物/物理/符号系统普遍呈现层级。用交互强度统一空间邻近与社会组织
+
+
+
+
复杂系统的演化
+
钟表匠寓言——稳定中间形态的系统演化速度远快于无中间形态者
+
+
+
+
近可分解性
+
子系统内交互 ≫ 子系统间交互——短期各子系统近似独立,长期仅以聚合方式相互影响
+
+
+
+
描述复杂性
+
大纲形式是自然语言——复杂系统的描述不必与对象一样庞大,描述复杂度取决于表示而非对象
+
+
+ +
+ 钟表匠寓言 · Watchmaker Parable +
+
+
Hora
+
子组件 10 个一组 · 逐层组装
+
✓ 被打断仅丢失一组
+
+
+
Tempus
+
一次性组装全部零件
+
✗ 被打断即从头来 · 破产
+
+
+
+
+ + + + 部分进展在问题求解中扮演的角色,等同于稳定子组件在演化中的角色。选择性的两个来源:迭代试错 + 先前经验(归约为已解决问题)。 + + + + +
+ → hierarchical-systems · near-decomposability · herbert-simon · pace-layers · harness-engineering + Proc. APS · 1962 +
+
+ + diff --git a/site/src/content/cards/zh/sources/sumeru-mustard-seed-buddhist.mdx b/site/src/content/cards/zh/sources/sumeru-mustard-seed-buddhist.mdx new file mode 100644 index 0000000..1aec5c6 --- /dev/null +++ b/site/src/content/cards/zh/sources/sumeru-mustard-seed-buddhist.mdx @@ -0,0 +1,118 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: 须弥藏芥子 · 芥子纳须弥 +titleAlt: Sumeru & Mustard Seed +tagline: 佛教典故 · 智常禅师 vs 李渤 · 一粒米镇河水 · 大小之分源于心 · 2025 +author: 佛教典故综述 +year: 2025 +url: https://hhdorjechangbuddhaiiiinfoonline.wordpress.com/2025/03/19/须弥藏芥子芥子纳须弥-佛教典故的含义/ +refs: + - concepts/sumeru-mustard-seed + - entities/avatamsaka-sutra +sourceLine: 佛教典故 · 2025-03-19 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · 须弥藏芥子 · 芥子纳须弥 · 佛教典故 + + + +

須彌藏芥子 · 芥子納須彌

+

大小无碍——容量不受物理尺寸限制

+
+ + +
+
+
+
+ +
+
+
+
+
+
+ +
+
+
+
+ 八万四千由旬的神山 · 可容于粟粒种子 + 无限容量 · 由所容之物的性质决定 +
+
+
+ + +
+ 智常 vs 李渤 +

唐朝江州刺史李渤质疑"芥子纳须弥"。智常以李渤自身为喻——人头不过椰子大小,却能装下万卷书。容量不受物理尺寸限制,取决于所容纳之物的性质。

+
+
+ 一粒米镇河水 +

佛陀弟子用须弥山无法镇住翻涌的河水,但佛陀轻拈的一粒米饭令河流平息——一粒米从播种到成熟积累了无量功德,虔诚一念让小物与须弥山等量。

+
+
+ + +
+ 西方回响 + William Blake — "To see a world in a grain of sand, and a heaven in a wild flower"——东西方在"微小中蕴含无限"上的会通 +
+
+ + +
+ → sumeru-mustard-seed · avatamsaka-sutra · indra-net · fractal-architecture + 佛教典故 · wiki 收录 +
+
+ + diff --git a/site/src/content/cards/zh/sources/sutton-bitter-lesson-summary.mdx b/site/src/content/cards/zh/sources/sutton-bitter-lesson-summary.mdx new file mode 100644 index 0000000..6922ba8 --- /dev/null +++ b/site/src/content/cards/zh/sources/sutton-bitter-lesson-summary.mdx @@ -0,0 +1,103 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Bitter Lesson — Summary +titleAlt: Sutton Bitter Lesson 摘要 +tagline: Sutton 2019 摘要 · 搜索 + 学习 · 不要内建发现,要内建发现过程 +author: wiki 摘要(基于 Sutton 2019) +year: 2026 +url: http://www.incompleteideas.net/IncIdeas/BitterLesson.html +refs: + - concepts/bitter-lesson + - concepts/search-and-learning +sourceLine: wiki 摘要 · Sutton 2019 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头摘要 · BITTER LESSON · wiki 综合 + + + +

苦涩的教训摘要 · 与 Agent 工程的连接

+

核心论点 · 两类可扩展方法 · 对 harness engineering 的直接指导

+
+ + + + 70 年 AI 研究反复证实:利用通用计算的方法最终以巨大优势胜出。研究者反复试图把人类领域知识内建到系统中——短期有效且令人满足,长期会停滞甚至阻碍进展。突破来自相反方法:扩展计算的搜索和学习。 + + + + +
+
两类可无限扩展的方法
+ +
+
学习 Learning
+
自我对弈 · 深度学习 · scaling laws
+
+
+
+
关键警句
+
心智内容是不可还原地复杂的——不应试图建模空间、对象、对称性。应建入能找到和捕捉复杂性的元方法
+
+
+ + +
+ 对 Agent 工程的直接指导 +
Managed Agents引用 Bitter Lesson 论证 harness 假设会过时——harness 中内建的"模型做不到什么"就是 Sutton 批评的领域知识内建
+
Harnessing三大模式(用已知工具 · 持续剥离假设 · 谨慎设边界)直接实践 Bitter Lesson
+
What can I stop?Harness Engineering 的核心反思方向
+
+
+ + +
+ → bitter-lesson · search-and-learning · harness-engineering · managed-agents + wiki 摘要 +
+
+ + diff --git a/site/src/content/cards/zh/sources/sutton-bitter-lesson.mdx b/site/src/content/cards/zh/sources/sutton-bitter-lesson.mdx new file mode 100644 index 0000000..bc76f72 --- /dev/null +++ b/site/src/content/cards/zh/sources/sutton-bitter-lesson.mdx @@ -0,0 +1,117 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: The Bitter Lesson +titleAlt: Rich Sutton Bitter Lesson +tagline: Rich Sutton · 70 年 AI 最大教训 · 通用方法 + 计算扩展胜过一切 · 2019 +author: Rich Sutton +year: 2019 +url: http://www.incompleteideas.net/IncIdeas/BitterLesson.html +refs: + - concepts/bitter-lesson + - concepts/search-and-learning + - concepts/scaling-laws +sourceLine: incompleteideas.net · 2019-03-13 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · BITTER LESSON · Rich Sutton · 2019-03-13 + + + +
+
"
+
The biggest lesson from 70 years of AI research is that general methods that leverage computation are ultimately the most effective, and by a large margin.
+
—— Rich Sutton, 2019
+
+
+ + +

苦涩的教训

+

搜索与学习 · 两类可无限扩展的方法——人类领域知识短期有效,长期败于算力

+
+ + + 反复出现的历史模式 +
+
1997国际象棋深度搜索胜 Kasparov——人类知识派"不是好输家"
+
2016围棋AlphaGo 自我对弈学习——晚了 20 年的相同剧本
+
1970s语音识别HMM 统计方法胜手工音素特征
+
2012计算机视觉CNN 卷积胜 SIFT/边缘检测
+
+
+ + +
+
模式四步曲
+
研究者试图内建知识到 agent
+
短期有效,且令研究者满足
+
长期停滞甚至阻碍进展
+
突破来自相反方法——扩展计算 · 搜索 + 学习
+
+
+ + + + "We want AI agents that can discover like we can, not which contain what we have discovered."——不要内建发现,要内建发现过程。 + + + + +
+ → bitter-lesson · search-and-learning · scaling-laws · harness-engineering + incompleteideas.net +
+
+ + diff --git a/site/src/content/cards/zh/sources/twitter-managed-agents-reactions.mdx b/site/src/content/cards/zh/sources/twitter-managed-agents-reactions.mdx new file mode 100644 index 0000000..cc64d0c --- /dev/null +++ b/site/src/content/cards/zh/sources/twitter-managed-agents-reactions.mdx @@ -0,0 +1,134 @@ +--- +schemaVersion: one-shot-card/v1 +cardLayout: bleed +title: Twitter Reactions — Managed Agents Launch +titleAlt: X Reactions Managed Agents +tagline: X/Twitter 社区反应 · 三种 harness 模式 · 平台吃掉中间件 · Conway Phase 1 · 2026-04 +author: X 社区讨论合集 +year: 2026 +url: https://x.com/NotionHQ/status/2041929576369287352 +refs: + - concepts/managed-agents + - concepts/harness-engineering + - entities/anthropic +sourceLine: X (Twitter) · 2026-04-08/09 +--- + +import Band from '~/components/card/blocks/Band.astro'; +import Kicker from '~/components/card/blocks/Kicker.astro'; +import CoreDef from '~/components/card/blocks/CoreDef.astro'; + + + 源头 · X REACTIONS · Managed Agents 发布 · 社区热议 · 2026-04 + + + +

Managed Agents 发布的 X 社区反应

+

架构洞察 · 产业冲击 · lock-in 担忧

+
+ + +
+
+
+ @NotionHQ + 三种 harness 模式分类 +
+
+ Custom Agents(用户运行)· Claude + MCP(Claude 运行)· Managed Agents(Anthropic 运行)——"谁拥有循环和执行环境"的谱系 +
+
+ +
+
+ @alexgshaw + 行业空白 +
+
+ execute(name, input) → string 暴露一个空白——MCP 标准化了工具发现,但没标准化工具在哪里执行。"谁在构建 Agent Sandbox Protocol?" +
+
+ +
+
+ @aakashgupta · @Hesamation + 最广传播 +
+
+ "Anthropic 一次发布就让所有 agent 编排创业公司过时了。"——经典"平台吃掉中间件",每个以"让 Claude 在生产中可靠"为卖点的公司都失去了 pitch deck +
+
+ +
+
+ @testingcatalog + 代号发现 +
+
+ 内部代号 "Conway"(呼应 Conway's Law:组织结构决定系统架构),标注为 Phase 1——暗示更大平台计划 +
+
+ +
+
+ @thedealdirector + 唯一批评 +
+
+ "Anthropic 试图在行业探索期就推垂直整合——用我的模型、在我的界面、按我的方式"——lock-in 担忧 +
+
+
+
+ + +
+ 社区共识 +
架构 > 功能技术帖关注 brain-hands 解耦作为设计论文而非产品特性
+
创业冲击"平台吃掉中间件"最响亮
+
VPC 解耦brain 不在客户 VPC 运行 → 企业采用解锁
+
+
+ + +
+ → managed-agents · harness-engineering · anthropic · agent-sandbox-protocol + X/Twitter · HN 47693047 +
+
+ + From bba917615be4c244dd2457db2c757a026af279e3 Mon Sep 17 00:00:00 2001 From: Pandazki Date: Fri, 24 Apr 2026 21:45:45 +0800 Subject: [PATCH 42/48] feat(wiki): seal right, compact list cards, full-card gacha modal MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Three UI fixes after reviewing the entities detail page, wiki index, and gacha (draw-a-card) modal: 1. Detail page: swap seal from left to right column of the header; grid goes from 3-col to 2-col (titleblock / seal). 2. Wiki list cards: drop the 4:5 A4 aspect-ratio for `oscard--mini`, hide refs chips + source line in the footer. Auto-height rows driven by content; ~3× more density per screen. 3. Gacha modal: replace the hand-built image + title + desc layout with an iframe that loads `/card-fragment/{lang}/{kind}/{slug}` — the same path `CardModal` uses, so the draw now reveals the full one-shot card (bleed layout, SVG, bands, etc.). Card width derived from `(100vh - 160px) / 1.414` so the 1:1.414 aspect never fights a viewport height cap. Co-Authored-By: Claude Opus 4.7 (1M context) --- site/src/components/WikiAtlas.astro | 144 +++++------------- site/src/components/card/OneShotCard.astro | 11 +- .../src/pages/[lang]/wiki/[kind]/[slug].astro | 10 +- 3 files changed, 50 insertions(+), 115 deletions(-) diff --git a/site/src/components/WikiAtlas.astro b/site/src/components/WikiAtlas.astro index bf85765..4e0a74a 100644 --- a/site/src/components/WikiAtlas.astro +++ b/site/src/components/WikiAtlas.astro @@ -167,16 +167,10 @@ const cardEntries = [...byKind.concepts, ...byKind.entities].sort((a, b) => a.sl {/* ── Gacha overlay (hidden until 抽卡 clicked) ───────────────── */} -