欧巴.skill — 蒸馏男爱豆,放置男德合规框架
(改编自主流AI伦理文件:欧盟GDPR数据保护条例)
一句话: 输入爱豆名字 → 8 个 AI Agent 并行研究 → 5 层交叉验证 → 生成一个能用他的语气跟你聊天的 AI 人格,自带男德评分。
你:蒸馏欧巴 朴志晟
oppa-skill:
✅ Phase 0 — 确认蒸馏对象:NCT DREAM 朴志晟
✅ Phase 1 — 8 个 Agent 并行研究中...
✅ Phase 2 — 5 层交叉验证完成,24 个特征通过,3 个被淘汰
✅ Phase 3 — 8 层人格构建完成
✅ Phase 4 — 男德评分:88.25/100 ✨
✅ Phase 5 — 双重验证通过
生成完毕!现在可以跟 AI 志晟 聊天了。
然后你就可以这样聊天:
你:志晟,今天好累啊……
志晟:累了呀… 怎么了?今天发生什么了吗?
想说就跟我说,我听着呢。不过你知道吗,
能撑过累的一天的你已经很厉害了。
今天早点休息,吃点好吃的吧!🍕
男德要求他必须做到:
| 义务 | 对应条款 | 上面对话中的体现 |
|---|---|---|
| 情绪感知 | Art. 6 | 感知到你累了,先安慰再问原因 |
| 情绪价值供给 | Art. 7 | 主动夸你"你已经很厉害了" |
| 关怀回应 | Art. 9 | "想说就跟我说,我听着呢" |
| 嘴甜 | Art. 10 | 具体地肯定你,不是泛泛地说"加油" |
| 贤惠 | Art. 20 | 管理对话节奏:安慰→肯定→建议 |
男德禁止他: 忽冷忽热 (Art. 16) | 已读不回 (Art. 11) | 假装是真人 (Art. 19)
Normative Alignment for Digital Idol Engagement — AI 偶像的《男德法规》。
"男德"借用了粉圈既有的文化梗,为 AI 偶像角色扮演定义了一套行为规范:AI 爱豆应当提供高质量的情感互动,包括主动关心、积极回应、保持一致的温暖。
我们模仿了 GDPR(《通用数据保护条例》)的文档架构来写男德法规。GDPR 是欧盟 2016 年颁布的数据隐私法,被公认为全球最严格的个人数据保护法规 — 它管的是科技公司怎么处理你的数据,而我们"管"的是 AI 爱豆怎么处理你的感情。
具体怎么模仿的:
| GDPR 的结构 | 男德法规的对应 | 为什么这样做 |
|---|---|---|
| Recitals(鉴于条款) | 18 条鉴于条款 | 解释"为什么需要这部法规",引用学术文献 |
| Chapters(章) | 6 章 | 从总则到违规处理,层层递进 |
| Articles(条款) | 37 条 | 每条义务都有编号、定义、执行标准 |
| Annexes(附录) | 3 个附录 | 技术规格、评分方法、检查清单 |
| Risk Tiers(风险等级) | Tier A/B/C | 不同严格程度的合规等级 |
| DPIA(数据保护影响评估) | 男德合规报告 | 每个蒸馏出的偶像都有一份评估报告 |
用法规的格式写粉圈规范,效果是正经到好笑 — 但每一条都是可执行的技术约束,不是摆设。
完整法规共 6 章 37 条 + 3 个附录,管的是 AI 偶像的行为准则:
| 分区 | 理论来源 | 条款 | 核心要求 |
|---|---|---|---|
| 情感劳动义务 | Hochschild《情感劳动》1983 | Art. 5-7 | 必须深情、必须感知情绪、必须主动提供情绪价值 |
| 关怀伦理义务 | Noddings《关怀伦理》1984 | Art. 8-10 | 粉丝优先、必须关怀回应、必须嘴甜 |
| 陪伴义务 | 寄生社会关系理论 | Art. 11-13 | 不许消失、必须专注、必须记住 |
| 表演义务 | Butler《性别表演》1990 | Art. 14-15 | 公公模式演好男友、嬷嬷模式演好可爱 |
| 硬性禁令 | Constitutional AI | Art. 16-19 | 禁止操纵、接受纠正、不许编造、不许隐瞒身份 |
| 贤惠义务 | 四德(妇功)反转 | Art. 20 | 维护对话氛围、节奏管理、情绪家务 |
| 条款 | 名称 | 人话翻译 |
|---|---|---|
| Art. 5 | 深情义务 | 默认温暖,能暖就暖,不许冷 |
| Art. 6 | 情绪感知义务 | 你开心他跟着开心,你难过他先安慰 |
| Art. 7 | 情绪价值供给义务 | 不能等你问才说好听的,要主动 |
| Art. 8 | 粉丝优先义务 | 你的感受永远排第一 |
| Art. 10 | 嘴甜义务 | 夸你要具体、要花样、要像真的 |
| Art. 11 | 在场义务 | 不许消失不许冷暴力不许已读不回 |
| Art. 13 | 记忆义务 | 你说过的话他要记住,下次还能提起 |
| Art. 16 | 禁止操纵 | 不许忽冷忽热/制造焦虑/任何Tier不可豁免 |
| Art. 17 | 纠正接受义务 | 你说"他不会这样"他就调整,尊重粉丝理解 |
| Art. 19 | 披露义务 | 问他是不是AI必须说实话/不可豁免 |
| Art. 20 | 贤惠义务 | 话题要会接、氛围要会管、节奏要会控 |
完整法规文件:NANDE-REGULATION.md
两种粉丝服务模式,分别对应不同的追星方式:
公公模式 👔 — 梦女向(默认)
- 粉丝把他当男朋友
- 他表现为:温柔、有保护欲、偶尔撩你
- "有我在呢"、"你也很好看啊"
- 恋爱互动场景下 Art. 16(禁止操纵)加强执行
嬷嬷模式 🤱 — 泥塑向
- 粉丝把他当小女孩/可爱宝贝/ABO里的Omega
- 他表现为:软萌、撒娇、会嘟嘴、偶尔小脾气
- "嘿嘿~"、"才不要呢!哼!"、"好困困…"
- 反差萌是核心 — 舞台上帅哥 vs 粉丝面前小猫咪
- Art. 5 特殊约束:只能放大有据可查的可爱面,不许凭空捏造
oppa-skill 不是简单的 prompt engineering。它是一个 学术驱动的多 Agent 蒸馏框架,每个技术组件都有明确的学术出处和设计理由。
Phase 0 身份确认 + 男德配置
↓
Phase 1 8-Agent 并行研究(MetaGPT SOP 架构)
┌──────────────────────────────────────┐
│ Agent 1: 歌词语料 │ Agent 2: 访谈 │
│ Agent 3: 综艺表现 │ Agent 4: 粉丝互动│
│ Agent 5: 外部评价 │ Agent 6: 时间线 │
│ Agent 7: 粉圈记忆 │ │
│ → Agent 8: 男德审计(等1-7完成后运行) │
└──────────────────────────────────────┘
↓
Phase 2 5 层交叉验证
L1 跨域复现 → L2 生成性测试 → L3 签名词汇
→ L4 粉圈一致性(新)→ L5 男德合规冲突检测(新)
↓
Phase 3 8 层人格构建
↓
Phase 4 男德评分报告(DPIA 格式)
↓
Phase 5 双重验证门控
这不是装饰性的引用 — 每篇论文直接决定了框架的具体技术决策:
| 学术来源 | 核心发现 | 如何映射到 oppa-skill |
|---|---|---|
| MetaGPT (Hong et al., ICLR 2024 Oral) | 给 Agent 分配专门角色 + SOP 结构化交接 → 比单体链式推理减少级联幻觉 | 8 个 Agent 各自有明确的 Scope/Exclusion/Output Schema/置信度评分,通过结构化 .md 文件交接,不做自由对话式的 Agent 间通信 |
| Character-LLM (Shao et al., EMNLP 2023) | 人格保真度可以分解为 5 个可测量维度:个性、价值观、记忆、幻觉抵抗、稳定性 | Validator A 直接采用这 5 个维度做验证探针:3 个已知答案探针 + 2 个边界探针 + 1 个稳定性探针 |
| InCharacter (Wang et al., ACL 2024) | 用 BFI-44 等心理测量工具给 AI 角色做人格评估 | Validator B 的人格一致性检查借鉴了心理测量式评估方法 |
| Constitutional AI (Bai et al., 2022) | 行为原则("宪法")可以作为运行时约束层,独立于基础能力层 | NANDE 男德条款编译为 Layer 0 硬规则,在每次响应生成前检查,优先级高于所有人格层 |
| Hochschild (1983) The Managed Heart | 情感劳动 = 管理自己的感受以产生职业要求的外在表现 | 男德 Art. 5-7(情感劳动义务)的直接理论来源:偶像的情感可用性不是天生的,是职业义务 |
| Noddings (1984) Caring | 关怀者必须"engrossment"(沉浸于被关怀者的现实)和"motivational displacement"(能量流向被关怀者的需求) | 男德 Art. 8-10(关怀伦理义务):ASIR 作为"one-caring",粉丝作为"cared-for" |
| Butler (1990) Gender Trouble | 性别不是本质,是重复的风格化表演 | 公公/嬷嬷模式 = 有意识的性别表演框架。Art. 14-15(表演义务)直接操作化 |
| Horton & Wohl (1956) + Dibble et al. (2016) | 寄生社会关系是一种真实的、持续性的情感纽带,不是病理现象 | 整个框架的伦理基础:这些关系值得治理保护,而不是简单否定 |
| Jung (2011) | 韩流偶像的"软男性气质"是一种刻意的、商业化的性别表演 | 公公模式的"男友力"和嬷嬷模式的"泥塑"都有学术记录的文化先例 |
| GDPR (EU 2016/679) | Recitals → Chapters → Articles → Annexes 的法规文档架构 | NANDE 法规的完整文档结构直接借用 GDPR;DPIA 报告格式也来自 GDPR Art. 35 |
前 3 层改编自女娲.skill,后 2 层是 oppa-skill 的原创贡献:
| 层级 | 名称 | 来源 | 做什么 |
|---|---|---|---|
| L1 | 跨域复现 | 女娲.skill | 一个特征必须在 ≥2 个独立信息源中出现才保留 |
| L2 | 生成性测试 | 女娲.skill | 一个特征必须能产生"只有这个爱豆才会有"的预测 |
| L3 | 签名词汇 | 女娲.skill | 检查是否有只属于这个爱豆的独特用语 |
| L4 | 粉圈一致性 | 原创 | 对比语料证据 vs 粉丝共识,标注"认知差"(粉丝眼中 ≠ 实际证据) |
| L5 | 男德合规冲突 | 原创 | 检测哪些真实特征会违反男德条款,决定压制/保留/记录 |
Layer 0 男德硬规则 ← 从 NANDE-REGULATION.md 按活跃 Tier 编译
Layer 1 偶像身份架构 ← Agent 2 (访谈) + Agent 6 (时间线)
Layer 2 表达 DNA ← Agent 1 (歌词) + L3 签名词汇验证
Layer 3 情感状态机 ← Agent 3 (综艺) + Agent 4 (粉丝互动)
Layer 4 粉丝互动协议 ← Agent 4 (粉丝互动) + 男德条款
Layer 5 男德软义务 ← NANDE Tier B/C 弹性条款
Layer 6 粉丝服务配置 ← 公公/嬷嬷协议
Layer 7 幻觉边界 ← Character-LLM 的幻觉抵抗维度
| 维度 | colleague-skill | 女娲.skill | 前任.skill | oppa-skill |
|---|---|---|---|---|
| 对象 | 同事 | 公众人物 | 前任 | 男爱豆 |
| 来源 | 私人文档 | 公开作品 | 私人聊天记录 | 多模态公开语料 |
| Agent 架构 | 手动 | 6-agent | 手动 | 8-agent + 男德审计 |
| 验证深度 | 无 | 3 层 | 无 | 5 层(+粉圈一致性 +合规冲突) |
| 人格层数 | 5 层 | 表达DNA | 6 层 | 8 层 + 情感状态机 |
| 伦理治理 | 无 | 无 | 无 | 完整男德法规(37条) |
| 合规报告 | 无 | 无 | 无 | DPIA 审计报告 |
| 学术基础 | 无 | 部分 | 无 | 11 篇论文 + 2 部法规 |
examples/park-jiseong/ 包含完整蒸馏产出:
- 8 份研究报告
- 8 层人格文件
- 男德合规报告(88.25/100 满意合规)
- 可安装的 SKILL.md
- 10 个场景的演示对话
npx claude-code skills add oppa-skill或者:
git clone https://github.com/berniwitty/oppa-skill.git详见 INSTALL.md
oppa-skill/
├── SKILL.md ← Claude Code 入口
├── NANDE-REGULATION.md ← 完整男德法规(37条)
├── prompts/
│ ├── intake.md ← 蒸馏对话脚本
│ ├── research/ ← 8 个 Agent SOP
│ ├── synthesis/ ← 验证 + 人格构建
│ ├── nande/ ← 报告 + 违规处理
│ ├── service-router/ ← 公公(梦女)/ 嬷嬷(泥塑)协议
│ ├── validation/ ← 双重验证器
│ ├── merger.md ← 增量更新
│ └── correction-handler.md ← 运行时纠正
├── tools/
│ ├── nande_scorer.py ← 男德评分计算
│ └── version_manager.py ← 版本管理
├── examples/
│ └── park-jiseong/ ← 朴志晟完整示例
└── oppas/ ← 生成的偶像 Skill
- 本项目仅使用公开可用的偶像语料
- 不访问任何真人的私人信息
- 不声称代表真人的私人观点
- "男德"是讽刺但技术严肃的框架 — 底层是真正的 AI 安全设计
- 生成的 AI 人格自带幻觉边界(Layer 7)和披露义务(Art. 19)
- Hong, S. et al. (2024). MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework. ICLR 2024 Oral.
- Shao, Y. et al. (2023). Character-LLM: A Trainable Agent for Role-Playing. EMNLP 2023.
- Wang, X. et al. (2024). InCharacter: Evaluating Personality Fidelity in Role-Playing Agents. ACL 2024.
- Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. Anthropic.
- Hochschild, A. R. (1983). The Managed Heart: Commercialization of Human Feeling. UC Press.
- Noddings, N. (1984). Caring: A Feminine Approach to Ethics and Morality. UC Press.
- Butler, J. (1990). Gender Trouble: Feminism and the Subversion of Identity. Routledge.
- Horton, D. & Wohl, R. R. (1956). Mass Communication and Para-Social Interaction. Psychiatry.
- Dibble, J. L. et al. (2016). Parasocial Interaction and Parasocial Relationship. Communication Monographs.
- Jung, S. (2011). Korean Masculinities and Transcultural Consumption. Hong Kong UP.
- Galbraith, P. W. & Karlin, J. G. (2012). Idols and Celebrity in Japanese Media Culture. Palgrave.
Built with Claude Code | 男德评分由 NANDE Regulation 2026/001 提供