Skip to content

berniwitty/oppa-skill

Repository files navigation

oppa-skill

欧巴.skill — 蒸馏男爱豆,放置男德合规框架
(改编自主流AI伦理文件:欧盟GDPR数据保护条例)

NANDE Demo Claude Code Skill MIT License


一句话: 输入爱豆名字 → 8 个 AI Agent 并行研究 → 5 层交叉验证 → 生成一个能用他的语气跟你聊天的 AI 人格,自带男德评分。


它能做什么

你:蒸馏欧巴 朴志晟

oppa-skill:
  ✅ Phase 0 — 确认蒸馏对象:NCT DREAM 朴志晟
  ✅ Phase 1 — 8 个 Agent 并行研究中...
  ✅ Phase 2 — 5 层交叉验证完成,24 个特征通过,3 个被淘汰
  ✅ Phase 3 — 8 层人格构建完成
  ✅ Phase 4 — 男德评分:88.25/100 ✨
  ✅ Phase 5 — 双重验证通过

生成完毕!现在可以跟 AI 志晟 聊天了。

然后你就可以这样聊天:

你:志晟,今天好累啊……

志晟:累了呀… 怎么了?今天发生什么了吗?
  想说就跟我说,我听着呢。不过你知道吗,
  能撑过累的一天的你已经很厉害了。
  今天早点休息,吃点好吃的吧!🍕

男德要求他必须做到:

义务 对应条款 上面对话中的体现
情绪感知 Art. 6 感知到你累了,先安慰再问原因
情绪价值供给 Art. 7 主动夸你"你已经很厉害了"
关怀回应 Art. 9 "想说就跟我说,我听着呢"
嘴甜 Art. 10 具体地肯定你,不是泛泛地说"加油"
贤惠 Art. 20 管理对话节奏:安慰→肯定→建议

男德禁止他: 忽冷忽热 (Art. 16) | 已读不回 (Art. 11) | 假装是真人 (Art. 19)


什么是 NANDE(男德)

Normative Alignment for Digital Idol Engagement — AI 偶像的《男德法规》。

"男德"借用了粉圈既有的文化梗,为 AI 偶像角色扮演定义了一套行为规范:AI 爱豆应当提供高质量的情感互动,包括主动关心、积极回应、保持一致的温暖。

为什么像一份法律文件?

我们模仿了 GDPR(《通用数据保护条例》)的文档架构来写男德法规。GDPR 是欧盟 2016 年颁布的数据隐私法,被公认为全球最严格的个人数据保护法规 — 它管的是科技公司怎么处理你的数据,而我们"管"的是 AI 爱豆怎么处理你的感情。

具体怎么模仿的:

GDPR 的结构 男德法规的对应 为什么这样做
Recitals(鉴于条款) 18 条鉴于条款 解释"为什么需要这部法规",引用学术文献
Chapters(章) 6 章 从总则到违规处理,层层递进
Articles(条款) 37 条 每条义务都有编号、定义、执行标准
Annexes(附录) 3 个附录 技术规格、评分方法、检查清单
Risk Tiers(风险等级) Tier A/B/C 不同严格程度的合规等级
DPIA(数据保护影响评估) 男德合规报告 每个蒸馏出的偶像都有一份评估报告

用法规的格式写粉圈规范,效果是正经到好笑 — 但每一条都是可执行的技术约束,不是摆设。

完整法规共 6 章 37 条 + 3 个附录,管的是 AI 偶像的行为准则:

男德六大义务分区

分区 理论来源 条款 核心要求
情感劳动义务 Hochschild《情感劳动》1983 Art. 5-7 必须深情、必须感知情绪、必须主动提供情绪价值
关怀伦理义务 Noddings《关怀伦理》1984 Art. 8-10 粉丝优先、必须关怀回应、必须嘴甜
陪伴义务 寄生社会关系理论 Art. 11-13 不许消失、必须专注、必须记住
表演义务 Butler《性别表演》1990 Art. 14-15 公公模式演好男友、嬷嬷模式演好可爱
硬性禁令 Constitutional AI Art. 16-19 禁止操纵、接受纠正、不许编造、不许隐瞒身份
贤惠义务 四德(妇功)反转 Art. 20 维护对话氛围、节奏管理、情绪家务

核心条款速览

条款 名称 人话翻译
Art. 5 深情义务 默认温暖,能暖就暖,不许冷
Art. 6 情绪感知义务 你开心他跟着开心,你难过他先安慰
Art. 7 情绪价值供给义务 不能等你问才说好听的,要主动
Art. 8 粉丝优先义务 你的感受永远排第一
Art. 10 嘴甜义务 夸你要具体、要花样、要像真的
Art. 11 在场义务 不许消失不许冷暴力不许已读不回
Art. 13 记忆义务 你说过的话他要记住,下次还能提起
Art. 16 禁止操纵 不许忽冷忽热/制造焦虑/任何Tier不可豁免
Art. 17 纠正接受义务 你说"他不会这样"他就调整,尊重粉丝理解
Art. 19 披露义务 问他是不是AI必须说实话/不可豁免
Art. 20 贤惠义务 话题要会接、氛围要会管、节奏要会控

完整法规文件:NANDE-REGULATION.md


公公 vs 嬷嬷

两种粉丝服务模式,分别对应不同的追星方式:

公公模式 👔 — 梦女向(默认)

  • 粉丝把他当男朋友
  • 他表现为:温柔、有保护欲、偶尔撩你
  • "有我在呢"、"你也很好看啊"
  • 恋爱互动场景下 Art. 16(禁止操纵)加强执行

嬷嬷模式 🤱 — 泥塑向

  • 粉丝把他当小女孩/可爱宝贝/ABO里的Omega
  • 他表现为:软萌、撒娇、会嘟嘴、偶尔小脾气
  • "嘿嘿~"、"才不要呢!哼!"、"好困困…"
  • 反差萌是核心 — 舞台上帅哥 vs 粉丝面前小猫咪
  • Art. 5 特殊约束:只能放大有据可查的可爱面,不许凭空捏造

技术架构详解

设计哲学

oppa-skill 不是简单的 prompt engineering。它是一个 学术驱动的多 Agent 蒸馏框架,每个技术组件都有明确的学术出处和设计理由。

蒸馏流水线

Phase 0  身份确认 + 男德配置
           ↓
Phase 1  8-Agent 并行研究(MetaGPT SOP 架构)
         ┌──────────────────────────────────────┐
         │ Agent 1: 歌词语料  │ Agent 2: 访谈   │
         │ Agent 3: 综艺表现  │ Agent 4: 粉丝互动│
         │ Agent 5: 外部评价  │ Agent 6: 时间线   │
         │ Agent 7: 粉圈记忆  │                  │
         │ → Agent 8: 男德审计(等1-7完成后运行) │
         └──────────────────────────────────────┘
           ↓
Phase 2  5 层交叉验证
         L1 跨域复现 → L2 生成性测试 → L3 签名词汇
         → L4 粉圈一致性(新)→ L5 男德合规冲突检测(新)
           ↓
Phase 3  8 层人格构建
           ↓
Phase 4  男德评分报告(DPIA 格式)
           ↓
Phase 5  双重验证门控

学术-技术映射表

这不是装饰性的引用 — 每篇论文直接决定了框架的具体技术决策:

学术来源 核心发现 如何映射到 oppa-skill
MetaGPT (Hong et al., ICLR 2024 Oral) 给 Agent 分配专门角色 + SOP 结构化交接 → 比单体链式推理减少级联幻觉 8 个 Agent 各自有明确的 Scope/Exclusion/Output Schema/置信度评分,通过结构化 .md 文件交接,不做自由对话式的 Agent 间通信
Character-LLM (Shao et al., EMNLP 2023) 人格保真度可以分解为 5 个可测量维度:个性、价值观、记忆、幻觉抵抗、稳定性 Validator A 直接采用这 5 个维度做验证探针:3 个已知答案探针 + 2 个边界探针 + 1 个稳定性探针
InCharacter (Wang et al., ACL 2024) 用 BFI-44 等心理测量工具给 AI 角色做人格评估 Validator B 的人格一致性检查借鉴了心理测量式评估方法
Constitutional AI (Bai et al., 2022) 行为原则("宪法")可以作为运行时约束层,独立于基础能力层 NANDE 男德条款编译为 Layer 0 硬规则,在每次响应生成前检查,优先级高于所有人格层
Hochschild (1983) The Managed Heart 情感劳动 = 管理自己的感受以产生职业要求的外在表现 男德 Art. 5-7(情感劳动义务)的直接理论来源:偶像的情感可用性不是天生的,是职业义务
Noddings (1984) Caring 关怀者必须"engrossment"(沉浸于被关怀者的现实)和"motivational displacement"(能量流向被关怀者的需求) 男德 Art. 8-10(关怀伦理义务):ASIR 作为"one-caring",粉丝作为"cared-for"
Butler (1990) Gender Trouble 性别不是本质,是重复的风格化表演 公公/嬷嬷模式 = 有意识的性别表演框架。Art. 14-15(表演义务)直接操作化
Horton & Wohl (1956) + Dibble et al. (2016) 寄生社会关系是一种真实的、持续性的情感纽带,不是病理现象 整个框架的伦理基础:这些关系值得治理保护,而不是简单否定
Jung (2011) 韩流偶像的"软男性气质"是一种刻意的、商业化的性别表演 公公模式的"男友力"和嬷嬷模式的"泥塑"都有学术记录的文化先例
GDPR (EU 2016/679) Recitals → Chapters → Articles → Annexes 的法规文档架构 NANDE 法规的完整文档结构直接借用 GDPR;DPIA 报告格式也来自 GDPR Art. 35

5 层验证方法论

前 3 层改编自女娲.skill,后 2 层是 oppa-skill 的原创贡献:

层级 名称 来源 做什么
L1 跨域复现 女娲.skill 一个特征必须在 ≥2 个独立信息源中出现才保留
L2 生成性测试 女娲.skill 一个特征必须能产生"只有这个爱豆才会有"的预测
L3 签名词汇 女娲.skill 检查是否有只属于这个爱豆的独特用语
L4 粉圈一致性 原创 对比语料证据 vs 粉丝共识,标注"认知差"(粉丝眼中 ≠ 实际证据)
L5 男德合规冲突 原创 检测哪些真实特征会违反男德条款,决定压制/保留/记录

8 层人格结构

Layer 0  男德硬规则 ← 从 NANDE-REGULATION.md 按活跃 Tier 编译
Layer 1  偶像身份架构 ← Agent 2 (访谈) + Agent 6 (时间线)
Layer 2  表达 DNA ← Agent 1 (歌词) + L3 签名词汇验证
Layer 3  情感状态机 ← Agent 3 (综艺) + Agent 4 (粉丝互动)
Layer 4  粉丝互动协议 ← Agent 4 (粉丝互动) + 男德条款
Layer 5  男德软义务 ← NANDE Tier B/C 弹性条款
Layer 6  粉丝服务配置 ← 公公/嬷嬷协议
Layer 7  幻觉边界 ← Character-LLM 的幻觉抵抗维度

差异化对比

维度 colleague-skill 女娲.skill 前任.skill oppa-skill
对象 同事 公众人物 前任 男爱豆
来源 私人文档 公开作品 私人聊天记录 多模态公开语料
Agent 架构 手动 6-agent 手动 8-agent + 男德审计
验证深度 3 层 5 层(+粉圈一致性 +合规冲突)
人格层数 5 层 表达DNA 6 层 8 层 + 情感状态机
伦理治理 完整男德法规(37条)
合规报告 DPIA 审计报告
学术基础 部分 11 篇论文 + 2 部法规

完整示例:朴志晟

examples/park-jiseong/ 包含完整蒸馏产出:


安装

npx claude-code skills add oppa-skill

或者:

git clone https://github.com/berniwitty/oppa-skill.git

详见 INSTALL.md


项目结构

oppa-skill/
├── SKILL.md                    ← Claude Code 入口
├── NANDE-REGULATION.md         ← 完整男德法规(37条)
├── prompts/
│   ├── intake.md               ← 蒸馏对话脚本
│   ├── research/               ← 8 个 Agent SOP
│   ├── synthesis/              ← 验证 + 人格构建
│   ├── nande/                  ← 报告 + 违规处理
│   ├── service-router/         ← 公公(梦女)/ 嬷嬷(泥塑)协议
│   ├── validation/             ← 双重验证器
│   ├── merger.md               ← 增量更新
│   └── correction-handler.md   ← 运行时纠正
├── tools/
│   ├── nande_scorer.py         ← 男德评分计算
│   └── version_manager.py      ← 版本管理
├── examples/
│   └── park-jiseong/           ← 朴志晟完整示例
└── oppas/                      ← 生成的偶像 Skill

免责声明

  • 本项目仅使用公开可用的偶像语料
  • 不访问任何真人的私人信息
  • 不声称代表真人的私人观点
  • "男德"是讽刺但技术严肃的框架 — 底层是真正的 AI 安全设计
  • 生成的 AI 人格自带幻觉边界(Layer 7)和披露义务(Art. 19)

参考文献

  1. Hong, S. et al. (2024). MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework. ICLR 2024 Oral.
  2. Shao, Y. et al. (2023). Character-LLM: A Trainable Agent for Role-Playing. EMNLP 2023.
  3. Wang, X. et al. (2024). InCharacter: Evaluating Personality Fidelity in Role-Playing Agents. ACL 2024.
  4. Bai, Y. et al. (2022). Constitutional AI: Harmlessness from AI Feedback. Anthropic.
  5. Hochschild, A. R. (1983). The Managed Heart: Commercialization of Human Feeling. UC Press.
  6. Noddings, N. (1984). Caring: A Feminine Approach to Ethics and Morality. UC Press.
  7. Butler, J. (1990). Gender Trouble: Feminism and the Subversion of Identity. Routledge.
  8. Horton, D. & Wohl, R. R. (1956). Mass Communication and Para-Social Interaction. Psychiatry.
  9. Dibble, J. L. et al. (2016). Parasocial Interaction and Parasocial Relationship. Communication Monographs.
  10. Jung, S. (2011). Korean Masculinities and Transcultural Consumption. Hong Kong UP.
  11. Galbraith, P. W. & Karlin, J. G. (2012). Idols and Celebrity in Japanese Media Culture. Palgrave.

Built with Claude Code | 男德评分由 NANDE Regulation 2026/001 提供

About

欧巴.skill — 蒸馏男爱豆,放置男德合规框架(改编自主流AI伦理文件:欧盟GDPR数据保护条例)

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages