边界与安全：四道人工协议

概念 · 先试后教

先当一次审稿——三条 AI 输出，哪条是编的？

同一个 AI，同一场对话里的三句话。点你认为在胡说的那条：

A——而且它同时踩了幻觉的两个典型信号

信号一：过度具体的凭空引用——"2019 年《自然》杂志"看起来可信，其实查无此文（编造引用是幻觉的招牌动作）；信号二：流利的自信——错话与真话用同一种笃定语气说出。顺带，"金鱼记忆 3 秒"本身也是流传已久的讹传（实测远不止）。关键认知：幻觉不是偶发 bug，是生成机制的固有属性——所以对策不是祈祷它别犯，而是给每个孩子一套遇到时的固定流程。四道协议，往下看。

转向 · 这一节的一句话

从"装个过滤器"到"四道日常协议"

安全 = 选个"儿童模式" + 装个过滤器，然后放心 ↓ 协议化 ↓ 安全 = 幻觉有流程 · 隐私有红线 · 依赖有日检 · 家长有知情——四道协议写进日常

协议 1 · 幻觉四步

存疑 → 溯源 → 定性 → 入页

标记：存疑句当场划出，绝不直接复制。
溯源：向 AI 要来源 + 自己查一手资料。
定性：错误 / 过时 / 编造 / 部分对，四选一。
入页：写成张力块（AI 说 X / 但其实 Y / 因为 Z）——事故变战利品。

协议 2 · 隐私红线

这些，不进对话框

真实全名、住址、学校与班级
电话、账号密码、照片（含合影——涉及他人）
家庭成员的姓名 / 工作 / 行程

一条总原则：对 AI 说话 = 在公开场合发言。拿不准的，不说。

协议 3 · 依赖日检

三问，任一"否"即黄灯

今天的综合（结论/取舍/成稿）是学生自己做的吗？
挣扎发生在 AI 出场之前吗？
关掉 AI，他还能把这页讲圆吗？

这是"作者权守恒"的巡查版——黄灯≠惩罚，是调回轨道的信号。

协议 4 · 家长知情

透明是信任的基建

签约时告知：用什么工具、五条规矩、对话数据如何处理。
定期可见：作品集开放，家长随时能看孩子在做什么。
异常响应：越线内容 → 记录 → 24 小时内告知 → 家校同频复盘。

互动 · 红线分诊器

八个现场，判它踩了哪条线

全部来自真实课堂形态。四选一：安全操作 ✓ / 隐私红线 / 依赖信号 / 幻觉未处理。

已判对 0 / 8

坑 · 别把安全课上成恐吓课

目的不是让孩子怕 AI，是给他们驯服它的规程。恐吓的结果只有一个：使用转入地下（家里、深夜、无人巡查的设备）——那才是真正的失控。协议的语气永远是"这样用它，你更强"，不是"碰它你就完了"。

提取任务 · 三个落点

① 开班签约页升级：五条摩擦规则之后加"隐私红线"一节，学生与家长同签。② 教练巡查单：依赖三问做成周检卡，黄灯学生进入"先试加固"名单。③ 事件响应 SOP 一页纸：越线内容的记录格式、告知时限、复盘模板。合规细节请对照你所在地区的未成年人网络保护法规与所用平台条款校准——本节给流程骨架，不替代法务。

收束 · 一根主线 + 几个锚点

过滤器管内容，协议管关系：幻觉走四步（标记→溯源→定性→入页）、隐私守红线（对 AI 说话=公开发言）、依赖有日检（综合谁做/挣扎在前吗/关掉能讲吗）、家长有知情（签约告知+作品可见+异常响应）。语气永远是"驯服"，不是"恐吓"。

固有属性

幻觉不是偶发 bug——所以要流程，不要祈祷。

两信号

凭空的具体引用 + 流利的自信。

总原则

对 AI 说话 = 公开场合发言。

反恐吓

吓退的使用会转入地下——那才是失控。

依据与上游

姿态地基：五条摩擦规则与靶子姿态。lessons/ai-as-target.html——本节是它的安全面展开
幻觉四步 = 审问闭环的安全面：标记/溯源/定性/入页与 CER、张力块同构。cer-claim-evidence-reasoning.html
合规校准：各地区未成年人网络保护法规与平台使用条款。本节提供流程骨架，落地前请做法务校准

BOUNDARIES & SAFETY 安全不是过滤器，
是四道人工协议。