标签: AI安全-基础

已经理解 Prompt、上下文与注入，并遇到“模型会读文档、网页、邮件、知识库”的学习者。学完你能：画出 RAG 的检索链路，构造恶意文档验证间接注入，并判断风险来自检索命中、上下文拼接、来源隔离还是输出/工具联动

枫桥2026/1/8...大约 7 分钟

刚进入 AI 安全题、已经能用 HTTP/API 与模型交互的学习者。学完你能：把一次 LLM 回答拆成系统提示、用户输入、历史、检索材料和工具结果，并用可复现 prompt 验证直接注入、上下文泄露和指令优先级混淆

枫桥2026/1/5...大约 7 分钟

拿到 `.pt`、`.pth`、`.onnx`、`.safetensors`、`config.json`、`tokenizer.json` 或推理脚本的 AI 安全学习者。学完你能：安全识别模型文件类型，复现输入预处理到输出后处理的最小。

枫桥2025/12/24...大约 6 分钟

已经理解 Prompt、上下文与注入，并遇到 LLM 可读文件、发请求、查数据库或执行动作的学习者。学完你能：区分“模型说了什么”和“工具实际做了什么”，列出工具权限表，并用无害参数验证越权调用、参数注入和返回值污染

枫桥2025/12/12...大约 6 分钟

已经理解模型文件与推理流程，并需要让分类器在扰动约束内输出错误类别的学习者。学完你能：复现模型预处理，判断白盒/黑盒攻击条件，用 FGSM/PGD 生成对抗样本，并用评分脚本验证扰动、格式和目标类别

枫桥2025/12/6...大约 6 分钟