本文适合
已经理解 Prompt、上下文与注入 和 模型文件与推理流程 的 AI 安全学习者。学完你能:解释 tokenizer 如何影响输入边界、过滤绕过、长度限制和模型行为,并用最小脚本验证 token、Unicode、截断和特殊标记差异
本文适合
已经理解 Prompt、上下文与注入 和 模型文件与推理流程 的 AI 安全学习者。学完你能:解释 tokenizer 如何影响输入边界、过滤绕过、长度限制和模型行为,并用最小脚本验证 token、Unicode、截断和特殊标记差异
本文适合
已经理解 Prompt、上下文与注入,并遇到“模型会读文档、网页、邮件、知识库”的学习者。学完你能:画出 RAG 的检索链路,构造恶意文档验证间接注入,并判断风险来自检索命中、上下文拼接、来源隔离还是输出/工具联动
本文适合
刚进入 AI 安全题、已经能用 HTTP/API 与模型交互的学习者。学完你能:把一次 LLM 回答拆成系统提示、用户输入、历史、检索材料和工具结果,并用可复现 prompt 验证直接注入、上下文泄露和指令优先级混淆
只要不可信输入能改变模型原本应该遵守的任务、边界或输出格式,就要按 Prompt 注入题处理。
Prompt 注入不是“语气强硬地命令模型”,而是验证用户输入、外部资料或历史上下文是否越过了本该存在的指令边界。
本文适合
已经理解 模型文件与推理流程,并拿到 adapter、LoRA 权重、微调目录或 HuggingFace 模型目录的学习者。学完你能:识别 LoRA/Adapter 文件结构,验证增量权重影响了哪些层,并用触发词对照实验判断后门、行为偏移或权重篡改是否存在
本文适合
已经理解 AI安全题的系统边界、工具调用安全 和 RAG与间接注入 的学习者。学完你能:把 Agent 任务拆成输入、检索、计划、工具、观察、记忆和输出,逐步标注信任边界并构造可复现的长链路攻击测试
本文适合
拿到 .pt、.pth、.onnx、.safetensors、config.json、tokenizer.json 或推理脚本的 AI 安全学习者。学完你能:安全识别模型文件类型,复现输入预处理到输出后处理的最小推理闭环,并判断后续应转向对抗样本、模型抽取、反演、成员推断还是 LoRA 分析