您的位置: 首页> 开发工具

大模型底层逻辑（三）：指令遵循与系统提示词，如何给 AI 立规矩？

匿名上传

发布时间:2026-04-08 18:06:01

很多初学者有一个误区：认为大模型天生就会对话。其实不然，原始的底座模型（Base Model）只会“续写”。如果你问它“北京的首都在哪？”，它可能会接着写“上海的首都在哪？”。

它是如何变成现在这种能听懂指令、遵守规矩的 Assistant（助手） 的？

1. 从“续写机”到“执行机”：指令微调 (SFT)

为了让模型听话，科学家们喂给了它成千上万组 [Instruction, Response] 数据。

输入： “请帮我写一首关于大海的诗。”
输出： “蔚蓝的波涛...”

经过这个阶段，模型形成了一种强烈的条件反射：每当它在上下文的最前端看到特定的标记（比如 [INST] 或 <|system|>），它的注意力机制（Attention）就会进入“高度戒备”状态，优先处理这些指令。

2. 系统提示词 (System Prompt)：数字生命的“出厂设定”

在架构中，System Prompt 是所有交互的起点。它被放置在上下文的最顶端，拥有最高等级的注意力权重。

定位： 它是模型的“潜意识”和“核心宪法”。
作用： 1. 人格设定： “你是一个冷静、客观的分析师。” 2. 能力声明： “你可以调用搜索工具，但不能处理图片。” 3. 负面约束 (Rules)： “绝对不要提及竞争对手的产品。”

代码段

graph TD
    subgraph Context_Window [上下文窗口]
        SP[System Prompt: 核心规则/人格] 
        History[History: 之前的聊天内容]
        Current[User Input: 当前问题]
    end

    SP -- "最高注意力权重" --> LLM{LLM 决策层}
    History -- "背景参考" --> LLM
    Current -- "当前任务" --> LLM
    
    LLM --> Output[符合规则的回答]

    style SP fill:#ff9999,stroke:#333,stroke-width:2px