从“提示词”到“上下文”
Andrej Karpathy提出“上下文工程”是一个比“提示工程”更合适的概念。这标志着我们与AI交互的方式正在从雕琢“咒语”式的提示词,转向构建动态、丰富的“信息世界”。本应用将带您深入探索这一新兴领域。
范式转移:提示工程 vs. 上下文工程
“提示工程”关注于构造一个静态的文本字符串来引导模型,而“上下文工程”则是一门设计动态系统的学科,旨在为模型提供完成任务所需的完整信息环境。下面的图表直观地展示了二者在目标、范围和本质上的核心区别。
解构上下文:LLM的“工作内存”
一个精心设计的上下文窗口,是多种信息组件的动态组合。点击下方的卡片,了解构成LLM“思维世界”的核心要素。理解这些组件是进行上下文工程的基础。
📜 指令/系统提示
对模型行为的初始定义,包括角色、准则和任务说明。
👤 用户提示
用户提出的直接问题或任务指令。
💾 状态/历史记录
短期对话历史和长期用户偏好记忆。
📚 检索到的知识 (RAG)
从外部数据源检索的、用于锚定事实的最新信息。
🛠️ 可用的工具
模型可调用的外部函数或API的结构化描述。
📦 结构化输出
对模型响应格式的强制要求,如输出JSON。
点击上方卡片查看详细说明。
工程师的工具箱
上下文工程师使用一系列核心策略来构建和管理信息流。这些技术共同构成了这门新兴学科的实践基础。通过下方的选项卡了解这些关键技术。
产业实践:三巨头的不同路径
Google、OpenAI和Anthropic三大AI巨头正沿着不同的技术路径探索上下文工程。他们的策略分别在原始规模、工具集成和检索质量上构筑了核心竞争力。下面的雷达图展示了他们的战略侧重。
核心理念: 规模与综合。
通过巨大的上下文窗口(高达200万令牌)实现对海量信息的单次深度分析。
OpenAI
核心理念: 行动生态。
通过强大的函数调用能力和集成的RAG工具,构建具有行动能力的智能体。
Anthropic
核心理念: 精确与控制。
通过XML标签和优化的“上下文检索”等技术,实现对模型行为的精细控制。
未来展望:新角色与新范式
随着AI技术的发展,“上下文工程师”作为一个混合型新角色正在崛起。它要求从业者具备系统架构、数据工程和AI心理学等多重能力,标志着一个新软件范式的浮现。
上下文工程师画像
- 🔧数据与系统架构: 设计可扩展的数据流水线,掌握向量数据库。
- 🤖AI/LLM集成: 实现RAG、设计工具调用、组装上下文。
- 🧠领域知识转化: 将隐性业务知识转化为显性AI上下文。
- 📈实验与优化: A/B测试上下文格式,在成本、延迟和准确性间权衡。
- 🧐AI心理学与调试: 凭直觉判断上下文对AI行为的影响。
结论:新软件范式的浮现
上下文工程是构建下一代软件的核心学科。这项工作远非创建简单的“ChatGPT包装器”,而是架构一个复杂的、动态的软件层,以精心编排流入和流出大语言模型的信息。
在未来,最有价值的AI技能将不再是掌握神秘的“魔法咒语”,而是理解如何架构能够“在正确的时间访问正确信息”的智能系统。如果说提示词告诉模型*如何思考*,那么上下文工程则赋予模型*完成工作所需的知识和工具*。