核心指标
内容导航
本文系统梳理了 Anthropic 工程团队在为 AI 智能体打造工具时的实战心得。围绕"工具应该如何为智能体而设计",阐述了构建高效 MCP 工具的全过程。
核心结论:只有将工具体验紧密围绕智能体的行为模式和非确定性特性来定制,才能真正释放 AI 智能体解决复杂真实任务的潜力。
1 认知升级:工具的新定义与设计范式
传统思维
- • 确定性系统设计
- • 为程序员编写 API
- • 固定格式输出
- • 相同输入必然输出
新范式
- • 为智能体量身定制
- • 拓展智能体任务边界
- • 顺应人类直觉
- • 拥抱非确定性响应
核心洞察
AI 智能体代表着高度非确定性的系统。工程师要抛弃"只为程序员或其他系统编写 API"的惯性思维,转向"为智能体量身定制",承认和利用智能体可能产生多样化响应的本质。
2 从原型到优化:全流程实践
原型开发
- • 快速搭建本地 MCP 服务器或桌面扩展原型
- • 用 Claude Code 等 AI 辅助工具连接验证
- • 文档必须对 LLM 友好,组织成 llms.txt 文件
- • 用真实用户场景测试,捕捉"顺手"与"别扭"之处
体系化评估
- • 生成大量贴近真实业务的数据任务
- • 任务要具备复杂度(多步交互)
- • 基于 API、循环调用等自动化流程批量评估
- • 系统提示中要求输出推理思维链
智能协作
- • 智能体批量分析原始交互记录
- • 自动发现工具定义中的问题
- • 多维追踪指标(精准率、耗时、token 消耗)
- • 持续"迭代-测试-调整"循环优化
3 编写高效 MCP 工具的核心原则
工具选择精细化
不求多但求准
- • 避免"泛用型大杂烩",与高价值场景深度耦合
- • 优先按关键词检索的 search_contact,而非返回所有联系人
- • 复杂业务场景整合多步操作为"复合型"工具
命名空间策略
明确功能边界
- • 按业务线、功能系统分类
- • 统一前缀/后缀命名(asana_search、jira_search)
- • 避免功能重叠、边界模糊
返回信息优化
只给智能体"高价值"内容
- • 放弃 uuid、256px_image_url 等晦涩字段
- • 优先返回 name、image_url、file_type 自然语言资源
- • 利用 response_format 枚举满足不同详细需求
上下文管理
严格分段与引导策略
- • 加分页、范围、过滤和默认参数
- • 设置上限防 token 过载
- • 返回"能被理解和修复的错误"
- • 引导智能体多步精确而非大范围抓取