Claude 正在学习自我构建
在本期 Superhuman AI 播客中,我们与 Anthropic 产品负责人 Michael Gerstenhaber 进行了深度对话。本次访谈揭示了 AI 模型如何在短短一年内发生惊人演变,探讨了编码为何成为衡量 AI 进步的终极基准,并展望了代理式 AI 的未来。
AI 进化之速
Michael 强调,AI 模型的进化速度超乎想象。仅在过去一年半,自 Claude 3 推出以来,模型的表现已发生戏剧性变化。他预测,随着研究的深入,模型的进步速度将“越来越快”。
模型能力迭代
从 Claude 3 到 4.0,模型在短短数月内就发生了显著变化,迭代速度令人震撼,预示着 AI 领域将继续以指数级的速度发展。
经济价值加速
模型的经济价值随着其能力的提升而加速。一年前 AI 仅能辅助代码补全,现在已能自主完成数小时的复杂编码任务,创造的价值呈非线性增长。
编码:AI 的终极试金石
编码成为衡量 AI 进步的核心基准,并非偶然。这背后有多重原因,共同构成了其不可替代的地位。
易于评估和迭代
代码的输出质量相对容易通过运行测试来客观评估,这使得 AI 在编码领域的迭代和部署速度远超医疗、法律等需要专家人工审核的领域。
跨领域普适性
软件开发是所有现代行业的基础。从金融到医疗,几乎所有公司都需要软件。编码能力的提升,意味着 AI 能为各行各业带来效率革命。
代理式进化:从指令到意图
Claude 正在从一个被动执行指令的工具,进化为一个能理解用户意图、自主规划并完成复杂任务的智能代理。这种“代理循环”是其能力飞跃的核心。
1. 目标设定
用户分配任务
2. 自主规划
模型生成步骤
3. 执行与修正
编码、测试、debug
4. 任务完成
交付高质量结果
Claude 目前已能自主编码长达 7小时,展现了惊人的任务持续性和复杂问题解决能力。
不止编码:卓越的写作能力
尽管 Anthropic 强调编码能力,但 Claude 在写作和内容创作方面同样出色。这得益于其内部专门负责塑造 Claude “性格”的团队。Michael 分享了 Claude 帮助团队成员生成爆款社交媒体帖子,以及让一位畅销书作家对其研究和编辑能力感到“不可思议”的案例。
一个在写作方面表现出色的模型,也意味着它更擅长理解用户的意图,并帮助用户更好地表达。这对于非技术背景的创业者而言,其价值不亚于最好的编码模型。
模型 vs. 应用:价值捕获之辩
对于“模型层将商品化,价值将流向应用层”的观点,Michael 持保留意见。
驳斥“包装器”论
将应用层公司称为模型的“包装器”是极其不恰当的。这些公司利用其深厚的领域知识、独有数据和业务流程,结合模型的通用智能,创造了模型本身无法独立实现的独特价值。
模型智能远未商品化
模型智能仍在快速发展,远未达到商品化阶段。他强调,“我们才刚刚开始”,模型的差异化和进化速度仍在不断加快,未来发展空间巨大。
与 AI 互动的新范式
与 Claude 互动的方式正在演进,从简单的指令到复杂的协作,催生了新的工具和方法论。
模型选择:Opus vs. Sonnet
最强大的模型,擅长推理、内省和自主完成复杂任务。适合需要长时间运行、复杂逻辑规划的代理式场景,如同一个能自主工作的“实习生”。
在快速回答问题和思考后给出答案方面表现优秀。适合需要快速响应、成本效益更高的交互场景。
模型上下文协议 (MCP):AI 的 USB-C
MCP 允许模型安全地访问外部的、特定于领域的数据,解决了 AI 应用中的一个核心问题。目前已有超过3000个 MCP 集成,极大地促进了生态系统的发展。
未来展望与给开发者的建议
目标导向的 AI
未来 AI 的发展将更加“目标导向”。用户只需表达意图,AI 就能自主规划和执行,大大降低使用门槛。
给开发者的建议
紧跟技术前沿:立即开始使用 AI 工具,亲身体验其进展。
以客户为中心:始终从客户价值出发,技术是实现手段。
拥抱新工具:积极学习和使用生态中涌现的新工具。