访谈摘要

Claude 正在学习自我构建

在本期 Superhuman AI 播客中,我们与 Anthropic 产品负责人 Michael Gerstenhaber 进行了深度对话。本次访谈揭示了 AI 模型如何在短短一年内发生惊人演变,探讨了编码为何成为衡量 AI 进步的终极基准,并展望了代理式 AI 的未来。

AI 进化之速

Michael 强调,AI 模型的进化速度超乎想象。仅在过去一年半,自 Claude 3 推出以来,模型的表现已发生戏剧性变化。他预测,随着研究的深入,模型的进步速度将“越来越快”。

模型能力迭代

从 Claude 3 到 4.0,模型在短短数月内就发生了显著变化,迭代速度令人震撼,预示着 AI 领域将继续以指数级的速度发展。

经济价值加速

模型的经济价值随着其能力的提升而加速。一年前 AI 仅能辅助代码补全,现在已能自主完成数小时的复杂编码任务,创造的价值呈非线性增长。

编码:AI 的终极试金石

编码成为衡量 AI 进步的核心基准,并非偶然。这背后有多重原因,共同构成了其不可替代的地位。

易于评估和迭代

代码的输出质量相对容易通过运行测试来客观评估,这使得 AI 在编码领域的迭代和部署速度远超医疗、法律等需要专家人工审核的领域。

跨领域普适性

软件开发是所有现代行业的基础。从金融到医疗,几乎所有公司都需要软件。编码能力的提升,意味着 AI 能为各行各业带来效率革命。

代理式进化:从指令到意图

Claude 正在从一个被动执行指令的工具,进化为一个能理解用户意图、自主规划并完成复杂任务的智能代理。这种“代理循环”是其能力飞跃的核心。

🎯

1. 目标设定

用户分配任务

🧠

2. 自主规划

模型生成步骤

⚙️

3. 执行与修正

编码、测试、debug

🏆

4. 任务完成

交付高质量结果

Claude 目前已能自主编码长达 7小时,展现了惊人的任务持续性和复杂问题解决能力。

不止编码:卓越的写作能力

尽管 Anthropic 强调编码能力,但 Claude 在写作和内容创作方面同样出色。这得益于其内部专门负责塑造 Claude “性格”的团队。Michael 分享了 Claude 帮助团队成员生成爆款社交媒体帖子,以及让一位畅销书作家对其研究和编辑能力感到“不可思议”的案例。

一个在写作方面表现出色的模型,也意味着它更擅长理解用户的意图,并帮助用户更好地表达。这对于非技术背景的创业者而言,其价值不亚于最好的编码模型。

模型 vs. 应用:价值捕获之辩

对于“模型层将商品化,价值将流向应用层”的观点,Michael 持保留意见。

驳斥“包装器”论

将应用层公司称为模型的“包装器”是极其不恰当的。这些公司利用其深厚的领域知识、独有数据和业务流程,结合模型的通用智能,创造了模型本身无法独立实现的独特价值。

模型智能远未商品化

模型智能仍在快速发展,远未达到商品化阶段。他强调,“我们才刚刚开始”,模型的差异化和进化速度仍在不断加快,未来发展空间巨大。

与 AI 互动的新范式

与 Claude 互动的方式正在演进,从简单的指令到复杂的协作,催生了新的工具和方法论。

模型选择:Opus vs. Sonnet

最强大的模型,擅长推理、内省和自主完成复杂任务。适合需要长时间运行、复杂逻辑规划的代理式场景,如同一个能自主工作的“实习生”。

模型上下文协议 (MCP):AI 的 USB-C

MCP 允许模型安全地访问外部的、特定于领域的数据,解决了 AI 应用中的一个核心问题。目前已有超过3000个 MCP 集成,极大地促进了生态系统的发展。

Asana, Jira...
MCP
Claude AI

未来展望与给开发者的建议

目标导向的 AI

未来 AI 的发展将更加“目标导向”。用户只需表达意图,AI 就能自主规划和执行,大大降低使用门槛。

给开发者的建议

紧跟技术前沿:立即开始使用 AI 工具,亲身体验其进展。
以客户为中心:始终从客户价值出发,技术是实现手段。
拥抱新工具:积极学习和使用生态中涌现的新工具。