全部曝光！Claude Code意外公开，但全球Agent创新即将爆发

源济 · 发表于 2026-4-5 08:04 PM

原创王煜全全球风口

2026年4月5日 17:40

本期要点：一场意外，却会带来Agent浪潮的加速

你好，我是王煜全，这里是王煜全要闻评论。

过去三年里，很多人都有一个感觉，AI模型看起来已经很强了，可要让它连续完成更复杂的任务，结果总是差强人意。

目前，在这方面表现最好的，只有Claude，也让Anthropic成为了当前最炙手可热的公司之一。

最容易得出的解释是，其他的模型还不够强。但如果再深挖一步，会发现，也有另一种可能，那就是用模型的方法不对。

最近Claude Code的“被动”开源，或许让大家第一次有机会看到Anthropic的优势根源究竟在哪。

3月31日，有人在检查Claude Code新版本时，意外发现了一份调试文件，其中几乎保留了Claude Code完整的源代码和系统结构。具体细节，我们昨天的文章中进行了较多介绍，今天不再赘述。

有趣的是，很快，就有开发者把文件下载下来，整理和补足了代码，并将其发布到了开源社区之中。上线一天内，这些项目就获得了接近十万的关注，增长速度之快远超大多数新的开源项目。

这说明，大家很快意识到，里面记录的内容非常重要。

因为这次泄露的，是Claude Code的一整套工程系统，包含了Anthropic过去两年一点点试出来的做法和经验。

接下来，无论是OpenAI、xAI、谷歌，还是中国的AI公司，以及无数的开发者和初创团队，都将可以参考这些方法，少走很多弯路，而这无疑将加速Agent浪潮的进程。

为何加速

首先，要指出的是，Claude Code这套成熟的工程方法被公开，就有可能让整个行业的发展节奏发生飞跃式的变化。它降低了执行复杂项目的门槛，让更多团队可以尝试已经验证的方法。

类似的事情才刚刚发生过。

今年年初，OpenClaw推动了Agent时代的到来，但这并不只是创始人Peter Steinberger一人的功劳。

他最初公开的，只是一套相对粗糙、但可运行的Agent框架。不过很快，就有无数其他开发者补充了工具链，优化了任务拆解，尝试了各种使用方法，并把不同模型接入系统，改进了上下文管理，弥补了底层架构的缺陷。

这种开放协作使得短时间内，OpenClaw生态里的项目数量和复杂度都实现了快速上升。

这说明，当一个基础方法被公开，且有大量开发者参与其中时，就会带来创新的爆发。

Claude Code虽是“被动”开源，效果却会相似。

之前，Claude Code由于可以很好的完成复杂的开发任务，得到开发者的普遍青睐。

要知道，即便是OpenAI的Codex，写一段代码、改一个函数，和Claude Code的表现相差不大；但让它接管整个项目，比如读代码、改代码、跑测试、再根据结果继续修改，就容易出现上下文混乱、执行中断或越改越乱的问题。

Claude Code的核心创新在于构建了完整的工程化Agent框架（即Harness设计），实现了TAOR、也就是思考、行动、观察、重复的循环机制，通过确定性的工程设计最大化地解决了大语言模型的幻觉问题，从而保证了复杂操作的可靠性和可控性。

这也让Claude Code可以在设定的任务范围内自动完成读文件、修改代码、执行命令等操作，并根据执行结果调整下一步的动作。这让连续执行多轮任务成为可能，无需人工干预每一步，直到结果满足了用户的需求。

这次的代码泄露，让大家得以窥见Anthropic这一整套做法，让更多开发者和团队可以站在巨人的肩膀上快速构建自己的Agent系统，并进行试错和迭代，从而将加快整个行业的创新节奏。

影响

那这又有什么影响呢？

我们认为，对Anthropic的影响不大，因为这次泄露的文件中并不包含Claude模型的训练数据或核心算法，他们的核心竞争力并没流失。

未来最先受到冲击的，反而是像Cursor这样夹在中间的一批公司。

Claude Code的出现，本就已经让Cursor这样的编程工具岌岌可危。它们既没有自己的模型，也缺少明显的垂直场景壁垒，本质上是在把模型接入开发流程，依靠先发优势和工程经验留住用户。

可是，祸不单行，这次代码的泄露，会导致大量模仿Claude Code的项目出现。AI编程将不再是几家大公司的天下，Cursor的竞争对手将大量涌现。

不过，对于头部模型公司来说，这次泄露事件却可能是个利好。

OpenAI、xAI以及谷歌一直在努力提高模型在复杂任务下的表现，可是效果一直不如Anthropic。

现在，他们可以参考Claude Code的工程方法，快速追平差距。到时候，如果编程表现还是不行，可能就真的是模型性能不如人了。

但我们更想强调的是，类似的，中国也迎来了一个关键的窗口期。

过去，人们常说中国模型与美国相比，大约差6个月。看似时间不长，但也导致我们的模型难以进入开发者的工作流中，出现一步慢、步步慢的尴尬局面。

同样是Claude Code，配合Claude模型，可以完成复杂项目；但如果换成国内的模型，比如Kimi、GLM，虽然价格便宜了，也能应付一些基础任务，但在复杂开发场景下表现明显就不行了。

可在以前，大家很难判断，差距是模型能力不足，还是方法不当。

现在不同了，Claude Code工程方法的各个关键环节已经一目了然，中国企业终于可以客观评估本土模型与Claude之间的差距。

一方面，可能要不了多久，大家就会发现，很多所谓模型能力的差距，其实源于工程能力的差距。一旦方法补齐，实际体验的差距可能迅速缩小。

另一方面，即便模型能力有所不足，我们也有望基于自己的模型特性，进行针对性的工程优化和架构调整。只要方法对了，也有望在较短时间内逼近一线体验。

而且，不仅是编程领域，从电商、金融到工业自动化，中国在每个行业都有大量垂直应用场景。

模型能力和工程能力提升后，企业将有望针对各类场景构建Agent产品，通过快速迭代、并行试错和工具链优化，将模型能力转换为可交付的应用体验。

换句话说，我们有机会用“80%的模型能力”，结合“100%的工程执行力”，以低得多的价格提供接近一线的用户体验，从而在这轮AI应用化的新发展阶段中占据先机。

所以，估计这个假期，我们的开发者们都在忙着加班吧？也欢迎在评论区分享你的近况。

		自动登录	找回密码
密码			注册