找回密码
 注册
搜索
查看: 28|回复: 0

全部曝光!Claude Code意外公开,但全球Agent创新即将爆发

[复制链接]
发表于 2026-4-5 08:04 PM | 显示全部楼层 |阅读模式


全部曝光!Claude Code意外公开,但全球Agent创新即将爆发

 王煜全 全球风口
2026年4月5日 17:40
本期要点:一场意外,却会带来Agent浪潮的加速

你好,我是王煜全,这里是王煜全要闻评论。

过去三年里,很多人都有一个感觉,AI模型看起来已经很强了,可要让它连续完成更复杂的任务,结果总是差强人意。
目前,在这方面表现最好的,只有Claude,也让Anthropic成为了当前最炙手可热的公司之一。
最容易得出的解释是,其他的模型还不够强。但如果再深挖一步,会发现,也有另一种可能,那就是用模型的方法不对。
最近Claude Code的“被动”开源,或许让大家第一次有机会看到Anthropic的优势根源究竟在哪。
5.png
3月31日,有人在检查Claude Code新版本时,意外发现了一份调试文件,其中几乎保留了Claude Code完整的源代码和系统结构。具体细节,我们昨天的文章中进行了较多介绍,今天不再赘述。
有趣的是,很快,就有开发者把文件下载下来,整理和补足了代码,并将其发布到了开源社区之中。上线一天内,这些项目就获得了接近十万的关注,增长速度之快远超大多数新的开源项目。
5a.png
这说明,大家很快意识到,里面记录的内容非常重要。
因为这次泄露的,是Claude Code的一整套工程系统,包含了Anthropic过去两年一点点试出来的做法和经验。
接下来,无论是OpenAI、xAI、谷歌,还是中国的AI公司,以及无数的开发者和初创团队,都将可以参考这些方法,少走很多弯路,而这无疑将加速Agent浪潮的进程。

为何加速
首先,要指出的是,Claude Code这套成熟的工程方法被公开,就有可能让整个行业的发展节奏发生飞跃式的变化。它降低了执行复杂项目的门槛,让更多团队可以尝试已经验证的方法。
类似的事情才刚刚发生过。
今年年初,OpenClaw推动了Agent时代的到来,但这并不只是创始人Peter Steinberger一人的功劳。
他最初公开的,只是一套相对粗糙、但可运行的Agent框架。不过很快,就有无数其他开发者补充了工具链,优化了任务拆解,尝试了各种使用方法,并把不同模型接入系统,改进了上下文管理,弥补了底层架构的缺陷。
这种开放协作使得短时间内,OpenClaw生态里的项目数量和复杂度都实现了快速上升。
5b.png
这说明,当一个基础方法被公开,且有大量开发者参与其中时,就会带来创新的爆发。
Claude Code虽是“被动”开源,效果却会相似。
之前,Claude Code由于可以很好的完成复杂的开发任务,得到开发者的普遍青睐。
要知道,即便是OpenAI的Codex,写一段代码、改一个函数,和Claude Code的表现相差不大;但让它接管整个项目,比如读代码、改代码、跑测试、再根据结果继续修改,就容易出现上下文混乱、执行中断或越改越乱的问题。
Claude Code的核心创新在于构建了完整的工程化Agent框架(即Harness设计),实现了TAOR、也就是思考、行动、观察、重复的循环机制,通过确定性的工程设计最大化地解决了大语言模型的幻觉问题,从而保证了复杂操作的可靠性和可控性。
这也让Claude Code可以在设定的任务范围内自动完成读文件、修改代码、执行命令等操作,并根据执行结果调整下一步的动作。这让连续执行多轮任务成为可能,无需人工干预每一步,直到结果满足了用户的需求。
这次的代码泄露,让大家得以窥见Anthropic这一整套做法,让更多开发者和团队可以站在巨人的肩膀上快速构建自己的Agent系统,并进行试错和迭代,从而将加快整个行业的创新节奏。

影响
那这又有什么影响呢?
我们认为,对Anthropic的影响不大,因为这次泄露的文件中并不包含Claude模型的训练数据或核心算法,他们的核心竞争力并没流失。
未来最先受到冲击的,反而是像Cursor这样夹在中间的一批公司。
Claude Code的出现,本就已经让Cursor这样的编程工具岌岌可危。它们既没有自己的模型,也缺少明显的垂直场景壁垒,本质上是在把模型接入开发流程,依靠先发优势和工程经验留住用户。
可是,祸不单行,这次代码的泄露,会导致大量模仿Claude Code的项目出现。AI编程将不再是几家大公司的天下,Cursor的竞争对手将大量涌现。
不过,对于头部模型公司来说,这次泄露事件却可能是个利好。
OpenAI、xAI以及谷歌一直在努力提高模型在复杂任务下的表现,可是效果一直不如Anthropic。
现在,他们可以参考Claude Code的工程方法,快速追平差距。到时候,如果编程表现还是不行,可能就真的是模型性能不如人了。
但我们更想强调的是,类似的,中国也迎来了一个关键的窗口期。
过去,人们常说中国模型与美国相比,大约差6个月。看似时间不长,但也导致我们的模型难以进入开发者的工作流中,出现一步慢、步步慢的尴尬局面。
同样是Claude Code,配合Claude模型,可以完成复杂项目;但如果换成国内的模型,比如Kimi、GLM,虽然价格便宜了,也能应付一些基础任务,但在复杂开发场景下表现明显就不行了。
可在以前,大家很难判断,差距是模型能力不足,还是方法不当。
现在不同了,Claude Code工程方法的各个关键环节已经一目了然,中国企业终于可以客观评估本土模型与Claude之间的差距。
一方面,可能要不了多久,大家就会发现,很多所谓模型能力的差距,其实源于工程能力的差距。一旦方法补齐,实际体验的差距可能迅速缩小。
另一方面,即便模型能力有所不足,我们也有望基于自己的模型特性,进行针对性的工程优化和架构调整。只要方法对了,也有望在较短时间内逼近一线体验。
而且,不仅是编程领域,从电商、金融到工业自动化,中国在每个行业都有大量垂直应用场景。
模型能力和工程能力提升后,企业将有望针对各类场景构建Agent产品,通过快速迭代、并行试错和工具链优化,将模型能力转换为可交付的应用体验。
换句话说,我们有机会用“80%的模型能力”,结合“100%的工程执行力”,以低得多的价格提供接近一线的用户体验,从而在这轮AI应用化的新发展阶段中占据先机。
所以,估计这个假期,我们的开发者们都在忙着加班吧?也欢迎在评论区分享你的近况。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|www.hutong9.net

GMT-5, 2026-6-29 10:54 AM , Processed in 0.107122 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表