事情是这样的。
5月19日晚上11点,安德烈·卡帕西(Andrej Karpathy)在X上发了四句话,AI圈直接炸了。
他说,我加入了Anthropic。
就四句话。没有铺垫,没有仪式感,甚至连个感叹号都没加。半小时不到,这条帖子浏览量冲到300万。
我是后来看到的,当时其实已经睡了。醒来刷手机看到这条,第一反应是。卧槽。
不是因为觉得Anthropic赚了,而是因为,这个人,他选的路,每次都踩在关键节点上。
先说一下他是谁,免得有朋友不太熟。
安德烈·卡帕西。斯洛伐克出生,15岁移民加拿大。本科多大,博士斯坦福,博士导师是李飞飞。
这几个名字串在一起,你大概能感受到这棵学术树的密度。
更大的密度在后面。2015年,他是OpenAI创始研究科学家。2017年,马斯克把他挖去特斯拉,做自动驾驶AI高级总监。2022年离开特斯拉,回来搞教育,YouTube开了一个频道叫Neural Networks: Zero to Hero,现在破百万订阅。
2023年,他回OpenAI。2024年,他又走了,自己搞了个AI教育公司Eureka Labs。
然后就是5月19号这条深夜四行短帖。
Vibe Coding这个词,也是他今年2月在X上造出来的。后来被柯林斯词典选成年度词汇。一个词能定义一个行业现象,这本事,我目前只在他身上见过。
我有时候会想,一个OpenAI的联合创始人,特斯拉的AI老大,干啥不好要去给Dario Amodei当二把手。
这是新智元那篇文章的原话,二把手。说实话,这个问法有点刺耳,但确实问到了很多人心里。
Anthropic现在谁在管事,Dario Amodei。OpenAI出来的人,跟Sam Altman之争的故事不在今天展开。但Karpathy去Anthropic,相当于一个拿过NBA总冠军的首发前锋,跑去隔壁球队当第六人。
你可能会说,人家想回来做研究不行吗。
行,当然行。但这个选择背后的信号,我觉得比他本人加不加入重要得多。
说回Anthropic这边,给他安排的位置很有意思。
预训练团队。
预训练是什么。就是你在大模型出来之前,拿几十亿美金烧一大堆GPU,把模型从零训到能聊天的那个阶段。这是整个大模型食物链的最顶端,也是最烧钱、最吃工程经验和理论直觉的地方。
而且他不是进去当一个普通研究员。他要组建一个新团队,专门研究怎么用Claude来加速预训练研究本身。
这个想法Karpathy之前就玩过,今年3月他做过一个实验,让AI编程智能体在无监督的情况下跑了两天,自己做了700次实验,发现了20个优化点。他把这个方法叫autoresearch。
当时他发出来,我自己试着复现了一下,你知道结果是什么吗。我复现不出来。不是代码不会跑,是我根本没有那个直觉去判断哪些实验方向值得让它自己跑。
这就是Karpathy的恐怖之处。他的价值不在于写了多少代码,而在于他能把「怎么去做研究」这件事,变成一种可以传递给AI的结构化直觉。
现在Anthropic让他把这件事系统化。
然后我看到了一个我觉得特别值得玩的细节。
过去三年,OpenAI往Anthropic单向输送了三个人。
2024年5月,前对齐负责人Jan Leike走了,去了Anthropic。
2024年8月,联合创始人John Schulman走了,也去了Anthropic。
2026年5月,Karpathy走了,还是去了Anthropic。
三个都是OpenAI最核心层的人。一个对齐,一个训练架构,一个现在把预训练也带过去了。而你几乎找不到一个反向的案例,一个Anthropic的人跑去OpenAI。
你要说OpenAI不好吗。当然不是。GPT-4o、o3、Sora 2.0,哪一个不是炸裂级别的产品。但Karpathy在帖子里写的那句话,我觉得值得认真读一下。
他说,我认为未来几年大语言模型的前沿发展将尤为重要。
他没有说OpenAI不重要。他只是觉得,前沿最激烈的战场,现在在别的地方。
再说一个我自己觉得挺微妙的事。
Anthropic现在的估值,二级市场已经跑到OpenAI上面去了,超过1万亿美元。他们正在谈一轮300亿美元的融资,估值约9000亿。Polymarket上那些交易者对Anthropic在6月底前拥有最佳AI模型的概率定价是65%,OpenAI只有4%。
这些数字当然不是真理。但聪明钱历来都是用脚投票的。
我再翻译一下大白话。顶尖研究者用脚投票的时候,他们看的不只是当下的模型能力,而是「接下来三年,我能不能在这里做我最想做的事」。
Karpathy想做的事很明确。用AI来加速AI研究。这件事在Anthropic能做成,在OpenAI能不能。他自己给出了答案。
顺着上面的再聊聊,这个选择对普通人有啥影响。
可能你会说,大佬跳槽,关我啥事。
我试着回答一下。
Vibe Coding这个词,是Karpathy今年2月造出来的。然后过去三个月,全世界有几十万人开始用自然语言写应用。Vibe Coding的本质是什么。是把编程这件事的门槛,从「你要学语法、学框架、学部署」降到了「你只要能说清楚你想要什么」。
但门槛降低的同时,另一种东西的门槛反而升高了。就是「判断力」。
以前你要写一个应用,你得懂代码,懂架构,懂安全。现在AI帮你写,你反而不知道它写出来的东西安不安全、架构合不合理、会不会哪天突然崩掉。
安全公司RedAccess上个月出了一份报告,说他们用简单搜索就找到了5000多个用Vibe Coding做出来的应用,完全没有身份验证,数据直接裸奔。其中有2000多个,真实用户数据已经在泄露了。。。
38万个AI生成的应用被搜索引擎收录,其中40%有某种程度的安全问题。
这个事情我跟几个做安全的朋友聊过,人家的反应是。这玩意迟早要出大事。
再绕回来,Karpathy去Anthropic,跟这件事有关系吗。
有。而且关系很大。
因为预训练团队决定了下一代模型「默认会什么」。如果下一代Claude在预训练阶段就被喂了大量高质量代码和安全最佳实践,它生成的代码自然会更安全。如果它学到的「什么是好代码」的标准更高,那普通人用Vibe Coding做出来的东西,天然就更不容易裸奔。
听起来有点玄学是吧。但这就是基础模型的本质。你在预训练阶段塞进去的东西,决定了模型「直觉」的水平。
我在之前的文章里写过,AI正在从「回答问题」变成「完成任务」。这个跃迁最可怕的地方在于,当AI自己会写代码、自己会做实验、自己会优化自己的时候,整个迭代速度就不是人类研究者的节奏了。
Karpathy去Anthropic干的就是这件事。让Claude帮人类把Claude做得更好。
这话听着眼熟不。对,就是那个传说中的递归自我改进。以前大家觉得这是科幻,现在Karpathy亲自去把它变成工程问题了。
我自己有时候会被这种想法震住。
你想想看。一个人,15岁移民,博士跟着李飞飞做计算机视觉,参与创立OpenAI,去特斯拉把自动驾驶纯视觉方案推到量产,回来做教育让百万普通人看懂神经网络,然后造了一个词(Vibe Coding)定义了整个行业的编程范式转移,现在又去Anthropic研究怎么让AI改进AI。
这条人生弧线,我已经找不到合适的形容词了。
但让我觉得最有意思的是他帖子里的最后一句话。
「我依然对教育事业充满热忱,计划适时恢复相关工作的推进。」
也就是说,他加入Anthropic做预训练研究的同时,没打算放弃教育。YouTube那个百万订阅的频道,大概率还会更新。
这玩意有啥实际影响。说直接点,全世界学AI的人,以后学的不只是「怎么用AI」,还有「怎么理解Anthropic做出来的这些模型到底是怎么想的」。
这话有点绕,我翻译一下。
以后你要真正理解Claude为什么这么做、为什么这么回答,大概率要去看作者的YouTube,或者读他写的代码。
这点我觉得才是最值钱的。顶级研究者亲自出来做教育,说到底是在帮整个社会建立「理解AI的心智模型」。这个东西一旦建立起来,就很难被取代。
最后说一个让我今天想了比较久的细节。
X上有个网友评论Karpathy的跳槽,说了一句话。Anthropic正在变成2000年代中期皇家马德里,把所有AI传奇人物和CTO都招进来。
皇马那个年代,菲戈来了,齐达内来了,罗纳尔多来了,贝克汉姆也来了。然后他们拿了很多冠军。
但皇马的故事同时也告诉我另一件事。堆砌巨星不等于赢。更衣室的化学反应、战术体系的适配,更关键的是,有没有一个人能把所有人的能量拧成一股绳。
Anthropic现在有了Karpathy,有了Jan Leike,有了John Schulman。理论、对齐、预训练,三条线都有了。Dario能不能把这三股绳拧起来,接下来两三年见分晓。
说真的,这个局我已经看得津津有味了。不是作为观众,是作为这个行业里一个认真想搞懂发生了什么的人。
回到标题那句话。他,选择了Dario。
三年前,这件事看起来像是「二把手」。三年后回头看,这可能是「选择了未来」。
时间。流逝的本身。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。
/ 作者:Wyat / 投稿或爆料,请联系邮箱:wyat.sun@qq.com
