2025年11月5日,杨立昆博士在伦敦圣詹姆斯宫出席2025年度伊丽莎白女王工程奖招待会。图片来源:Yui Mok / Pool—Getty Images
据《金融时报》援引知情人士消息,AI圈知名大佬杨立昆已告知同事,再过几个月他就要离开Meta公司,创办自己的公司了。杨立昆是图灵奖得主,也是AI领域的顶尖研究者。他致力于打造自己眼中的下一代AI系统。但是他的离职,也必定会成为Meta公司乃至整个AI行业的一个重要转折点。
杨立昆今年65岁,他于2013年12月加入Facebook,担任基础AI研究室(FAIR)创始主任。他从2003年起在纽约大学任教,目前仍担任该校的银级教授。
杨立昆的学术成就十分傲人。最为人熟知的,就是他在上世纪80年代末研发出了卷积神经网络,特别是他开发的LeNet架构能够成功识别手写字体,掀起了一场计算机视觉领域的革命。2019 年,他与杰弗里・辛顿、约书亚・本吉奥三人因在深度学习领域的突破性贡献而被授予图灵奖。而正是这三人在理论上的奠基,才使深度神经网络成为当代计算机科学的一项核心技术。
杨立昆1960年7月8日出生在法国的苏瓦西苏蒙莫朗西。他父亲是一名工程师,因而他从小就对电子设备产生了兴趣。后来他考入了巴黎高等电子与电工技术工程师学院(ESIEE Paris),于1983年获得电气工程文凭。随后他在巴黎第六大学攻读计算机科学博士学位,1987年发表了一篇关于连接学习机制的博士论文,他在论文中提到了一种早期形式的利用反向传播算法训练神经网络的方法。
不过在那个时代,搞神经网络还被认为是一个不切实际的任务。博士毕业后,杨立昆在多伦多大学与杰弗里・辛顿共事,进行了一年博士后研究,然后于1988年加入了AT&T公司的贝尔实验室。正是在那里,他研发出了卷积神经网络——这一突破性技术能让计算机能够以模拟人类视觉的方式处理图像信息。他的手写数字识别系统效果显著,美国国家现金出纳机公司(NCR)从90 年代中期开始,将该技术应用于银行支票读取机,最高峰时期处理了全美国10%至20%的支票。
杨立昆还主持研发了DjVu图像压缩技术,该技术让互联网档案馆等数字图书馆能够在线分发扫描文档。之后,他曾在NEC研究所短暂任职,后加入纽约大学。
目前,Meta公司正在试图对其AI战略进行全面调整。今年6月份,Meta向数据标注公司Scale AI投资143亿美元,并聘请该公司CEO、28岁的美籍华人汪滔领导该公司新成立的部门“Meta超级智能实验室”。这次重组对杨立昆本人也有一些影响,他之前要向Meta的首席产品官克里斯・考克斯汇报工作,现在却要向汪滔汇报工作了。
这次结构调整,也反映出了Meta公司内部更深层的战略分歧。目前,Meta的Llama 4模型未达预期,Meta在AI上整体落后于OpenAI和谷歌等竞争对手,在此背景下,Meta的老板马克・扎克伯格倾向于加快部署大语言模型和AI产品,而杨立昆之前曾公开表示,他对大语言模型持怀疑态度,因为他认为大语言模型永远无法达到人类级别的推理和规划能力。
据《金融时报》报道,杨立昆的创业计划还初在洽谈融资的初期阶段。他的新公司主要聚焦于他所谓的“世界模型”——这种模型是通过学习视频和空间数据,来对环境产生内在理解,而非单纯依赖文本数据。他此前经表示,这种系统旨在模拟因果场景并预测结果,但它可能需要十年左右的时间才能成熟。
Meta的战略转型也并不是一帆风顺的。今年早些时候,Meta的多名前员工曾对《财富》透露,由于公司资源向商用AI倾斜,导致长期研究受到忽视,FAIR实验室现在实际上已处在一种半死不活的状态。Llama模型原始研究论文的作者有超过一半在论文发表后数月内离开了Meta。今年10月份,Meta裁撤了AI部门的大约600个岗位。因此,尽管杨立昆的离职是一项重大人事变动,但它也突显了行业内的一个核心分歧——在当下的AI行业中,不同产品的竞争日趋激烈,而究竟哪条路才能达到最终所谓的“通用型人工智能”(AGI),AI研究者在其中又应扮演什么样的角色,人们的看法是存在明显差异的。(财富中文网)
译者:朴成奎