|
2019年,还在北京大学读研二的罗福莉,忽然“火”了。 这一年,罗福莉在自然语言处理领域的顶级国际会议ACL(后文简称“ACL”)上发表了8篇论文,其中2篇为第一作者。 ACL在业内含金量极高,不仅吸引了全球NLP(即自然语言处理)领域的顶尖专家,还被誉为“NLP界奥斯卡”,论文录取率常年低于25%。
ACL2019顶会
“8篇”这个数字像一束强光,瞬间将罗福莉推到了舆论的中心。 知乎上出现了大量相关热门话题,惊叹、好奇、质疑的声音交织,“天才AI少女”的称号落在了罗福莉身上。 面对突如其来的关注,罗福莉在知乎发文下场“辟谣”,她只是向ACL投了一长一短两篇论文,其他论文“只是部分参与了实验室同学的研究”。 在后来的采访中,罗福莉谈及这段经历,在她看来2019年正逢AI论文集中爆发的时代,自己只是“恰好被关注到了”。对她而言,这更像是研究进入正轨后的集中的“爆发”。
罗福莉 这种高强度的产出能力,绝非凭空而来。 在北大读研的日子里,她的生活被高度简化,固化在清晰的“两点一线”上。从宿舍到图书馆,她将大部分时间和心力都交付给了数据和算法,深埋于学术研究中。 2021年,罗福莉在阿里达摩院的专访中提起自己赶论文的经历。 为了赶论文进度,她腊月二十九才回家,短暂放假后,大年初五又独自登上返回北京的列车。在弥漫着团圆氛围的春节,她的世界只有书桌和屏幕前闪烁的代码,元宵节那晚,她终于将论文投出,宿舍外烟花绽放,躺在寝室的床上,罗福莉“眼泪哗哗往下流”。 后来,她将那个夜晚视为一个重要的“触点”,她清晰地看到了自己能抵达的边界,以及内心深处对自然语言处理领域真正的兴趣。
罗福莉参加ACL顶会
凭借这份热忱与扎实的学术成果,硕士毕业时,罗福莉已然达到了博士毕业标准。 此时的她有两条路,一条路是继续走学术路线,进入计算机科学“四大”(卡内基梅隆大学、麻省理工学院、斯坦福大学和加州大学伯克利分校)深造读博,另一条路则是在手握的多家顶级大厂offer中选一个,直接工作。 “既然已经具备了博士毕业的学术水平,那就在最好的年纪去做一些不一样的事情”,罗福莉想知道什么才是有落地价值的学术研究。 2019年,罗福莉放弃攻读博士,以“阿里星”的身份加入了阿里巴巴达摩院。 阿里星项目是阿里巴巴集团为招聘全球顶尖高校毕业生设计的高潜力人才计划,类似于华为的“天才少年”计划,能通过阿里星项目进入阿里的校招生百里挑一。
在阿里时的罗福莉
即便优秀如罗福莉,从学术象牙塔到庞大工业体系的转变,也很难一帆风顺。 初入达摩院,罗福莉身处需要对接多方业务的中台部门,她被大量繁杂事务包围,一度感到在技术深度上难以着力。 罗福莉花了半年时间调整节奏,学会了“做减法”,专注于她认为“难而正确”的长期方向,并开始负责阿里深度语言模型体系的开源,主导开发AI预训练模型VECO。 罗福莉所负责的业务,为阿里巴巴的跨境电商业务带来数亿美元的价值,后来她总结这段经历,“阿里一年,人间十年”。
罗福莉
三年后,罗福莉的职业生涯迎来了一次关键的转向。 她加入DeepSeek母公司幻方量化,从事深度学习相关策略建模和算法研究。当时这家初创公司连官网都没有,但她看中的是幻方量化“能用算法颠覆行业规则的野心”。 在担任DeepSeek深度学习研究员时,罗福莉将这份野心具像化了。 她主导开发的DeepSeek-V2引发行业震动,一举打响了大模型市场的价格战,其推理模型更是被业界评为“闭源模型第一梯队”。
罗福莉 |