羅福莉並非一路「開掛」

備受關注的前DeepSeek研究員羅福莉正式宣布加入小米,就職於Xiaomi MiMo大模型團隊。被冠以「95後天才少女」之名的羅福莉再次成為關注焦點,她坦言自己並非一路「開掛」,「我也像大多數人一樣,迷茫、走過彎路,但跌倒一次、爬起一次,再跌倒、再爬起……」

去年底,DeepSeek在全球範圍內引發關注。緊接著,小米被曝以千萬年薪挖角羅福莉的消息衝上熱搜。意外走紅後,羅福莉並未正面回應,只是在朋友圈發文稱,希望安安靜靜做事。沉寂大半年後,羅福莉的去向逐漸清晰。今年10月,小米與北京大學聯合發布的一篇論文中,羅福莉位列通訊作者。儘管論文沒有標明她是否屬於小米團隊,但是作為論文主要負責人,小米和羅福莉顯然已進行深度合作。

如今塵埃落定。她在社交平台正式官宣:「智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創造力、才華橫溢且真誠熱愛的研究員,致力於構建這樣的未來,全力奔赴我們心目中的AGI。」至此,雷軍又得一員AI大將。

據《中國科學報》報道,羅福莉是一位「95後」,生於四川宜賓,本科就讀於北京師範大學。大一得知「電腦專業每年都有保研北京大學」後,期末排名靠後的她開始專注學習,並提前轉入電腦專業,在經歷「一段清苦但充實的時光」後,成績排名擠進前5%。大三去北京大學實習期間,她受到北京大學語言計算與互聯網挖掘研究室研究員萬小軍的科研啟蒙,並發表了人生中第一篇頂級會議論文,但不是第一作者身分。

2017年被保送北京大學後,羅福莉師從北京大學電腦學院計算語言學研究所教授,開始做一些詞義消歧、文本風格轉換、雙關生成等自然語言處理方面的研究。2019年,她因「在自然語言處理領域頂級會議ACL(計算語言學協會年度會議)上發表8篇論文」登上熱搜。「我的朋友圈不乏投中ACL兩篇長文的人」,羅福莉說,這次投稿ACL是她近一年的產出,「我付出了足夠的努力,當然也有運氣成分加持。」

2020年,碩士畢業的羅福莉沒有繼續讀博,而是參加校招「進入工業界」。這對她而言無疑是一個明智的決定。這年,羅福莉在畢業季幾乎拿到中國大多數「大廠」的錄取通知書。後來她選擇加入阿里達摩院,從事預訓練語言模型相關的研究。

在阿里達摩院,羅福莉主導開發跨語言預訓練模型「VECO」,並在深度語言模型體系AliceMind的集體開源項目中挑起了大樑。2022年之後,她的職業履歷發生兩次變更:從阿里達摩院離開加入「幻方量化」,再轉入幻方量化的子公司「深度求索」(DeepSeek)。2023年,羅福莉成為DeepSeek的研究員,參與了DeepSeek-V2的研發。

羅福莉並非一路「開掛」。「我也像大多數人一樣,迷茫、走過彎路,但跌倒一次、爬起一次,再跌倒、再爬起」,她說,即便「自帶光環」地加入阿里達摩院的研究團隊,也並沒有如大家想像的那樣一路「開掛」,「後面有太多自我調整和再度出發的故事。」她很早就清醒地認識到,自己不是天賦型選手。她高中班主任也說,羅福莉不是最拔尖的,「但足夠優秀,非常刻苦。」

在關於人生經歷的分享中,她多次提到,自己心裏住著一個「小人兒」,會跟她對話。例如,當被問及「為甚麼這麼多自然語言處理領域的『大牛』碩士畢業去企業不留在學術界」時,她聊起碩士畢業時已經以個人一作發表了四五篇A類論文,基本上達到了國內絕大多數實驗室的博士畢業要求,碩士畢業讀博性價比不高。她說:「當時內心就有個小人兒問自己,為甚麼我要花5年時間再去做一件已經確定能達到目標的事情?這一點都不讓人興奮。」她心裏住著的這個「小人兒」,讓她足夠清醒、足夠努力。

本報訊

羅福莉正式加入小米,再次成為關注焦點。網上圖片

商情