內地私募基金幻方量化旗下專注AI大模型研究開發的Deepseek近日宣布DeepSeek-V3首個版本上線及爆紅之際,據報小米(1810)創始人雷軍開出千萬年薪將95後AI「天才少女」羅福莉招至麾下,並將就職於小米AI實驗室,以領導大模型團隊。
曾參與研發DeepSeek-V2
據內媒報道,羅福莉來自四川,雖然在進入北京師範大學之前,幾乎未曾接觸過電腦領域,但之後卻以優異成績保送北京大學計算機研究所;同時在學術領域表現相當亮眼,從其Google學術主頁中可見,一篇技術論文被引用次數高達2,160次,是今年被引用次數最多的文章。
此外,她曾在國際頂會ACL一次發表8篇論文,提出的詞義消歧方法和文本風格轉換框架在業界引發轟動。職業生涯方面,羅福莉曾在阿里達摩院主導開發多語言預訓練模型VECO,後來在DeepSeek參與DeepSeek-V2的研發,並且是這款模型的關鍵開發者之一。
展現小米發展AI決心
報道又提到,今次雷軍親自出手招募羅福莉,並開出千萬級年薪,展現出小米在AI領域的決心。事實上,小米AI實驗室的大模型團隊自2023年4月成立以來,已壯大至1,200多人,單是北京就開放了59個大模型相關職位。另有媒體報告稱,小米目前擁有6,500張GPU的算力資源,並計劃建置萬卡級GPU集群。