![](https://media-proc.singtaousa.com/photo.php?s=https://media.singtaousa.com/wp-content/uploads/master/2025/02/2025021121571789020.jpg&f=jpeg&w=815&q=75)
內地低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鐘,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。
僅用16塊H100 GPU訓練
綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿里巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鐘,訓練出新模型。
![美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei 美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei](https://image.hkhl.hk/f/1024p0/0x0/100/none/a9ce09b2eab7088287cf8737c0fdb1cc/2025-02/drfeifei_GjgAYpjWUAMt9JB.jpg)
![李飛飛及其團隊只用了20美元,便創出效能媲美DeepSeek R1的新AI模型。路透社 李飛飛及其團隊只用了20美元,便創出效能媲美DeepSeek R1的新AI模型。路透社](https://image.hkhl.hk/f/1024p0/0x0/100/none/0a2651fd74b535114d962b4d3d2d5386/2025-02/R_ZEVHVRDH6RJS7AHGVAYKAOESI4.jpg)
![DeepSeek的估值存在巨大分歧,估值區間在10億美元到1550億美元之間。路透社 DeepSeek的估值存在巨大分歧,估值區間在10億美元到1550億美元之間。路透社](https://image.hkhl.hk/f/1024p0/0x0/100/none/b6a46b219e1be76ab04e97c81136a03b/2025-02/A_R_Z5ONYB73MVMUXMBKTYCMQE5WKQ.jpg)
![DeepSeek近期崛起成為全世界熱話。 DeepSeek近期崛起成為全世界熱話。](https://image.hkhl.hk/f/1024p0/0x0/100/none/ca9dbad39dd11cc836dd0027175d4d0a/2025-02/173906835912716.jpg)
相關新聞:DeepSeek︱關鍵人物潘梓正曾任NVIDIA 哈佛教授慨嘆美國「失了AI錢學森」
表現媲美OpenAI o1及DeepSeek R1
報道指,李飛飛團隊在研究中提出了「預算控制」策略,透過加入「wait指令」等方式,強制延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。
根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。
相關新聞:DeepSeek︱專家估算梁文鋒身家最高近萬億 超越黃仁勳
內媒每日經濟新聞報道,復旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。
由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也只包含了訓練時的GPU算力費用。
*/