DeepSeek低調發佈V3新模型 保持開源兼降計算成本 令人質疑矽谷模式

中國人工智能初創DeepSeek周一低調發佈了新模型「DeepSeek-V3-0324」,初步測試顯示其可在消費級硬件上運行,打破大模型需要數據中心的傳統思路;同時繼續降低大模型能耗及計算成本,並保持開源以不斷推動技術創新,引領內地AI行業迅速發展,令人對矽谷的封閉付費模式產生質疑。

指標超越Claude Sonnet 3.5

據內媒報道,DeepSeek在沒有任何公告的情況下,在AI存儲庫Hugging Face上線新的DeepSeek-V3模型。

有AI研究員表示,該模型可配備M3 Ultra芯片的蘋果電腦上,以每秒20個token的速度運行,意味數據中心並不是大模型的必要搭配。另一研究員亦在X上宣稱,在內部工作上測試了新版DeepSeek-V3後,發現它在測試的所有指標上都有了巨大飛躍,更超越了甲骨文的Claude Sonnet 3.5,成為最好的非推理模型。

免費下載和使用令網民興奮

此外,由於DeepSeek的模型都是開源模型,可供任何人免費下載和使用,與按月收取20美元費用的Claude Sonnet截然相反。另有網民更在社交平台X上表示,這相當於「免費獲得法拉利」。

報道又提到,DeepSeek新模型的改變對於業內具有重大意義,一方面大大降低了大模型的能耗及計算成本,進一步動搖了華爾街對於頂級模型基礎設施的投資規模假設;另一方面,中國人工智能行業對開源的廣泛共識又迅速推動內地AI行業的發展,不斷縮短其與世界頂尖對手的距離。

有人更認為,DeepSeek計劃在4月發佈的R2模型有可能直接挑戰OpenAI宣傳已久的GPT-5模型;一旦成事,中美兩國發展人工智能的不同思路將迎來直接交鋒。

即時財經