DeepSeek低調發佈V3新模型保持開源兼降計算成本令人質疑矽谷模式

2025-03-25 00:32:00

中國人工智能初創DeepSeek周一低調發佈了新模型「DeepSeek-V3-0324」，初步測試顯示其可在消費級硬件上運行，打破大模型需要數據中心的傳統思路；同時繼續降低大模型能耗及計算成本，並保持開源以不斷推動技術創新，引領內地AI行業迅速發展，令人對矽谷的封閉付費模式產生質疑。

指標超越Claude Sonnet 3.5

據內媒報道，DeepSeek在沒有任何公告的情況下，在AI存儲庫Hugging Face上線新的DeepSeek-V3模型。

有AI研究員表示，該模型可配備M3 Ultra芯片的蘋果電腦上，以每秒20個token的速度運行，意味數據中心並不是大模型的必要搭配。另一研究員亦在X上宣稱，在內部工作上測試了新版DeepSeek-V3後，發現它在測試的所有指標上都有了巨大飛躍，更超越了甲骨文的Claude Sonnet 3.5，成為最好的非推理模型。

免費下載和使用令網民興奮

此外，由於DeepSeek的模型都是開源模型，可供任何人免費下載和使用，與按月收取20美元費用的Claude Sonnet截然相反。另有網民更在社交平台X上表示，這相當於「免費獲得法拉利」。

報道又提到，DeepSeek新模型的改變對於業內具有重大意義，一方面大大降低了大模型的能耗及計算成本，進一步動搖了華爾街對於頂級模型基礎設施的投資規模假設；另一方面，中國人工智能行業對開源的廣泛共識又迅速推動內地AI行業的發展，不斷縮短其與世界頂尖對手的距離。

有人更認為，DeepSeek計劃在4月發佈的R2模型有可能直接挑戰OpenAI宣傳已久的GPT-5模型；一旦成事，中美兩國發展人工智能的不同思路將迎來直接交鋒。

DeepSeek低調發佈V3新模型保持開源兼降計算成本令人質疑矽谷模式

指標超越Claude Sonnet 3.5

免費下載和使用令網民興奮

最新⽂章

即時財經

蘋果研發智能眼鏡晶片挑戰Meta Ray-Ban 料2027年問世

中國4月美元計價出口增8.1% 進口按年跌0.2% 均勝預期

遭國家大基金減持中芯曾挫一成華虹大跌13%

阿里巴巴CEO吳泳銘籲員工「回歸初心重新創業」

1個月HIBOR低見1.93厘拆息急跌後料反彈港美息差擴闊「資金重新流出港元」

聯儲局拒減息特朗普再轟鮑威爾「太遲先生」甚麼都不懂

美英達成貿易協議市場憧憬其他國家談判有進展｜古天后

恒指半日升1點恒地彈半成新地升3% 中芯、華虹挫6%及12%｜港股開市

AI旅遊攻略湧現小紅書大學生稱10分鐘排好行程業界：不擔心取代導遊

90後炒LABUBU 日花6小時門市「打躉」轉賣內地及台灣速賺一倍

DeepSeek低調發佈V3新模型 保持開源兼降計算成本 令人質疑矽谷模式

指標超越Claude Sonnet 3.5

免費下載和使用令網民興奮

最新⽂章

即時財經

DeepSeek低調發佈V3新模型保持開源兼降計算成本令人質疑矽谷模式