拆解DeepSeek如何顛覆AI格局中美下載榜登頂 Nvidia夜盤急挫5%

2025-01-26 20:10:00

國產AI黑馬DeepSeek自1月20日正式發佈大模型DeepSeek-R1後，因其在數學、編程和推理等關鍵領域與OpenAI的最強模型性能相當，而且API調用成本低90%至95%，震驚市場。該應用程式更在蘋果中國和美國地區App Store免費下載榜中登頂，其中在美國地區下載榜上更超越ChatGPT。

DeepSeek對股市有何影響？

Saas概念股向上英偉達急跌

在憧憬AI應用普及下，有關消息刺激多隻在港上市Saas概念股向上，其中醫渡科技（2158）曾升逾6%、匯量科技（1860）及微盟（2013）亦曾分別升6%及5.4%。晶片股亦見受壓，中芯（981）曾跌3％；華虹半導體（1347）曾跌逾3%；晶門半導體（2878）更曾跌6%。此外，AI晶片龍頭英偉達（Nvidia，NVDA）亦因此利淡，在部份券商平台美股夜盤急跌逾5%至135.15美元。

AI行業專家如何評價？

綜合媒體報道，DeepSeek-R1的驚豔表現引來多位AI行業專家和從業者盛讚。百度（9888）前首席科學家吳恩達在冬季達沃斯論壇上表示，對DeepSeek的進展印象深刻，並認爲他們能夠以非常經濟的方式訓練模型。

微軟CEO籲認真對待中國

微軟行政總裁Satya Nadella也公開表示，DeepSeek切實有效地開發了一款開源模型，在推理計算方面表現出色，而且超級計算效率極高；他更強調，「我們必須非常、非常認真地對待中國的這些進展」。

AI競爭格局有何改變？

DeepSeek的成功更獲外媒形容為「標誌着中國在人工智能領域日益強大的自主創新能力」。英國《金融時報》文章指出，DeepSeek並非個例，自去年中開始，阿里巴巴（9988）、騰訊（700）、字節跳動等中國科企持續縮小與美國同行差距，除了在能力方面逐漸趨近，更在成本效益上實現超越，而且這種增長效率並非偶然。

開源模型趕上閉源模型

至於DeepSeek的另一熱議焦點，是在於開源模型趕上閉源模型，可能改變競爭格局。事實上，OpenAI的閉源是其主導AI行業格局的一大特徵。不過，Meta首席AI科學家Yann LeCun表示，DeepSeek得益於開放生態，其創新基於前人成果的持續迭代，顯示了開源模型正在超越閉源系統。華爾街頂級風投A16z創始人Marc Andreessen更稱，DeepSeek-R1是其見過最令人驚歎、最令人印象深刻的突破之一，並且是「開源」、是「給世界的禮物」。

值得留意的是，Tesla行政總裁馬斯克曾對OpenAI的閉源提起訴訟。在去年2月29日，馬斯克向三藩市高等法院控告OpenAI背離公共開源AGI的承諾，提出違約、違反受託責任和不公平商業行為等指控，要求法院命令OpenAI恢復開源狀態，阻止OpenAI及其總裁、CEO，以及微軟從AGI技術中獲利，並對OpenAI使用捐款進行清查。不過，馬斯克的努力尚未使OpenAI開源，但DeepSeek正以開源姿態贏得更多認可。

創辦人是誰？何時成立及崛起？

DeepSeek創辦人為梁文鋒，1985年出生於廣東省湛江市，今年約40歲，浙江大學畢業，擁有資訊與電子工程學系學士和碩士學位。他早於2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易，到2015年正式成立幻方量化，2019年資金管理規模更突破百億元。

直到2023年，梁文鋒宣布進軍通用人工智能領域，專注於做真正人類等級的人工智能；同年幻方量化正式宣布成立大模型公司DeepSeek。

在2023年11月2日，公司已推出首個模型DeepSeek Coder，該模型免費供商業使用且完全開源；11月29日推出DeepSeek LLM，參數規模達67B，性能接近GPT-4，同時還發佈了聊天版本DeepSeek Chat。

被稱為「價格屠夫」及「AI界拼多多」

真正讓Deepseek在AI界受關注，是其在去年5月開源的第二代MoE大模型DeepSeek-V2，該模型在性能上比肩GPT-4 Turbo，價格卻只有GPT-4的百分之一，因此被稱為「價格屠夫」及「AI界的拼多多」。隨後在2024年下半年，還先後發佈了DeepSeek R1-lite-preview和DeepSeek-V3。

直到今年推出R1模型，在MATH基準測試上達77.5%準確率，與OpenAI的o1不相上下；在編程領域，R1在Codeforces評測中達2441分水平，高於96.3%的人類參與者。更重要的是，這是在不到600萬美元的投入和2048塊低性能的H800芯片的條件下完成，訓練時間僅用兩個月，令全球側目。

DeepSeek VS ChatGPT

若將DeepSeek與ChatGPT性能作比較，DeepSeek在MATH 500、AIME 2024和Codeforces等數學和編程測試中，表現優於ChatGPT和其他主流模型。在多任務理解和複雜問題處理方面，兩者表現相當，雖然DeepSeek在部分測試中略低於Claude，但整體上仍優於大多數模型。

上下文理解能力較弱

不過，ChatGPT在響應速度和文字生成方面較佳，其首次響應時間通常在1秒以內，DeepSeek則需要1.1秒左右，同時ChatGPT每秒可生成100個TOKEN，DeepSeek則為87.5個TOKEN。此外，DeepSeek一個較明顯弱點是上下文理解能力較弱，只能記住13萬個TOKEN的上下文，而ChatGPT和Claude則能記住200萬個TOKEN。

DeepSeek爆紅登蘋果App Store第6位傳Meta爆內部焦慮周鴻禕料可抗美國AI霸權

拆解DeepSeek如何顛覆AI格局中美下載榜登頂 Nvidia夜盤急挫5%

DeepSeek對股市有何影響？

Saas概念股向上英偉達急跌

AI行業專家如何評價？

微軟CEO籲認真對待中國

AI競爭格局有何改變？

開源模型趕上閉源模型

創辦人是誰？何時成立及崛起？

被稱為「價格屠夫」及「AI界拼多多」

DeepSeek VS ChatGPT

上下文理解能力較弱

最新⽂章

即時財經

國產AI DeepSeek震散美股科技股蒸發8萬億市值 Nvidia插13%失落市值一哥

恒生9年間銷售基金及衍生品嚴重缺失證監譴責兼罰款6640萬元

余偉文指外匯基金與政府分帳行之有效撥款紓緩財赤須考慮貨幣穩定

電子利是2025｜蛇年派「e利是」贏獎賞各大銀行優惠一間推抽獎贏財神足金金牌

外匯基金去年投資收入2,190億整體投資回報率5.3%

港人首奪美國投資錦標賽冠軍 J Law一年勁賺353%創世界紀錄

HKCERT籲警惕農曆新年詐騙或假裝派電子利是提供5招讓公眾防身

特朗普上台日圓還能貶值嗎？｜曾淵滄

DeepSeek疑出現「死機」公司：用戶訪問量激增

渣打洪丕正料亞洲冒起未來10年貢獻全球GDP一半財富管理需求增

拆解DeepSeek如何顛覆AI格局 中美下載榜登頂 Nvidia夜盤急挫5%

DeepSeek對股市有何影響？

Saas概念股向上 英偉達急跌

AI行業專家如何評價？

微軟CEO籲認真對待中國

AI競爭格局有何改變？

開源模型趕上閉源模型

創辦人是誰？何時成立及崛起？

被稱為「價格屠夫」及「AI界拼多多」

DeepSeek VS ChatGPT

上下文理解能力較弱

最新⽂章

即時財經

拆解DeepSeek如何顛覆AI格局中美下載榜登頂 Nvidia夜盤急挫5%

Saas概念股向上英偉達急跌