通義千問發布超大規模MoE模型號稱優於DeepSeek V3 阿里美股升7%

2025-01-28 20:03:00

中國國產人工智能（AI）大模型DeepSeek橫空出世，因其超高性能和極低訓練成本震驚市場之際，阿里巴巴（9988）旗下阿里雲宣布通義千問Qwen 2.5-Max超大規模MoE模型，號稱優於DeepSeek V3，阿里美股（BABA）周二升6.7%，今日夜盤再升1.2%

阿里雲公佈了其全新通義千問 Qwen 2.5-Max 超大規模MoE模型，聲稱可以通過API的方式進行訪問，也可以登錄Qwen Chat進行體驗，例如直接與模型對話，或者使用 artifacts及搜索等功能。

據介紹，通義千問 Qwen 2.5-Max 使用超過20萬億token的預訓練數據，以及精心設計的後訓練方案進行訓練。阿里雲更直接對比了指令模型的性能表現，比較對象包括 DeepSeek V3、OpenAI旗下的GPT-4o 和 Claude-3.5-Sonnet，

阿里雲指，在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中，Qwen2.5-Max 的表現超越了DeepSeek V3，同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績，相信隨着後訓練技術的不斷進步，下一個版本的Qwen2.5-Max將會達到更高的水平。

DeepSeek引爆AI產業大洗牌黃國英籲減持Nvidia 「有排返唔到轉頭」何啟聰看好一類贏家

DeepSeek未能擊潰護城河 Nvidia被忽略的本質｜晉佳

通義千問發布超大規模MoE模型號稱優於DeepSeek V3 阿里美股升7%

最新⽂章

即時財經

陳美寶與國泰高層會面盼年內增網絡覆蓋至逾100個航點

OPEC+下周開會應對特朗普料採聯合立場傳沙特「私會」部份成員

買樓自住此其時｜曾智華

特朗普轟聯儲局未控制通脹籲少花時間在性別意識形態及虛假氣候變遷問題上

內地新春電影票房突破30億再創新高《哪吒之魔童鬧海》最強即睇背後受惠股

軟銀洽投資OpenAI最高250億美元或取代微軟成最大投資者

鮑威爾不反對銀行與加密幣合作料更多監管「有幫助」比特幣升穿10.4萬美元

金管局稱美減息步伐仍有不少變數籲市民置業小心管理風險

微軟雲業務意外放緩稱DeepSeek「有一些真正創新」AI成本下降是趨勢

Meta業績勝預期今年擬續「燒錢」攻AI 朱克伯格：重新定義與政府關係

通義千問發布超大規模MoE模型 號稱優於DeepSeek V3 阿里美股升7%

最新⽂章

即時財經

通義千問發布超大規模MoE模型號稱優於DeepSeek V3 阿里美股升7%