阿里推新模型QwQ-32B 性能媲美DeepSeek-R1 股價曾升逾7%

2025-03-05 19:50:00

阿里（9988）旗下通義千問Qwen團隊推出QwQ-32B大語言模型，據稱其性能媲美擁有6,710億參數的DeepSeek-R1（其中370億被激活），更在某些測試中超越了對方。受消息影響，阿里股價今早曾升逾7%至139.6元；暫報138.2元，續升逾6%。

或證通用AI可行之路

據內媒引述阿里Qwen團隊指出，有關成果突顯了將強化學習應用於經過大規模預訓練的強大基礎模型的有效性，希望以此證明強大的基礎模型疊加大規模強化學習也許是一條通往通用人工智能的可行之路。

集成與Agent相關能力

除了基礎推理能力外，QwQ-32B還集成了與Agent相關的能力，使其能夠在使用工具時進行批判性思考，並根據環境反饋調整推理過程。

部份測試結果更勝DeepSeek-R1

根據官方披露測試結果，QwQ-32B在測試數學能力的AIME24評測集上，以及在評估代碼能力的LiveCodeBench中，表現同樣與DeepSeek-R1相當；而在Meta首席科學家楊立昆領銜的「最難LLMs評測榜」LiveBench上、在谷歌等提出的指令遵循能力IFEval評測集中，以及在加州大學伯克利分校等提出的評估準確調用函數或工具的BFCL測試中，同樣超越DeepSeek-R1。

報道又指，QwQ-32B的發佈與阿里近期宣佈的AI戰略高度一致，而阿里早前自研的「深度思考」推理模型已在夸克AI搜索平台上線，成為國內少數沒有接入DeepSeek的大體量C端AI應用。在基礎模型層面，阿里通義大模型家族更已躋身全球頂尖開源模型行列，並有傳更大規模的模型也將接入夸克。

阿里推新模型QwQ-32B 性能媲美DeepSeek-R1 股價曾升逾7%

或證通用AI可行之路

集成與Agent相關能力

部份測試結果更勝DeepSeek-R1

最新⽂章

即時財經

首款折疊iPhone料明年量產郭明錤：初代售價2,000至2,500美元以上

茶飲股上市潮未完霸王茶姬赴美上市獲中證監備案

香港女性冀退休後月花2.4萬富達調查：資產配置偏好現金定存

美股低迷美元指數反現跌勢分析：預視經濟惡化甚或「美國優先」已減弱

兩會2025︱人大舉行經濟主題記者會潘功勝︰今年有降準降息空間

GoGoX增啟德郵輪碼頭運力稱行李運送服務受捧高峰期平均輪候10分鐘

貝萊德被喻「掌控全世界」千億接手長和港口勢打通全球貿易關鍵

樂聚夥拍中移及華為推全球首款搭載5G-A技術人形機器人

滙控據報重新命名地域設置不用「東部」及「西部」避免外界猜測分拆

蜜雪冰城4日累升70% 靠平價及洗腦歌超越麥當勞及星巴克成全球最大餐飲連鎖