
阿里(9988)旗下通義千問Qwen團隊推出QwQ-32B大語言模型,據稱其性能媲美擁有6,710億參數的DeepSeek-R1(其中370億被激活),更在某些測試中超越了對方。受消息影響,阿里股價今早曾升逾7%至139.6元;暫報138.2元,續升逾6%。
或證通用AI可行之路
據內媒引述阿里Qwen團隊指出,有關成果突顯了將強化學習應用於經過大規模預訓練的強大基礎模型的有效性,希望以此證明強大的基礎模型疊加大規模強化學習也許是一條通往通用人工智能的可行之路。
集成與Agent相關能力
除了基礎推理能力外,QwQ-32B還集成了與Agent相關的能力,使其能夠在使用工具時進行批判性思考,並根據環境反饋調整推理過程。
部份測試結果更勝DeepSeek-R1
根據官方披露測試結果,QwQ-32B在測試數學能力的AIME24評測集上,以及在評估代碼能力的LiveCodeBench中,表現同樣與DeepSeek-R1相當;而在Meta首席科學家楊立昆領銜的「最難LLMs評測榜」LiveBench上、在谷歌等提出的指令遵循能力IFEval評測集中,以及在加州大學伯克利分校等提出的評估準確調用函數或工具的BFCL測試中,同樣超越DeepSeek-R1。
報道又指,QwQ-32B的發佈與阿里近期宣佈的AI戰略高度一致,而阿里早前自研的「深度思考」推理模型已在夸克AI搜索平台上線,成為國內少數沒有接入DeepSeek的大體量C端AI應用。在基礎模型層面,阿里通義大模型家族更已躋身全球頂尖開源模型行列,並有傳更大規模的模型也將接入夸克。