
阿里巴巴(9988)周一(28日)發布及開源通義千問3.0(Qwen3)系列模型,並稱其在數學和編程等方面均可與DeepSeek、ChatGPT-o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型的性能媲美。阿里表示,與其他主流模型相比,該模型還顯著降低部署成本,可同時集成兩種思考模式,支持119種語言,便於Agent調用。
有效進行自我事實覆查
阿里表示,Qwen3包括兩個專家混合(MoE)模型和另外6個模型。同時,該模型是「混合型」模型,既可以花時間「推理」解決複雜問題,也可以快速回答簡單請求,分別叫做「思考模式」和「非思考模式」。其中「思考模式」中的推理能力使模型能有效進行自我事實覆查,類似於ChatGPT-o3模型,但推理過程中的延遲時間較高。
首要實現通用人工智能
目前,阿里正以Qwen爲核心,構建其AI版圖。今年2月,阿里巴巴首席執行官吳泳銘表示,公司目前的「首要目標」是實現通用人工智能(AGI),即打造具備人類智力水平的AI系統。
阿里表示,Qwen3代表公司正在通往通用人工智能(AGI)和超級人工智能(ASI)。未來公司計劃從多個維度提升模型,包括優化模型架構和訓練方法,以實現擴展數據規模、增加模型大小、延長上下文長度、拓寬模態範圍,並利用環境反饋推進強化學習以進行長周期推理。