中國科技公司阿里巴巴29日發布人工智能(AI)模型的新版本,並聲稱該模型已超越備受讚譽的DeepSeek-V3。
美國之音報道,阿里雲發布全新通義千問Qwen2.5-Max超大規模混合專家(MoE)模型的時間較不尋常,意味著中國AI初創公司深度求索(DeepSeek)過去三周的迅猛崛起,不僅給海外競爭對手、也給境內競爭者帶來了壓力。
「Qwen2.5-Max幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,」阿里雲在微信公眾號上發布的公告中說,Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,並幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。
阿里雲表示,在基座模型測試方面,團隊將Qwen2.5-Max與目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B進行了對比,而Qwen2.5-Max在所有11項基準測試中全部超越了對比模型。
不過公告指出,Qwen2.5-Max在發展過程中仍面臨著諸多挑戰和風險,其中包括在技術挑戰方面,訓練優化過程中的計算資源消耗和時間成本問題,以及模型在複雜任務和多模態融合方面的性能提升需求,都需要進一步的研究和創新來解決。而在倫理與安全風險方面,也面臨數據隱私保護、模型偏見避免以及內容真實性和AI濫用防範等需要高度重視的問題。