
本報訊
Meta上月舉辦了首屆生成式人工智能(AI)會議 LlamaCon。儘管這項活動公布了一些對開發者有幫助的重要改進,但考慮到AI對該公司的重要性,所發布的成果仍讓人感覺有點失望。
科技網站Engadget報道,《華爾街日報》的最新報道讓人們對箇中原因有了更多的了解。
報道稱,Meta原本打算在這場4月的開發者活動上發布名為「巨獸」(Behemoth)的Llama 4模型,但後來將發布時間推遲至6月。現在,發布時間似乎又要延後了,可能直至「秋季或更晚」。
該模型被朱克伯格(Mark Zuckerberg)形容為「全球表現最強的基礎模型」。但據報道指,Meta工程師正「苦於無法大幅提升」該模型的能力,正在努力克服技術瓶頸。
Meta已經發布兩款較小型的Llama 4型號:Scout和Maverick,並預告將推出另一款暱稱為「Little Llama」的輕量級模型。另一方面,該公司上月表示,Behemoth模型預計將有2880億個活躍參數,並且在多項STEM領域的基準測試中,表現優於GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro。
Meta從未明確表示這款模型的具體推出時間。公司上月稱,「仍在訓練中」。儘管在LlamaCon的主題演講中有稍微提到Behemoth模型,但沒有透露更新的發布時間。這可能是因為大概還需要幾個月的時間,Meta內部顯然對相較於先前版本,改進幅度是否足以值得對外公開發布,仍舊有不少質疑。
Meta並未立即回應置評請求。正如報道所指出,這並非首家在競逐開發新模型和超越競爭對手時遇到障礙的公司。但Meta在AI方面具有宏大的抱負,這個延遲仍然值得注意。朱克伯格將AI視為優先開發任務,計劃今年在AI基礎設施投入720億元的巨資。