Meta或本月發布新AI模型

在投資者壓力下,Meta計劃今年投入高達650億美元擴展AI基礎設施。路透社資料圖片

根據《The Information》4日援引知情人士消息報道,Meta Platforms計劃於本月發布其最新的語言模型Llama 4,儘管該模型已經至少兩次推遲。這是Meta為在AI競賽中爭奪領先地位所作的努力之一,但報道指,Meta可能會再次推遲Llama 的發布。

隨著OpenAI的ChatGPT大獲成功,改變了科技領域的格局並推動機械學習的投資,全球大型科技公司在AI基礎設施上積極投入。儘管如此,Llama 4的開發並不一帆風順。報道指,Llama 4在開發過程中未能達到Meta的技術基準,特別是在推理和數學任務上表現不佳。

Meta也擔心Llama 4在進行類人語音對話方面的能力不及OpenAI模型,這也是推遲的原因之一。Meta正積極考慮如何提升Llama 4能力,以便在AI競爭中不落人後。

在投資者的壓力下,Meta計劃今年投入高達650億美元擴展其AI基礎設施,這一舉措也是為了讓大型科技公司能夠顯示其投資回報。而來自中國科技公司DeepSeek的低成本AI模型的崛起,也挑戰了「開發最佳AI模型必須花費數十億美元」的觀念。

Llama 4將會借鑑中國新創公司DeepSeek的一些技術,至少有一個版本預估會採用「專家混合」技術,這是一種讓模型的不同部分專注於特定任務的機器學習方法,從而使這些部分在特定領域內成為專家。

此外,Meta也考慮過先透過Meta AI發布Llama 4,然後再將其作為開放原始碼軟件推出。去年的Llama 3模型可以說是Meta的一次突破,該模型不僅能夠進行八種語言的對話,還能夠編寫更高品質的電腦程序並解決比以往更複雜的數學問題。

另外,據彭博社報道,Meta Platforms Inc.正準備在威斯康辛州中部投資近10億美元建設數據中心項目,這一舉措是該社交媒體公司擴大在AI和雲基礎設施投資計劃的一部分。

今年2月,威斯康辛州與一家使用假名的匿名公司達成了激勵協議,以在該州建立數據中心。根據彭博社查閱的文件,這個多年項目的預期投資約為8.37億美元。一位因資訊尚未公開而要求匿名的人士透露,Meta就是該項目背後的公司。Meta此前已宣布計劃在今年投資高達650億美元,主要專注於發展以AI為中心的基礎設施。本報訊

財經