
谷歌最新人工智能(AI)開源模型Gemma 3,被譽為在單一GPU或AI加速器上運行的最佳模型。這款最新Gemma模型主要針對需要開發AI用於數據中心或智能手機等各種環境的開發人員,現在透過Google AI Studio工作室讓外界試用Gemma 3。
科技新聞網站Ars Technica報道,谷歌宣稱Gemma 3比較舊款開源模型更能解決更具挑戰性的任務。計算數據輸入數量的上下文視窗,從過去Gemma模型的8,192個詞元(token)大幅增至12萬8000個。基於專利Gemini 2.0基礎模型開發的Gemma 3,也是一個可以處理文字、高解析度圖像以至影片的多模式模型。谷歌為圖像安全也有一個模型ShieldGemma 2,與Gemma整合協助涉及三大類別的不當圖像,包括危險、涉性或暴力。
迄今大多數流行的AI模型都在數據中心的伺服器上集體運行,擁有龐大的AI運算能力。不少模型規模太大,難以在家用或辦公室上的硬體上運作。去年推出的首批Gemma模型讓開發人員和愛好者另一種低硬體需求的選項,從而與Meta Llama 3等同類模型競爭。最近掀起一股AI節能的潮流,例如中國公司「深度求索」(DeepSeek)推出的R1因低成本而引起注意。
谷歌形容Gemma 3是「全球最佳單一加速器模型」,但不是它所有版本對機內處理都是理想的。它提供不同大小,從只有10億個參數(parameter)、幾乎在任何裝置上運行的純文字模型到可以消耗大量記憶體的270億個參數,它還有40億和120億個參數版本。在低精度模式下,最小的Gemma 3模型佔用的記憶體不到1GB,但超大版本即使在4位元精準下也需要20GB至30GB。
但Gemma 3有多好?谷歌提供的數據看起來Gemma 3的性能比大多數模型有顯著提升。根據衡量用戶偏好的Elo指標,Gemma 3 27B在聊天能力方面上優於Gemma 2、Meta Llama3和OpenAI o3-mini等。雖然Gemma 3在相對主觀的測試中尚未趕上「深度求索」R1,但相對於大多數模型需要一組GPU,Gemma 3僅使用一個輝達H100加速器。谷歌表示,當談到數學、編碼和遵從複雜指令,Gemma 3表現比較強,但谷歌未交代任何數字加以支持。本報訊