谷歌Gemma 3可節省運行成本

2025-03-14 05:59:00

谷歌宣布推出最新開源模型Gemma 3。Google

谷歌最新人工智能（AI）開源模型Gemma 3，被譽為在單一GPU或AI加速器上運行的最佳模型。這款最新Gemma模型主要針對需要開發AI用於數據中心或智能手機等各種環境的開發人員，現在透過Google AI Studio工作室讓外界試用Gemma 3。

科技新聞網站Ars Technica報道，谷歌宣稱Gemma 3比較舊款開源模型更能解決更具挑戰性的任務。計算數據輸入數量的上下文視窗，從過去Gemma模型的8,192個詞元（token）大幅增至12萬8000個。基於專利Gemini 2.0基礎模型開發的Gemma 3，也是一個可以處理文字、高解析度圖像以至影片的多模式模型。谷歌為圖像安全也有一個模型ShieldGemma 2，與Gemma整合協助涉及三大類別的不當圖像，包括危險、涉性或暴力。

迄今大多數流行的AI模型都在數據中心的伺服器上集體運行，擁有龐大的AI運算能力。不少模型規模太大，難以在家用或辦公室上的硬體上運作。去年推出的首批Gemma模型讓開發人員和愛好者另一種低硬體需求的選項，從而與Meta Llama 3等同類模型競爭。最近掀起一股AI節能的潮流，例如中國公司「深度求索」（DeepSeek）推出的R1因低成本而引起注意。

谷歌形容Gemma 3是「全球最佳單一加速器模型」，但不是它所有版本對機內處理都是理想的。它提供不同大小，從只有10億個參數（parameter）、幾乎在任何裝置上運行的純文字模型到可以消耗大量記憶體的270億個參數，它還有40億和120億個參數版本。在低精度模式下，最小的Gemma 3模型佔用的記憶體不到1GB，但超大版本即使在4位元精準下也需要20GB至30GB。

但Gemma 3有多好？谷歌提供的數據看起來Gemma 3的性能比大多數模型有顯著提升。根據衡量用戶偏好的Elo指標，Gemma 3 27B在聊天能力方面上優於Gemma 2、Meta Llama3和OpenAI o3-mini等。雖然Gemma 3在相對主觀的測試中尚未趕上「深度求索」R1，但相對於大多數模型需要一組GPU，Gemma 3僅使用一個輝達H100加速器。谷歌表示，當談到數學、編碼和遵從複雜指令，Gemma 3表現比較強，但谷歌未交代任何數字加以支持。本報訊

谷歌Gemma 3可節省運行成本

最新⽂章

科技-三藩市版

杜絕AI Reddit檢測用戶是否真人

Apple Arcade下月推出五款新遊戲老少咸宜

B&O新A1音箱低音喇叭更強大

Substack直播可「僅限音訊」

微軟兩款新筆電減價增AI功能

Anthropic獎勵科學家利用AI做研究

AI模型通關電玩谷歌高層興奮

Buffalo透明外接硬碟限量50台

谷歌NotebookLM流動程式將面世

谷歌搜尋測試AI模式答疑能力更強更深入