谷歌Gemini2.0新模型 高級推理進步顯著

谷歌悄然發布其熱門人工智能(AI)模型Gemini的重大更新,該模型現在可以解釋推理過程,並在數學和科學任務中創下新的性能紀錄,成為取代OpenAI的高級解決方案。

據科技媒體Venturebeat報道,谷歌的AI Studio本周發布最新的Gemini 2.0閃電思維(Flash Thinking)模型,在美國數學邀請賽(AIME)中取得73.3%的佳績,並在GPQA 鑽石科學測驗中獲得74.2%高分。這些結果顯示出相較於早期的AI模型,新模型在數學和科學推理方面有明顯進步,並展示谷歌在高級推理方面日益增強的實力。

谷歌DeepMind執行長哈薩比斯(Demis Hassabis)在X平台上發文表示:「從AlphaGo等計劃開始,我們已經在這類規劃系統的開發方面領先十多年,現在看到這些理念與最強大的基礎模型的結合,令人感到非常興奮。」

新模型最引人注目的特點是能夠處理多達一百萬個標記(tokens)的文本,比OpenAI的o1 Pro模型多出五倍,同時還保持更快的回應時間。擴展的上下文視窗,使模型可以同時分析多篇研究論文或大量資料集,此功能預期將改變研究人員和分析師處理大量資訊的方式。測試模型的AI研究員馬克(Dan Mac)也在X平台發文稱:「作為首次的實驗,我選取了各種宗教和哲學文本,並請Gemini 2.0閃電思維將它們綜合起來,提取出新穎獨特的見解。它總共處理了97萬個標記,數量相當令人難以置信。」

這份報告的發布正值AI產業變革的關鍵時刻。OpenAI最近宣布,其o3模型在GPQA鑽石標準測驗上獲得87.7%的高分。然而,谷歌決定在Beta測試期間免費提供新模型(有使用限制),可能會吸引尋求替代OpenAI每月200元訂閱服務的開發人員和企業。本報訊

科技-三藩市版