谷歌Gemini2.0新模型高級推理進步顯著

2025-01-24 05:58:00

谷歌悄然發布其熱門人工智能（AI）模型Gemini的重大更新，該模型現在可以解釋推理過程，並在數學和科學任務中創下新的性能紀錄，成為取代OpenAI的高級解決方案。

據科技媒體Venturebeat報道，谷歌的AI Studio本周發布最新的Gemini 2.0閃電思維（Flash Thinking）模型，在美國數學邀請賽（AIME）中取得73.3%的佳績，並在GPQA 鑽石科學測驗中獲得74.2%高分。這些結果顯示出相較於早期的AI模型，新模型在數學和科學推理方面有明顯進步，並展示谷歌在高級推理方面日益增強的實力。

谷歌DeepMind執行長哈薩比斯（Demis Hassabis）在X平台上發文表示：「從AlphaGo等計劃開始，我們已經在這類規劃系統的開發方面領先十多年，現在看到這些理念與最強大的基礎模型的結合，令人感到非常興奮。」

新模型最引人注目的特點是能夠處理多達一百萬個標記（tokens）的文本，比OpenAI的o1 Pro模型多出五倍，同時還保持更快的回應時間。擴展的上下文視窗，使模型可以同時分析多篇研究論文或大量資料集，此功能預期將改變研究人員和分析師處理大量資訊的方式。測試模型的AI研究員馬克（Dan Mac）也在X平台發文稱：「作為首次的實驗，我選取了各種宗教和哲學文本，並請Gemini 2.0閃電思維將它們綜合起來，提取出新穎獨特的見解。它總共處理了97萬個標記，數量相當令人難以置信。」

這份報告的發布正值AI產業變革的關鍵時刻。OpenAI最近宣布，其o3模型在GPQA鑽石標準測驗上獲得87.7%的高分。然而，谷歌決定在Beta測試期間免費提供新模型（有使用限制），可能會吸引尋求替代OpenAI每月200元訂閱服務的開發人員和企業。本報訊

谷歌Gemini2.0新模型高級推理進步顯著

最新⽂章

科技-三藩市版

DeepMind新AI模型提升機械人能力

OpenAI新工具助力企業構建AI Agent

Meta自研晶片訓練AI系統

蘋果作業系統擬全面大改版

Bluesky單挑Meta 開源網絡戰火熱

Bluesky增加新功能視頻長度可達三分鐘

電玩業界競相開發 AI驅動角色技術

微軟慶金禧下月辦活動

釀酒葡萄園採用人工智能技術

科技融入時尚 Meta雷朋Coperni合推限量版智能眼鏡

谷歌Gemini2.0新模型 高級推理進步顯著

最新⽂章

科技-三藩市版

谷歌Gemini2.0新模型高級推理進步顯著