谷歌發布AI模型第二代Gemini 2.0

2024-12-12 05:59:00

谷歌推出新一代人工智能模型Gemini 2.0。谷歌

Gemini 2.0加強AI代理人Project Astra的語言溝通能力。谷歌

本報訊

谷歌11日發布下一代人工智能（AI）模型Gemini 2.0的預覽。執行長皮蔡（Sundar Pichai）透過官方網誌宣稱，2.0是谷歌迄今能力最強大的模型，其演算法原生支援圖像和音訊輸出，「它讓我們可以建立新AI代理人，使我們更接近實現通用助理的願景」。

科技新聞網站Engadget報道，谷歌這次推出Gemini 2.0的做法有些不同，沒有先提供該模型的最先進版本Gemini 2.0 Pro，而是從2.0 Flash開始，即所有Gemini用戶都可以使用的最有效率和最經濟實惠的版本。若用戶想要試用，只需在Gemini網站上點擊下拉式選單就可以。行動版本稍後推出。

谷歌表示，它的重點是將Gemini 2.0的智慧添加到谷歌搜尋，首先從「AI概要」（AI Overviews）開始。谷歌稱，新模型將容許這項功能解決更複雜和更深入的問題，包括涉及多個步驟的數學和編碼問題。與此同時，在今年10月大規模擴充後，谷歌計劃將「AI概要」延伸至更多語言和國家。

Gemini 2.0已為谷歌一些更具突破性的AI應用提供加強功能，包括今年I/O大會上谷歌對外展示的多重AI代理人Project Astra。谷歌表示，得益於新模型，最新版本的Astra能以多種語言進行對話，甚至即時切換不同語言。它還能「記住」更多內容，降低延遲機會，也可使用谷歌智慧鏡頭和地圖等工具。

正如預期，谷歌號稱Gemini 2.0 Flash的性能比上一代大幅改善，例如用於測試AI解決競爭級數學問題能力的基準測試HiddenMath中準確率為63%。相較之下，Gemini 1.5 Flash只取得47.2%。有趣的是，Gemini 2.0的實驗性版本在不少領域上也能打敗Gemini 1.5 Pro。根據谷歌分享的數據，新版本唯一落後的領域是長上下文的理解和自動語音翻譯。這就是谷歌繼續保留舊模型一段時間的原因。

除了Gemini 2.0外，谷歌還推出「深入研究」（Deep Research）功能，利用Gemini 1.5 Pro長上下文理解能力為複雜主題撰寫綜合報告。

谷歌發布AI模型第二代Gemini 2.0

最新⽂章

科技-三藩市版

瀏覽器導航代理人Project Mariner曝光

蘋果更新操作系統增加更多AI功能

ChatGPT用戶均可使用Canvas

數據中心耗能巨谷歌大力投資綠能

Reddit自設AI查詢連接討論子版塊內容

Rode無線麥克風功能強大節省後期編輯

Yelp增AI功能概括用戶評論

谷歌量子電腦研發取得關鍵突破

OpenAI付費用戶可用Sora視頻生成器

UCLA比較文學課 AI生成製作教材