谷歌發布AI模型第二代Gemini 2.0

谷歌推出新一代人工智能模型Gemini 2.0。谷歌

Gemini 2.0加強AI代理人Project Astra的語言溝通能力。谷歌

本報訊

谷歌11日發布下一代人工智能(AI)模型Gemini 2.0的預覽。執行長皮蔡(Sundar Pichai)透過官方網誌宣稱,2.0是谷歌迄今能力最強大的模型,其演算法原生支援圖像和音訊輸出,「它讓我們可以建立新AI代理人,使我們更接近實現通用助理的願景」。

科技新聞網站Engadget報道,谷歌這次推出Gemini 2.0的做法有些不同,沒有先提供該模型的最先進版本Gemini 2.0 Pro,而是從2.0 Flash開始,即所有Gemini用戶都可以使用的最有效率和最經濟實惠的版本。若用戶想要試用,只需在Gemini網站上點擊下拉式選單就可以。行動版本稍後推出。

谷歌表示,它的重點是將Gemini 2.0的智慧添加到谷歌搜尋,首先從「AI概要」(AI Overviews)開始。谷歌稱,新模型將容許這項功能解決更複雜和更深入的問題,包括涉及多個步驟的數學和編碼問題。與此同時,在今年10月大規模擴充後,谷歌計劃將「AI概要」延伸至更多語言和國家。

Gemini 2.0已為谷歌一些更具突破性的AI應用提供加強功能,包括今年I/O大會上谷歌對外展示的多重AI代理人Project Astra。谷歌表示,得益於新模型,最新版本的Astra能以多種語言進行對話,甚至即時切換不同語言。它還能「記住」更多內容,降低延遲機會,也可使用谷歌智慧鏡頭和地圖等工具。

正如預期,谷歌號稱Gemini 2.0 Flash的性能比上一代大幅改善,例如用於測試AI解決競爭級數學問題能力的基準測試HiddenMath中準確率為63%。相較之下,Gemini 1.5 Flash只取得47.2%。有趣的是,Gemini 2.0的實驗性版本在不少領域上也能打敗Gemini 1.5 Pro。根據谷歌分享的數據,新版本唯一落後的領域是長上下文的理解和自動語音翻譯。這就是谷歌繼續保留舊模型一段時間的原因。

除了Gemini 2.0外,谷歌還推出「深入研究」(Deep Research)功能,利用Gemini 1.5 Pro長上下文理解能力為複雜主題撰寫綜合報告。

科技-三藩市版