谷歌已開放Gemini 2.0人工智能模型系列給所有人使用。
CNBC報道指出,谷歌12月曾讓開發人員和可信賴的測試人員使用,並將部分功能整合到谷歌產品中。
如今供所有人使用的模型包括2.0 Flash,被稱為「主力模型,最適合用於大規模的高流量、高頻率任務」、編程效能強大的2.0 Pro Experimental,以及谷歌稱之為「目前最具成本效益的模型」的2.0 Flash-Lite。
Gemini Flash在文字、圖像和視頻輸入方面的成本為每百萬個token(模型處理的每個獨立資料單位)10仙,而更經濟實惠的版本Flash-Lite則為0.75仙。
隨著科技巨頭與新創公司之間的AI軍備競賽白熱化,此次發佈是谷歌大量投資於AI代理的更廣泛策略的一部分。
Meta、亞馬遜、微軟、OpenAI和Anthropic也正朝著AI代理的方向邁進,這些模型能代表使用者完成複雜多步驟任務,不需要使用者陪著完成每個步驟。
「過去一年,我們一直在投資開發更多的代理模型,這意味著它們可以更多地了解你周圍的世界,提前多步思考,並在你的監督下代表你採取行動」,谷歌12月一篇博文寫道,Gemini 2.0在「多模態方面,比如原生圖像和音頻輸出,以及原生工具的使用方面有了新的進展」,該模型系列「將使我們能夠建立新的AI代理,從而更接近通用助理的願景。」
亞馬遜支持的AI創業公司Anthropic,由前OpenAI研究主管創立。今年10月,該公司稱其AI代理能像人類一樣使用電腦來完成複雜的任務。
該公司表示,Anthropic的電腦使用能力可解讀電腦屏幕上的內容、選擇按鈕、輸入文字、瀏覽網站,並透過任何軟件和即時網路瀏覽執行任務。
OpenAI最近發佈了類似的功能Operator,可自動執行規劃假期、填寫表格、預訂餐廳和訂購雜貨等任務。該公司將Operator描述為「一個可以到網路上為你執行任務的代理」。
日前,OpenAI剛又推出了Deep Research,可讓AI代理編寫複雜的研究報告,分析用戶選擇的問題和主題。谷歌12月推出了同名的類似工具Deep Research,可扮演「研究助理的角色,為你探索複雜的主題並編寫報告」。本報訊