AI模型通關電玩 谷歌高層興奮

Gemini通關《寶可夢藍版》。Twitch/Gemini Plays Pokemon

谷歌最昂貴的人工智能(AI)模型似乎已經跨越一個重要里程碑:破關一款已有29年歷史的電動遊戲。據科技網站TechCrunch報道,谷歌執行長皮蔡(Sundar Pichai)近日在X平台上興奮發文:「太精彩了!Gemini 2.5 Pro 剛剛成功通關《寶可夢藍版》(Pokemon Blue)!」事實上,「Gemini 玩《寶可夢》」在Twitch的直播是一位自稱與谷歌無關的30歲軟體工程師Joel Z. 所創建,而谷歌高層一直為這項努力加油打氣。例如,谷歌AI Studio的產品負責人基爾帕特里克(Logan Kilpatrick)上月在社群上分享,Gemini在通關《寶可夢》遊戲方面取得了巨大進展,甚至已經拿到第五枚徽章,而其他表現較佳的AI模型最多才拿到三枚,但使用的是不同的代理框架。

今年2月,Anthropic就強調其Claude AI模型在《精靈寶可夢紅版》的進展,並稱Claude的「擴展思維和代理訓練」,使其在「更出乎意料」的任務,例如玩經典遊戲時,獲得了「重大的能力提升」。 但Claude似乎尚未通關《神奇寶貝紅版》,這是否意味著Gemini在遊戲上更勝一籌呢?Joel Z在其Twitch 頁面上提醒大家:「請不要把這當作衡量大型語言模型玩《寶可夢》能力的基準。你無法直接比較–Gemini與Claude使用不同的工具,並且接收的是不同的資訊。」

兩個AI模型在玩遊戲時都需要幫助,意即前文提到的代理框架的作用,為模型提供遊戲截圖,以及額外的資訊,讓模型能夠根據這些資料決定如何回應,可能還涉及調用專門的代理,然後按下與AI指令相對應的按鈕。本報訊

科技-三藩市版