
本報訊
自從去年年底首次亮相以來,谷歌DeepMind的人工智能(AI)模型Gemini 2.0,已支援了多款谷歌產品,包括「AI模式」(AI Mode)聊天機器人(chatbot)。DeepMind如今進一步擴大有關技術,12日宣布推出兩款基於Gemini的新模型,號稱「為新一代實用機械人(robot)奠定基礎」。
科技新聞網站Engadget報道,第一款Gemini Robotics模型是DeepMind設計來直接控制機械人的。
根據DeepMind說法,機械人的AI系統需要具備三個特質,包括通用性、互動性和熟練度。
通用性涉及機械人適應新情況的靈活性,包括訓練範圍外的情況。互動性則體現了機械人對人們和環境作出回應的情況,熟練度則是很多人類能毫不費力完成的任務都涉及機械人難以掌握的精細動作技能。
DeepMind說︰「雖然我們過去工作證明了在這些領域取得進展,但Gemini Robotics在這三個特質的性能上代表邁出了實質性的一步,使我們更接近真正一般目的的機械人。」
例如,透過Gemini Robotics的驅動支援,DeepMind的ALOHA 2機械人可以摺紙和封上Ziploc密封袋。這個雙臂機械人也能理解以自然的日常語言給它的指示。正如從谷歌分享的影片可見,即使遇上阻礙,它還是可以完成任務,例如研究員叫它把水果放在容器裡,卻同時又把容器移來移去,但機械人還是能夠辦到。
谷歌正與雙足機械人「阿波羅」(Apollo)製造商Apptronik合作,建造下一代類人型機械人。
與此同時,DeepMind新推出的第二個AI模型是Gemini Robotics-ER(即具有推理能力)。公司表示,該模型使機械人專家可以利用Gemini高階推理能力來運行他們自己的程式。DeepMind提供「可信任測試人員」使用這套系統,包括昔日曾為谷歌母公司Alphabet子公司、現隸屬韓國現代汽車的「波士頓動力公司」(Boston Dynamics)。