ChatGPT會聽會說還看得見

OpenAI員工直播示範ChatGPT「高階語音模式」新增的視覺功能。OpenAI

本報訊

OpenAI正式為ChatGPT聊天機器人的「仿真人」對話功能「高階語音模式」(Advanced Voice Mode)新增視覺功能。只要利用ChatGPT應用程式,ChatGPT Plus、Team或Pro訂戶可以用手機對準物件,要求ChatGPT即時作出回應。

科技新聞網站TechCrunch報道,OpenAI七個月前示範了這項新功能,直到本周正式推出。除了用手機對準物件外,視覺版「高階語音模式」還可透過畫面分享來理解畫面上的內容,可以解釋不同設定選單或對數學問題提供建議等功能。

如要使用視覺版「高階語音模式」,點擊ChatGPT對話欄旁的語音圖案,然後點擊底部左方的影片圖案。如果希望分享畫面,點擊三點選單,再選擇「分享畫面」即可。

OpenAI表示,視覺版「高階語音模式」12日開始陸續推出。但不是人人都能用得到,OpenAI表示,ChatGPT Enterprise和Edu訂戶需待明年1月才能取得新功能,且目前尚無時間表提供給歐盟國家、瑞士、冰島、挪威和列支敦斯登的ChatGPT用戶使用。

最近在CBS《六十分鐘時事雜誌》節目上,OpenAI主席布羅克曼(Greg Brockman)安排了視覺版「高階語音模式」考驗主持庫珀(Anderson Cooper)的解剖學技巧。當庫珀在黑板上把身體部位畫出來時,ChatGPT可以理解到他正在畫什麼,例如「腦袋在頭裡的右方」等。

但在同一次示範中,視覺版「高階語音模式」在一條幾何學問題上犯錯,反映它容易產生幻覺。

視覺版「高階語音模式」推出時間曾多次延宕,據報部份原因是OpenAI還沒準備就緒就宣布這項功能。今年4月,OpenAI承諾「幾周內」向用戶推出「高階語音模式」,但幾個月後卻透露它還需要更多時間。

雖然「高階語音模式」今秋終於向部份ChatGPT用戶推出,但它缺乏視覺分析功能。在推出視覺版前,OpenAI一直著重為其他平台和歐盟用戶加入純語音版「高階語音模式」。

除了視覺版「高階語音模式」,OpenAI同日也推出「聖誕老人模式」應節,為ChatGPT預設聲音加入聖誕老人聲音。只要點擊ChatGPT應用程式提示欄旁的雪花圖案,用戶就能找到這把聖誕老人聲音。

科技-三藩市版