聊天機器人升級 可接受音像查詢

聊天機器人ChatGPT又添新本領,可以透過語音和圖像展開對話。OpenAI

本報訊

人工智能(AI)公司OpenAI的AI聊天機器人ChatGPT推出重大更新,可處理語音或圖像的查詢。用戶只要使用Android和iOS版本的ChatGPT,就可以跟機器人展開對話,而在所有平台上則可利用圖像進行查詢。

OpenAI稱,這些新功能會陸續推出,付費的Plus和企業用戶將優先可用,其他用戶稍後將可使用圖像查詢功能。

OpenAI在宣布該項更新的官方博文中說,如果想試用語音對話,用戶需要打開ChatGPT智能程式,前往設定,點選「New Features」(新功能),然後選擇啟動語音對話。透過點擊麥克風按鈕,用戶就能從五種不同聲線作出選擇。

OpenAI表示,這些來回語音對話由一款新文字轉語音模型驅動,該模型可以從文字和數秒語音樣本就能產生「仿真人的音訊」。在專業演員協助下,它可創造五種聲線。另一方面,該公司的Whisper語音辨識系統會將用戶的口語轉換成為文字。OpenAI舉例語言對話可用來說故事、講笑話或回答問題等。

用圖像查詢的功能也相當有趣。OpenAI舉例說,用戶可以向ChatGPT展示一張烤爐的照片,問它為何沒打開,又或者根據冰箱裡的照片請它幫忙規劃食譜,也可以拍一張數學題的照片尋求它幫忙解答。用戶可以展現多張圖片,或者用畫圖工具圈出圖中重點。

OpenAI是與免費程式Be My Eyes合作提供該項新增的圖像功能。Be My Eyes 程式專門幫助視障人士更好理解他們身邊四周環境,這歸功於跟使用者進行視訊通話的義工。OpenAI提到,會限制ChatGPT如何分析圖中出現的人以及與對方作出直接陳述,OpenAI解釋說,畢竟ChatGPT的功能不是總是百分之百準確,而且這些系統應尊重個人隱私。該公司也承認,ChatGPT辨認圖像內的英文甚於其他語言,尤其是非羅馬拼音為基礎的語言。

科技-三藩市版