OpenAI新開發介面AI語音回應效率提高

人工智能(AI)公司OpenAI 1日舉行DevDay活動,公布多項新工具,包括其「即時應用程式開發介面」(Realtime API)的公開測試版,可提供低延遲且由AI生成的語音回應。

科技新聞網站TechCrunch報道,新功能「即時應用程式開發介面」將協助開發人員在其程式裡建造接近即時的語音經驗,且可使用OpenAI提供的六種聲音之一。這些聲音有別於ChatGPT裡面提供的聲音,且為避免版權糾紛,開發人員無法使用第三方的聲音。

OpenAI開發人員經歷部門主任休特(Romain Huet)分享了一段示範帶,顯示一個「即時應用程式開發介面」開發的旅行規劃程式,容許用戶口頭與一位AI助理溝通,討論一趟即將前往倫敦的旅程,並獲得AI低延遲的回應。「即時應用程式開發介面」也可存取多種工具,因此它可以在回答時在地圖上標記位置。

OpenAI同日宣布,為其API引入視覺微調功能,讓開發人員利用圖像和文字來微調他們的GPT-4o應用。邏輯上,此舉應有助開發人員改善GPT-4o涉及視覺理解的工作表現。

OpenAI透露有300多萬名開發人員使用它的AI模型進行開發工作。本報訊

科技-三藩市版