
微軟人工智能(AI)部門執行長蘇萊曼(Mustafa Suleyman)17日在社交平台Bluesky宣布,能夠解讀用戶畫面和協助用戶使用應用程式的AI助理功能Copilot Vision,現已可於瀏覽器Edge上免費使用。微軟描述Vision是一種「以談話為基礎的體驗」,用戶透過說話輸入指令後等待Copilot回應。
蘇萊曼表示,如果用戶選用這項功能,Copilot Vision「可以直接看到「用戶屏幕上的內容」。他建議,用戶烹飪時可請Copilot Visio引導他們一步一步完成食譜,或幫用戶「解碼」職缺內容以「直接開始客製化的面試準備或思考求職信的內容」。根據微軟支援頁面,Copilot Vision可以突顯畫面的部份內容來幫助用戶尋找相關資訊,但不會代用戶點擊任何連結或做任何事。
整體來說,Copilot Vision功能仍限於Copilot Pro訂戶使用。透過訂閱,Vision擴大至Edge以外,讓用戶可以指示它協助他們使用Photoshop功能或視頻剪輯軟件,或指導他們完成《Minecraft》等遊戲。
如要試用Copilot Vision,透過Edge瀏覽器打開http://microsoft.com/edge/copilot/vision,就會提示用戶選擇加入這項功能。在用戶允許後,他們瀏覽一個網站時可以打開Copilot側邊欄,點擊麥克風圖示,聽到提示音時即啟動Vision對話,瀏覽器的色調也會隨之產生變化。
微軟表示,雖然它會記錄Copilot給用戶的回應,但不會收集用戶進行Copilot Vision對話時輸入的內容、圖像或頁面。當用戶準備好停止與Copilot分享畫面時,只要結束對話或關閉瀏覽器即可。本報訊