
阿里巴巴(9988)旗下AI旗艦應用夸克AI超級框近日發佈全新「AI相機」,基於視覺理解與思考推理模型,可深入理解使用者意圖,實現視覺搜尋、多輪問答、影像處理及創作。另外,該功能更可精準辨識圖片中的人物、物件和諸多細節,理解用戶需求及聯想相關問題。
可進行圖片搜尋及問答等
該項名為「拍照問夸克」的功能在手機和電腦上可進行圖片搜尋、問答、思考、編輯及創作,使用者可準確表達問題、獲取資訊,例如拍照搜尋文物時自動關聯歷史背景,上傳商品圖片時一鍵跳轉淘寶同款連結。無論是人物、動物、植物、建築、風景、美食、藝術品、商品、外文資料或故障代碼,夸克都能做到幾秒內識別,經過多輪問答和深度思考後,給出同類產品中的最佳答案。
此外,該功能還將搜尋、掃描、修圖、翻譯、創作等能力聚集一起。針對較為複雜的影像,使用者可一次上傳10張圖片進行深度推理並完成各類複雜任務。目前,夸克持續透過模型能力升級來優化AI Agent的組合策略,滿足使用者對影像資訊的需求。