Stable Diffusion新版本 圖像生成更具多樣化

圖像生成器Stable Diffusion推出3.5版本,遵從提示方面有進步。Stability AI

人工智能(AI)新創公司Stability AI的圖像生成器Stable Diffusion現已推出3.5版本,試圖修正Stable Diffusion 3 Medium備受批評的一些錯誤,比其他圖像生成器更好遵從提示,提高輸出品質跟其他大型模型競爭,又針對多元化風格、膚色和特徵進行調整,且毋須明確提示。

科技新聞網站Engadget報道,新模型有三種款式。第一種是Stable Diffusion 3.5 Large,是三者之中最強大,品質最高,在遵從提示上領先整個產業。Stability AI表示,該模型適合於1MP解析度的專業用途。

Stable Diffusion 3.5 Large Turbo則是「蒸餾」版本,專注於效率多於最高品質。Stability AI稱,Turbo版本仍會透過四個步驟產生「具有出色又迅速遵從提示的高品質圖像」。

最後一款是Stable Diffusion 3.5 Medium(25億個參數),為運行消費者硬件而設計,平衡品質與簡單性。由於更容易客製, 它可產生0.25到2MP解忻度的圖像。但有別於現已推出的前兩者,Stable Diffusion 3.5 Medium最快等到10月29日才正式推出。

雖然Stability AI僅於它的網誌稍為提及新模型,但3.5系統擁有新篩選器來更好反映人類的多元性。該公司將新模型的真人輸出描述為「可代表全世界,不僅一種人,有不同膚色和特徵,毋須大量的提示」。本報訊

科技-三藩市版