Hugging Face發布超小AI模型

Hugging Face發布了號稱最小的AI模型。Hugging Face

據TechCrunch報道,AI開發平台Hugging Face的團隊發布了號稱最小的AI模型,可以分析圖像、短視頻和文本。

SmolVLM-256M和SmolVLM-500M兩款模型的設計目的,是能在「受限的裝置」上運作良好,例如內存不足1GB的筆記本電腦。研究團隊表示,這兩款產品也非常適合想要以很低廉的價格處理大量資料的開發人員。

SmolVLM-256M和SmolVLM-500M的參數大小分別只有2.56億個和5億個(參數大致相當於模型解決問題的能力),都可以執行描述圖片或視頻片段等任務,以及回答有關PDF及其中的文字圖表等元素的問題。

Hugging Face團隊使用了The Cauldron(包含50個「高品質」圖文資料集)和Docmatix(搭配詳細圖說的文檔掃描)來訓練SmolVLM模型。兩個數據集都是由致力於開發多模態AI技術的Hugging Face的M4團隊建立。

研究團隊宣稱,兩款小AI模型在包括AI2D在內的基準測試中,表現都優於更大的Idefics 80B模型。AI2D測試AI模型分析小學科學圖表的能力。兩款小模型均在可在網上使用,也可通過Apache 2.0開源協議從Hugging Face下載,這表示它們可以不受限制地使用。

像SmolVLM-256M和SmolVLM-500M這樣的小模型可能既便宜又多樣化,但也可能包含一些在大模型中沒有那麼明顯的缺陷。Google DeepMind、微軟研究院和魁北克Mila研究所最近一項研究發現,許多小型模型在複雜推理任務上的表現比預期的差。本報訊

科技-三藩市版