OpenAI新AI模型o1懂得深思熟慮

OpenAI推出最新AI模型o1,ChatGPT付費用戶已可嘗試o1-preview。OpenAI

本報訊

OpenAI推出最新人工智能(AI)模型「o1」,並稱它比前幾代模型更能有效處理複雜的推理工作。OpenAI推出新模型之時,正值它面對開發更精密AI系統的競賽上越來越多競爭。

科技新聞網站Engadget報道,OpenAI在官網上表示,o1接受的訓練是「花更多時間徹底思考問題才做出回應,像人一樣」。OpenAI又指,透過訓練,這些模型「學習完善它們的思考過程,嘗試不同策略,認識它們的錯誤」。

OpenAI預期,保健研究員將利用新模型來註釋細胞定序數據,物理學家將使用新模型產生數學公式,軟件開發人員也會利用它們來進行軟件開發。

目前AI系統本質上是更高級的自動補全功能,透過統計數據來生成出回應,而不是透過實際「思考」問題,意味著它們實際上並沒有看起來的「聰明」。

例如,當Engadget嘗試利用ChatGPT等AI聊天機器人解決《紐約時報》的拼字比賽(Spelling Bee),它們摸索後產生了荒謬的結果。

但推出o1,OpenAI正「還原基本步」,透過這新式AI模型,實現真正的複雜問題解決和邏輯思維。

OpenAI一篇細述o1的網誌指出,新模型在物理、化學與生物學裡具有挑戰性的基準任務上的表現,與博士生相似,在數學和編寫程式方面也表現出色。例如,OpenAI目前的旗艦模型GPT-4o只能準確解決國際數學奧林匹亞競賽(International Mathematics Olympiad)一份考試的13%問題,遠低於o1的83%準確度。

但新模型並不包括瀏覽網站或上傳檔案和圖像等功能。據科技新聞網站The Verge指出,新模型處理提示的速度比GPT-4o慢很多。儘管思考速度減慢,但o1還沒解決亂出答案的「幻覺」問題。OpenAI研究長麥格魯(Bob McGrew)告訴The Verge︰「我們不能說我們解決了幻覺問題。」

o1仍屬於起步階段。OpenAI形容它為「預覽版」(preview),即日起僅向ChatGPT付費用戶推出,且限制他們每周可以問它的問題數目。同時OpenAI推出精簡版o1-mini,它稱這版本對編程特別有效。

科技-三藩市版