OpenAI新AI處理模式 降低成本犧牲速度

為了可以更進取與谷歌等人工智能(AI)公司競爭,OpenAI推出全新應用程式開發介面(API)選項「Flex處理模式」,使用費用比較低,但犧牲回應速度,偶爾會出現無適用資源的狀況。

科技新聞網站TechCrunch報道,OpenAI表示,Flex處理模式是OpenAI近日推出的o3和o4-mini推理模型的測試版,主要用於模型評估、數據強化和非同步的工作量等低優先順序和「非生產力」的任務。

Flex處理模式將API成本砍半。以o3為例,Flex處理模式的成本為每百萬輸入詞元(token,75萬個字元)5元,每百萬輸出詞元為20元,僅及一般輸入(10元)及輸出詞元(40元)成本的一半。至於o4-mini,Flex處理模式將一般輸入(每百萬詞元1.10元)和輸出詞元(4.40元)的成本分別降至0.55元和2.20元。

Flex處理模式推出之時,前沿AI的價格繼續下降,且OpenAI對手持續推出更低廉、更有效率的預算導向模型。谷歌本周就推出推理模型Gemini 2.5 Flash,在較低輸入詞元成本下,效能與中國公司「深度求索」(DeepSeek)R1相當或更勝一籌。

在向客戶發出公布Flex價格的電郵中,OpenAI表明,第1至第3使用等級的開發人員必須完成新增的身份驗證程序才能使用o3。除了o3,其他模型的推理摘要和串流API支援也要進行驗證才能存取。本報訊

科技-三藩市版