OpenAI新AI處理模式降低成本犧牲速度

2025-04-19 05:57:00

為了可以更進取與谷歌等人工智能（AI）公司競爭，OpenAI推出全新應用程式開發介面（API）選項「Flex處理模式」，使用費用比較低，但犧牲回應速度，偶爾會出現無適用資源的狀況。

科技新聞網站TechCrunch報道，OpenAI表示，Flex處理模式是OpenAI近日推出的o3和o4-mini推理模型的測試版，主要用於模型評估、數據強化和非同步的工作量等低優先順序和「非生產力」的任務。

Flex處理模式將API成本砍半。以o3為例，Flex處理模式的成本為每百萬輸入詞元（token，75萬個字元）5元，每百萬輸出詞元為20元，僅及一般輸入（10元）及輸出詞元（40元）成本的一半。至於o4-mini，Flex處理模式將一般輸入（每百萬詞元1.10元）和輸出詞元（4.40元）的成本分別降至0.55元和2.20元。

Flex處理模式推出之時，前沿AI的價格繼續下降，且OpenAI對手持續推出更低廉、更有效率的預算導向模型。谷歌本周就推出推理模型Gemini 2.5 Flash，在較低輸入詞元成本下，效能與中國公司「深度求索」（DeepSeek）R1相當或更勝一籌。

在向客戶發出公布Flex價格的電郵中，OpenAI表明，第1至第3使用等級的開發人員必須完成新增的身份驗證程序才能使用o3。除了o3，其他模型的推理摘要和串流API支援也要進行驗證才能存取。本報訊

OpenAI新AI處理模式降低成本犧牲速度

最新⽂章

科技-三藩市版

亞利桑那槍案死者以AI「發聲」

青年洞悉商機創立Rove 購物也能賺哩程換機票

Threads測試投放影片廣告

引入Gemini Nano Chrome加強防詐騙

ChatGPT「深度研究」現可連接GitHub

Figma四款新工具產品設計一條龍

三星下周一發布超薄手機Galaxy S25 Edge

亞馬遜最新機器人Vulcan配備感測器

谷歌「簡化」網頁暫僅適用iOS用戶

杜絕AI Reddit檢測用戶是否真人

OpenAI新AI處理模式 降低成本犧牲速度

最新⽂章

科技-三藩市版

OpenAI新AI處理模式降低成本犧牲速度