Anthropic新AI模型 會花時間思考

Anthropic推出最新AI模型Claude 3.7 Sonnet。Anthropic

Claude 3.7 Sonnet可以在用戶要求下用更長時間思考。Anthropic

人工智能(AI)公司Anthropic發布一款全新的前沿AI模型Claude 3.7 Sonnet,能夠根據用戶的需求,對問題進行長時間「思考」。

Anthropic形容Claude 3.7 Sonnet為AI產業「首個混合型AI推理模型」,因為它是一個既能提供即時答案,又能對問題提供更深思熟慮答案的單一模型。用戶可以擇是否啟動這個AI模型的「推理」能力,觸發Claude 3.7 Sonnet進行短時間或長時間的「思考」。

科技新聞網站TechCrunch指出,這個模型代表了Anthropic致力於簡化其AI產品的用戶體驗。當前大部份AI聊天機器人都有一種讓用戶望而生畏的模型選擇器,強迫用戶從幾個不同成本和能力的模型選項做出選擇。而Anthropic寧願用戶不必思考這方面問題,在理想情況下單一模型就能完成所有工作。

Anthropic表示,Claude 3.7 Sonnet 24日向所有用戶和開發人員推出,但僅限於Claude高級付費計劃的用戶,才能使用其中的推理功能。Claude免費用戶則可使用Claude 3.7 Sonnet非推理的一般版本,Anthropic聲稱該一般版本比上一代Claude 3.5 Sonnet更優勝。Claude 3.7 Sonnet每100萬輸入詞元(token)成本為3元,每100萬輸出詞元則為15元。相較之下,OpenAI的o3-mini每100萬輸入和輸出詞元的成本分別為1.10元和4.4元,而中國「深度求索」(DeepSeek)每100萬輸入和輸出詞的成本分別為55仙和2.19元。

表面看來Claude 3.7 Sonnet成本較高,差異在於o3-mini和R1是嚴格的推理模型,而非像Claude 3.7 Sonnet那種混合式。

Claude 3.7 Sonnet是Anthropic首個可以「推理」的AI模型。隨著提高AI效能的傳統方法逐漸減少,不少AI實驗室已轉用這種技術。

o3-mini、R1、谷歌Gemini 2.0 Flash Thinking和xAI Grok 3等推理模型,往往花上更多時間和運算能力才能回答問題。它們將問題分拆為較小的步驟,從而提高最終答案的準確性。

Anthropic產品主任彭恩(Dianne Penn)受訪時稱,最終目標是Claude自行找出它應花多久時間來「思考」問題,毋須用戶預先選擇哪種模型。

科技-三藩市版