北京時間2026年4月24日,OpenAI正式發(fā)布了其迄今為止最智能、最直觀的AI模型——GPT-5.5。這款新模型不僅標志著AI能力的一次重大飛躍,更在運算效率和成本控制上實現(xiàn)了顯著突破,旨在徹底改變用戶使用計算機完成工作的方式。

GPT-5.5的核心升級在于其強大的Agent(智能體)能力。與以往需要用戶精細指導每一步的模型不同,GPT-5.5能夠理解用戶模糊、復雜的多部分指令,并自主進行任務(wù)規(guī)劃、調(diào)用工具、檢查結(jié)果并持續(xù)推進,直至完成。

OpenAI總裁格雷格·布羅克曼(Greg Brockman)強調(diào),這意味著用戶無需再事無巨細地管理每個步驟,只需將復雜任務(wù)交給GPT-5.5,它便能像一個真正的“研究伙伴”或“初級工程師”一樣獨立工作。

盡管模型能力大幅增強,GPT-5.5在性能與效率上卻實現(xiàn)了“魚與熊掌兼得”的優(yōu)化:運算速度更快:通過與英偉達(NVIDIA)的深度合作,GPT-5.5針對GB200/GB300 NVL72系統(tǒng)進行了聯(lián)合設(shè)計。在實際服務(wù)中,其每個Token的延遲與GPT-5.4持平,但通過模型自身優(yōu)化的負載均衡算法,Token生成速度反而提升了超過20%。Token成本大降:這是GPT-5.5的一大亮點。由于模型邏輯更精準,完成相同任務(wù)所需的Token數(shù)量顯著減少。在與英偉達的合作中,基于GB200 NVL72系統(tǒng)運行,百萬Token的成本降低至前代系統(tǒng)的三十五分之一,每兆瓦的Token輸出量更是提升了50倍。智能水平更高:在多個權(quán)威基準測試中,GPT-5.5均展現(xiàn)出超越前代及競品的智能水平。例如,在衡量復雜終端操作的Terminal-Bench 2.0測試中,其準確率高達82.7%(GPT-5.4為75.1%);在評估GitHub問題解決的SWE-Bench Pro中達到58.6%。

GPT-5.5的強大能力已在多個專業(yè)領(lǐng)域得到驗證,在Artificial Analysis的Coding Index中,它以競爭模型一半的成本提供了最先進的智能水平。早期測試者反饋,該模型在理解系統(tǒng)架構(gòu)、定位故障及預測審查需求方面能力顯著增強,能將原本耗時數(shù)天的調(diào)試周期縮短至數(shù)小時。在生物信息學基準測試BixBench中,GPT-5.5取得了80.5%的領(lǐng)先成績。更令人矚目的是,一個內(nèi)部版本的模型甚至協(xié)助發(fā)現(xiàn)了關(guān)于組合數(shù)學中“拉姆齊數(shù)”(Ramsey Numbers)的新證明,并通過了形式化驗證工具Lean的確認,展現(xiàn)了其在純數(shù)學前沿領(lǐng)域的原創(chuàng)貢獻潛力。OpenAI內(nèi)部財務(wù)團隊已利用該模型審核了超過7萬頁稅務(wù)文件,效率提升顯著。

參與內(nèi)測的用戶給予了極高評價。一位英偉達工程師甚至表示,失去GPT-5.5的訪問權(quán)限,“感覺就像肢體被截肢了一樣”。

目前,GPT-5.5已逐步向ChatGPT Plus、Pro、Business和Enterprise用戶開放。其API版本也即將上線,定價如下:

模型版本

輸入定價 (每百萬Token)

輸出定價 (每百萬Token)

GPT-5.5

5美元

30美元

GPT-5.5 Pro

30美元

180美元