首頁 > AI資訊 > 最新資訊 > 殺瘋了!6年來最強模型GPT-4.5登場:更貴、更高情商、更少幻覺|鈦媒體AGI

殺瘋了!6年來最強模型GPT-4.5登場:更貴、更高情商、更少幻覺|鈦媒體AGI

新火種    2025-04-06

(圖片來源:鈦媒體AGI編輯林志佳拍攝)

今晨4點,GPT-4.5突然上線。

2月27日消息,鈦媒體AGI獲悉,美國OpenAI公司今天推出GPT-4.5模型(代號Orion),這是該公司有史以來算力和數據規模最大、最佳的 AI 基座模型,本周將面向每月200美元的ChatGPT Pro用戶開放,下周向ChatGPT Plus開放。

GPT-4.5從一開始就不是一個推理模型。OpenAI表示,GPT-4.5在擴展預訓練和后訓練方面向前邁出了一步,通過擴展無監督學習,GPT-4.5提高了識別模式、建立聯系和產生創造性見解的能力,而無需推理,此外,GPT-4.5計算效率比 GPT-4 提升了 10 倍以上,而價格層面,GPT-4.5 API每100萬token輸入75美元,輸出價格為150美元,這比GPT-4o的2.5美元暴漲30倍,更是競爭對手 Claude 3.7 Sonnet 的25 倍。

盡管OpenAI CEO奧爾特曼(Sam Altman)沒現身在發布會現場,但他發推文表示,“GPT?4.5 讓他第一次感覺像在與一個有思想的人在交談,可以從模型那里得到真正好的建議。不過壞消息是,這是一個龐大而昂貴的模型,真的很想同時推出Plus 和 pro 版本,但是我們GPU計算卡已經不夠了。下周我們將添加數萬張GPU卡。”

“(我)在醫院照顧我的孩子。團隊已經成功了!”奧爾特曼稱。

6年來最強模型發布:更貴、更高情商、更少幻覺

據悉,從GPT-1到即將發布的GPT-4.5,經歷了6年之久。

2018年,6月OpenAI發布GPT-1,這是OpenAI第一個基于Transformer架構大規模預訓練的語言模型;2019年,OpenAI發布GPT-2,模型規模擴大10倍,擁有 1.5 億個參數,在生成文本方面展現出強大能力,但因潛在濫用風險,OpenAI以內測形式使用。

2020年,5月OpenAI推出GPT-3,擁有1750億個參數,在自然語言處理任務上表現驚人,能完成生成文本、回答問題、翻譯等多種任務,而到了2022年,GPT-3.5發布,OpenAI利用人工標注數據和強化學習提升了模型性能,同年11月30日,基于GPT-3.5的 AI 聊天機器人產品ChatGPT發布,風靡全球。

2023年3月14日,OpenAI發布GPT-4,語言理解能力更強大,能處理圖像內容,對月訂閱費20美元的Plus用戶開放使用,隨后11月,OpenAI在首屆開發者大會上宣布GPT-4升級為GPT-4 Turbo。

到了2024年,5月OpenAI推出可免費使用的多模態模型GPT-4o,7月18日推出GPT-4o mini;9月12日,OpenAI正式對外發布o1模型的預覽版,同時發布了o1-mini。此外,12月5日,OpenAI發布正式版OpenAI o1模型,隨后還公布o3-mini系列,性能和性價比都超越o1模型。

然而,在開源AI模型DeepSeek V3/R1,以及馬斯克的競購動作影響下,今年2月13日,一切都變了,OpenAI終于不再“擠牙膏”,整個產品線全面加速,最快今年發布GPT-5模型。

奧爾特曼在推文中承認,OpenAI已經意識到自家的模型和產品供應已經變得非常復雜,需要簡化產品供應。“我們和您一樣討厭模型選擇,并希望回到魔法般的統一智能。我們的首要目標是通過創建可以使用我們所有工具、知道何時需要長時間思考、并且通常可用于非常廣泛的任務的系統來統一 o 系列模型和 GPT 系列模型。”奧爾特曼表示。

奧爾特曼表示,OpenAI將很快(幾周/月內)發布代號為“Orion”(獵戶座)的 GPT-4.5,也是最后一個非思維鏈模型,并且會整合GPT和o系列,即將(數月內)推出具備多項新功能的GPT-5。

奧爾特曼強調,此前公布的推理模型o3將不會以獨立模型形式發布。最重要的是,免費版ChatGPT能在標準智能設置下無限制地使用GPT-5基礎班進行對話,不過會有防止濫用,而Plus/Pro付費用戶將以更高的智能水平使用GPT-5。顯然,GPT-5也將成為該公司第一個世界模型。

如今,OpenAI首先發布GPT-4.5——這是該公司6年來規模最大、價格最貴、更高情商、更少幻覺的模型。

OpenAI表示,GPT-4.5在預訓練和后訓練的擴展上取得進展,通過擴展無監督學習提升了模式識別等能力。

能力提升方面,早期測試顯示,GPT-4.5交互更自然,它知識基礎更廣,能更好理解用戶意圖,“情商”更高,可減少幻覺,在寫作、編程和解決實際問題等任務中表現出色。SimpleQA(評估模型的事實性回答能力)數據集測試中,GPT-4.5準確率達62.5%,高于GPT-4o、o3 mini系列等;幻覺率低至37.1%,遠遠優于GPT-4o等。

同時,GPT-4.5擁有無監督學習擴展,通過擴展計算、數據及架構和優化創新,提升了世界模型的準確性和直覺,擁有更廣泛知識和對世界更深入理解,并且用小模型數據訓練大模型,提升了GPT-4.5的可控性、對細微差別的理解及自然對話能力,而且訓練采用新的監督技術,結合傳統方法,在部署前進行安全測試,相關評估結果將發布在系統當中。

在與人類測試者的對比評估中,GPT-4.5在創意智能、專業查詢和日常查詢方面相比4o有更高勝率,表現出更強的審美直覺和創造力,在日常查詢當中能夠達到57%,專業查詢達63.2%。此外,雖然GPT-4.5沒有深度思考,但未來推理將成模型核心能力,所以GPT-4.5采用預訓練和推理兩種擴展方法相互補充。

使用方式層面,ChatGPT Pro用戶即日起可在模型選擇器中選用,下周起向Plus和Team用戶推出,再下周面向Enterprise和Edu用戶,該版本支持搜索獲取最新信息、文件和圖像上傳及使用畫布處理寫作和代碼,但暫不支持語音、視頻和屏幕共享等多模態功能;而API層面,在Chat Completions API、Assistants API和Batch API中向所有付費開發者預覽,支持函數調用等關鍵功能及圖像輸入視覺功能,適用于寫作輔助等應用場景。但因模型大且計算密集,成本較高,官方正評估是否長期在API中提供。

Box AI CEO Aaron Levie表示,其將于今天晚些時候在 Box AI Studio 中向客戶推出GPT-4.5版本。通過早期測試看,與 GPT-4o 相比,GPT-4.5 正確提取的字段準確率提高了 19 個百分點,凸顯了其處理細微合同數據的能力有所提高,看到 GPT-4.5 在處理復雜企業數據方面取得了強勁成果,這將在企業中解鎖更多用例。

Cognition 聯合創始人兼 CEO Scott Wu 分享了使用 GPT-4.5 的體驗,表示非常棒。在他們的智能體編碼基準測試中,GPT-4.5 相較于 o1 和 4o 實現大幅改進。同時發現一個有趣的數據點:雖然 GPT-4.5 和 Claude 3.7 Sonnet 在整體基準測試中得分相似,但他們發現 GPT-4.5 在涉及架構和跨系統交互的任務上峰值更大,而 Claude 3.7 Sonnet 在原始編碼和代碼編輯上峰值更大。

OpenAI表示,GPT-4.5處于無監督學習前沿,還無法完全替代GPT-4o。

OpenAI將與kimi、DeepSeek同時“撞車”

事實上,2022年11月30日之前,OpenAI的網站流量幾乎為零。但隨后的兩個月里,OpenAI受到了超過1億訪問者的沖擊,所有人爭相體驗ChatGPT,自那以后,所有人的生活都不一樣了,尤其是公司CEO奧爾特曼,成為了一名 AI 技術“布道師”和行業指引者。

如今,OpenAI估值超過1570億美元(約合人民幣1.1萬億元)

近期奧爾特曼公開表示,OpenAI正考慮基于使用量進行定價。至于何時能夠實現AGI,他稱當一個AI系統能夠完成一個非常熟練的人在重要工作中所能做的事情時,就可以稱之為AGI。

有趣的是,今天凌晨,月之暗面kimi再一次“撞車”,悄悄公布最新Kimi-K1.6-IOI-high模型,其在LiveCodeBench基準測試榜單上排名第一,超越了GPT和Claude系列模型。

同時,DeepSeek開源周持續引發關注,包括已發布專為英偉達Hopper GPU打造的MLA解碼內核FlashMLA、EP通信庫DeepEP、FP8 GEMM(通用矩陣乘法)計算庫DeepGEMM等。預計今天上午9點左右,DeepSeek還會在X平臺上發布全新開源技術。

據公開信息,2024年全年,OpenAI銷售收入大約37億美元,同比增長1700%以上,而預計到2025年,OpenAI年化收入將增長至116億美元,其中,75%收入來自用戶ChatGPT Plus服務訂閱。內部預估,2029全年OpenAI營收將達到1000億美元,相當于目前雀巢的年銷售額。

(作者|林志佳)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章