GPT-4o圖像生成今起免費(fèi)!奧特曼坐鎮(zhèn)緊急發(fā)布,指令遵循/文本控制表現(xiàn)驚艷
OpenAI全量開(kāi)放GPT-4o圖像生成能力,這回免費(fèi)用戶(hù)第一時(shí)間上車(chē)!

一夜之間,各種實(shí)測(cè)結(jié)果刷屏。最驚艷的莫過(guò)于對(duì)文本的處理能力。
比如,4o可以100%還原文字內(nèi)容,且指定文字?jǐn)[放位置。

還能像連續(xù)劇一樣,一邊準(zhǔn)確生成文字,一邊變換人物動(dòng)作。
仔細(xì)對(duì)比兩張圖,第一張白板中的男人倒影和第二張圖也對(duì)應(yīng)上了。

昨晚OpenAI突然宣布要開(kāi)個(gè)小直播發(fā)布,這回奧特曼出現(xiàn)了(前情:GPT-4.5發(fā)布時(shí)他由于帶娃沒(méi)來(lái))。
直播中展示了各種玩法,比如制作梗圖、文本渲染、多輪交互生成和指令遵循等。

直接現(xiàn)場(chǎng)咔嚓一張自拍,然后立馬轉(zhuǎn)成動(dòng)漫風(fēng)格。

順帶官方玩梗制作meme圖,要求在圖片中添加“feel the agi”。(沒(méi)錯(cuò),生成時(shí)還知道將小寫(xiě)換成更符合的大寫(xiě))

現(xiàn)在,打開(kāi)ChatGPT,即可嘗試這些能力。
實(shí)測(cè)生成速度很快(大約十幾秒一張),但普通用戶(hù)每天僅有3次體驗(yàn)機(jī)會(huì)。

API預(yù)計(jì)將在未來(lái)幾周內(nèi)逐步推出。
這波主打一個(gè)美觀(guān)又實(shí)用按照官方介紹,作為多模態(tài)模型的4o現(xiàn)在終于補(bǔ)齊了一塊重要拼圖——圖片生成。
而且主打一個(gè)美觀(guān)和實(shí)用兩手抓。

話(huà)不多說(shuō),我們直接來(lái)看其能力升級(jí)的具體表現(xiàn)。
各項(xiàng)能力大升級(jí)首先,OpenAI表示4o現(xiàn)在能精確融合符號(hào)和圖片了。
比如直接給一段文字,然后生成一張制作精美的菜單:

而且支持在多輪對(duì)話(huà)中逐步調(diào)整圖片內(nèi)容和風(fēng)格。
類(lèi)似下面這樣,提供一張貓貓?jiān)瓐D,然后一步步創(chuàng)建一個(gè)游戲角色:




此外還非常注重細(xì)節(jié),官方稱(chēng)4o可以處理多達(dá)10-20個(gè)不同的物體,而其他模型一般在處理5-8個(gè)物體時(shí)就會(huì)遇到困難。


除了上述,4o在生成真實(shí)圖像方面也表現(xiàn)出色。


連現(xiàn)實(shí)版“照貓畫(huà)虎”也有了(doge):

看完官方宣傳效果,網(wǎng)友們也趕緊來(lái)了一波實(shí)測(cè)~
經(jīng)典梗圖第一時(shí)間申請(qǐng)出戰(zhàn),畫(huà)面還真毫無(wú)違和感hhh。

甚至,復(fù)現(xiàn)同款書(shū)寫(xiě)圖也是不在話(huà)下:

話(huà)說(shuō)最近這兩天也過(guò)于熱鬧了,DeepSeek、OpenAI和谷歌幾乎同臺(tái)開(kāi)戰(zhàn)。

值得一提的是,昨晚11點(diǎn)(北京時(shí)間)OpenAI突然宣布將有小發(fā)布,而DeepSeek剛剛發(fā)布了DeepSeek-v3-0324的官方技術(shù)報(bào)告。
不知道是不是被DS逼出來(lái)的新發(fā)布呢?(doge)

- 免責(zé)聲明
- 本文所包含的觀(guān)點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀(guān)點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀(guān)點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。