收到郵件了吧?GPT
機器之心報道
編輯:杜偉、梓文
谷歌與 OpenAI 多模態之爭白熱化,兩家先后被曝出了正在研發的多模態大模型或工具。
本月初,OpenAI 官宣了其首屆開發者大會「OpenAI DevDay」將于兩個月后召開,引發熱議。很多網友猜測 OpenAI 將在大會上發布多模態大模型,比如 GPT-4-Vision。
今天,關于 OpenAI 的多模態大模型又有了新的消息。
多模態大模型「Gobi」能成真嗎?
根據外媒 The Information 的說法,OpenAI 與谷歌正陷入一場曠日持久的大模型競賽,瞄準了下一代多模態大模型。這類模型可以處理文生圖任務、生成代碼或者輸出可視化圖表等。

OpenAI 聯合創始人兼總裁 Greg Brockman(左)與谷歌 DeepMind 聯合創始人兼 CEO Demis Hassabis(右)
在這場競賽中,谷歌幾天前被傳開始小范圍測試多模態 ML 工具 Gemini,比訓練 GPT-4 算力大 5 倍,多模態能力大大提升。谷歌希望借此扭轉與 OpenAI 在大模型領域的劣勢。但很顯然,OpenAI 不希望看到這一幕在將來發生。
據一位知情人士透露,OpenAI 正緊鑼密鼓地將 GPT-4 與類似于 Gemini 提供的多模態功能結合起來。OpenAI 雖然在 3 月份發布 GPT-4 的時候預覽了相關多模態功能,但并沒有推廣開來。幾個月后,OpenAI 又準備在更大的范圍內推出 GPT-Vision 功能,但也沒有正式發布。
至于為何遲遲沒有推出,OpenAI 主要擔心視覺功能會被人不當地使用,比如通過面部識別來跟蹤人或者冒充人類自動解決驗證碼。但隨著時間推移,OpenAI 似乎終于有能力解決由這類問題引發的技術擔憂了。
因此,在 GPT-Vision 之后,OpenAI 被曝可能會推出更加強大的多模態大模型,名為 Gobi。與 GPT-4 不同的是,Gobi 一開始就被設計為多模態。不過 OpenAI 還沒有開始訓練該模型,所以 Gobi 最終能成為 GPT-5 的定論下的還為時尚早。
此外,OpenAI 還希望搶在谷歌發布 Gemini 之前推出 Gobi。

圖源:推特 @amir
至于在這場多模態大模型之爭中,究竟誰能先拔頭籌,我們拭目以待。
OpenAI 還發布了新模型
與此同時,除了被曝出多模態大模型之外,OpenAI 還「悄咪咪」地發布了新的模型。
不少網友都收到了這封來自 OpenAI 團隊的信件。OpenAI 推出了 GPT-3.5-Turbo-Instruct,用來替代原先的一些模型,如 text-davinci-003。

該模型是 InstructGPT 3.5 類模型,并且訓練方式與之前的 Instruct 型號類似,如 text-davinci 系列,同時保持了與 turbo 模型相同的速度。該模型的定價與 GPT-3.5-turbo 4K 相同。
推特用戶 @hwchase17 說到,該版本模型可以在就舊的完成端點使用,并表示這個版本很「健談」,但是作為智能體的話并不理想。

有網友在使用過程中表示,該模型在一些情況下能更好的完成工作。例如,用戶想讓它生成較大的代碼塊時,它不會只是給出一個示例,而是直接生成一個很長的代碼。
參考鏈接:https://www.theinformation.com/articles/openai-hustles-to-beat-google-to-launch-multimodal-llm
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。