OpenAI“草莓”推理大模型兩周內(nèi)就要上架?用戶恐將面臨耐心考驗
財聯(lián)社9月11日訊(編輯 史正丞)沉寂了數(shù)月的全球AI龍頭OpenAI,似乎馬上要有大動作了。
根據(jù)《信息報》周二援引多名知情人士報道,OpenAI計劃在大約兩周時間里,正式推出以推理能力為核心的“草莓”AI模型,并加入ChatGPT服務(wù)。由于OpenAI CEO奧爾特曼等人對“草莓”的大力宣傳,疊加公司的確也有一陣子沒有令人興奮的消息了,外界對于這個新產(chǎn)品也算是有一定的期待。
會主動“沉思”的大模型
報道稱,作為以推理為賣點的大模型,“草莓”在面對復(fù)雜、多步驟的提問時,會比現(xiàn)在的GPT-4o能力更強、更加易用。
在使用GPT-4o時,如果要提出一個多步驟推理的問題,為了避免機器胡亂回答,用戶往往需要明確告知機器人解答問題時的每一個推理步驟——類似于輸入“思考鏈的提示詞”。使用“草莓”時則沒有那么麻煩,輸出的結(jié)果也會更好。例如,這個模型能夠解答《紐約時報》字謎游戲。
(來源:《紐約時報》)因此,除了數(shù)學、代碼外,“草莓”也適合回答更加寬泛、主觀的問題。例如要求它“頭腦風暴”一個市場營銷策略,“草莓”給出的回答更加貼近用戶所在的實際場景,也更加關(guān)注細節(jié),例如生成一個以周為單位的執(zhí)行計劃。
造成回答質(zhì)量差異的核心原因,在于“草莓”模型不會立即回答用戶的提問,而是會進行“思考”,也會向用戶提出追加的問題,從而更加全面地給出答案。
當然,這個步驟也是“草莓”作為互聯(lián)網(wǎng)產(chǎn)品的潛在弱點——報道稱,模型可能需要10-20秒的時間才會開始回答問題。對于日益強調(diào)與AI實時交流的行業(yè)而言,付費用戶能否接受交互間隔拉大到十秒以上會是個問題。
更致命的問題是,在回答一些GPT-4o也能推理的問題(事實上人類至今都不清楚AI的能力邊界在哪里),“草莓”可能會出現(xiàn)思考一段時間后,只給出稍稍好一些的回答。體驗過這種差異的知情人士稱,結(jié)果的提升并不值得等待這么長時間,能做到“脫口而出”的GPT-4o反而體驗更好。
知情人士同時表示,在內(nèi)部測試中,“草莓”也出現(xiàn)難以記住對話歷史等問題。同時這個模型目前只能輸入和輸出文字,并不能處理圖像,尚未跨過關(guān)鍵的多模態(tài)門檻。
商業(yè)策略也是看點
即使爆料準確,這件事情的看點除了“草莓”本身的能力外,還有OpenAI對商業(yè)策略的考量。
根據(jù)早些時候的報道,OpenAI在內(nèi)部商討中,考慮給即將推出的推理專長“草莓”大模型,或下一代旗艦?zāi)P蚈rion訂一個更高的價格。更符合實際的操作是,OpenAI可能會在現(xiàn)有的ChatGPT Plus外新增一個付費檔次,提供“草莓”的無限制訪問或響應(yīng)速度提升。當然,這一切的前提是有大量用戶認可“草莓”能力的提升。
在目前的定價體系中,面向個人用戶的ChatGPT Plus每月收費20美元,企業(yè)用戶的收費標準介于每月25-60美元/每個賬號不等。
上個月曾經(jīng)有消息稱,OpenAI每月能通過企業(yè)服務(wù)和ChatGPT訂閱賺到2.83億美元的收入,但公司層面依然處于凈虧損的狀態(tài)。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。