在視覺(jué)提示中加入「標(biāo)記」,微軟等讓GPT
機(jī)器之心報(bào)道編輯:杜偉、小舟全新視覺(jué)提示方法 SoM(Set-of-Mark),讓 OpenAI 多模態(tài)大模型 GPT-4V 在視覺(jué)內(nèi)容理解方面有了質(zhì)的提升。最近一段時(shí)間,我們見(jiàn)證了大型語(yǔ)言模型(LLM)的顯著進(jìn)步。特別是,生成式預(yù)訓(xùn)練 Transformer 或 GPT 的發(fā)布引領(lǐng)了業(yè)界和學(xué)術(shù)界的