首頁 > AI資訊 > 最新資訊 > 年末重磅!ByteDanceResearch視頻理解大模型「眼鏡猴」正式發(fā)布

年末重磅!ByteDanceResearch視頻理解大模型「眼鏡猴」正式發(fā)布

新火種    2025-02-21

最近,ByteDance Research 的視頻理解大模型眼鏡猴(Tarsier) 迎來了巨大更新,發(fā)布了第二代模型 Tarsier2 及相關技術報告。研究團隊此前發(fā)布的 Tarsier-7B/34B 在視頻描述領域已經是最強開源模型,僅次于閉源模型 Gemini-1.5-Pro 和 GPT-4o。那么這次新版 Tarsier2 又會帶給我們什么樣的驚喜呢?

直接上強度!來看看 Tarsier2 對下面這兩個影視名場面的理解如何:

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章