大視覺語言模型基準數據集ReForm-Eval:新瓶裝舊酒,給舊有的基準數據集換個形式就能用來評估新的大視覺語言模型
概要復旦DISC實驗室推出了ReForm-Eval,一個用于綜合評估大視覺語言模型的基準數據集。ReForm-Eval通過對已有的、不同任務形式的多模態基準數據集進行重構,構建了一個具有統一且適用于大模型評測形式的基準數據集。所構建的ReForm-Eval具有如下特點:構建了橫跨8個評估維度,并為每
概要復旦DISC實驗室推出了ReForm-Eval,一個用于綜合評估大視覺語言模型的基準數據集。ReForm-Eval通過對已有的、不同任務形式的多模態基準數據集進行重構,構建了一個具有統一且適用于大模型評測形式的基準數據集。所構建的ReForm-Eval具有如下特點:構建了橫跨8個評估維度,并為每
如果從chatGPT正式發布算起,不到一年的時間,這場席卷全球的AI大模型風暴正在顛覆一切,包括此刻的中國企業。
《科創板日報》11月22日訊(記者 郭輝) 寒武紀擬以2億元增資其上海子公司。寒武紀今日(11月22日)晚間發布公告稱,經董事會審議通過,同意新增全資子公司上海寒武紀作為“面向新興應用場景的通用智能處理器技術研發項目”的實施主體。同時,基于目前募投項目實施進展情況,擬使用募集資金1500萬元人民幣對
2024年12月26日,深度求索(DeepSeek)發布了其最新人工智能(AI)大模型DeepSeek-V3,并同步開源,刷屏中外AI圈。DeepSeek在兩年內就成功開發出一款性能比肩國際頂尖的AI模型,成本僅為557萬美元,與OpenAI 7800萬美元的GPT-4訓練成本形成鮮明對比。 聊天