国产精品视频99,免费观看在线a毛片,亚洲图片欧美在线观看

首頁 > AI資訊 > 最新資訊 > 全靠用戶投票！GPT-4o、訊飛星火分列CompassArena大模型前二

全靠用戶投票！GPT-4o、訊飛星火分列CompassArena大模型前二

新火種 2024-08-21

8月2日消息，根據國內權威大模型評估平臺OpenCompass（司南）近日公布的CompassArena周榜，GPT-4o和科大訊飛的星火大模型分別占據了排行榜的前兩位。

榜單采用專業用戶投票方式，結合了用戶對各款大模型的真實體驗，更具客觀性和說服力，可謂是含金量十足。

全靠用戶投票！GPT-4o、訊飛星火分列CompassArena大模型前二

OpenCompass的評測體系涵蓋了學科、語言、知識、理解、推理等多個維度，能夠全面評估大模型的綜合能力。

在最新三期的評選中，訊飛星火以Elo-1078和Elo-1081的高分連續三周位列前三，并兩次獲得第二，顯示出其在大模型領域的強勁競爭力。

全靠用戶投票！GPT-4o、訊飛星火分列CompassArena大模型前二

值得注意的是，科大訊飛在今年6月27日發布的星火V4.0版本上，已完成了對GPT-4 Turbo的整體超越。

根據八個國際主流測試集的橫向評測，訊飛星火V4.0排名第一，在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面完成了整體超越。

此前，訊飛星火在《麻省理工科技評論》的橫評中也獲得了高分，憑借領先的語言能力、數學、理綜等多項核心能力，斬獲國產主流大模型榜首席位。

目前，訊飛星火的安卓端APP累計下載量已超過1.31億次，位列國內工具類通用大模型APP第一，持續領跑國內大模型第一梯隊。

Tags:

模型用戶

2024-09-20

2024-09-20

2024-09-20

2024-09-20

2024-09-20

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。