久草影视在线,暴雨入室侵犯进出肉体免费观看,中文字幕日产乱码国内自

首頁 > AI資訊 > 最新資訊 > 開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

新火種 2024-04-11

能打得過GPT-4的開源模型出現了！

大模型競技場最新戰報：

1040億參數開源模型Command R+攀升至第6位，與GPT-4-0314打成平手，超過了GPT-4-0613。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

這也是第一個在大模型競技場上擊敗GPT-4的開放權重模型。

大模型競技場，可是大神Karpathy口中唯二信任的測試基準之一。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

Command R+來自AI獨角獸Cohere。這家大模型創業公司的聯合創始人兼CEO，正是Transformer最年輕作者Aidan Gomez（簡稱割麥子）。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

這份戰報一出，又掀起了一波大模型社區的熱烈討論。

大家伙兒興奮的理由很簡單：基礎大模型卷了一整年，沒想到在2024年格局還在不斷地發展變化。

HuggingFace聯合創始人Thomas Wolf就說：

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

另外，Cohere機器學習總監Nils Reimers還指出了值得關注的一點：

Command R+最大的特色是對內置RAG（檢索增強生成）進行了全面優化，而在大模型競技場中，RAG這樣的外掛能力并未納入測試。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單 RAG優化模型登上開源王座

在Cohere官方定位中，Command R+是一個“RAG優化模型”。

就是說，這個1040億參數的大模型主要針對檢索增強生成技術進行了深度優化，以減少幻覺的產生，更適配于企業級工作負載。

和此前推出的Command R一樣，Command R+的上下文窗口長度是128k。

此外，Command R+還具備以下特點：

覆蓋10+種語言，包括英語、中文、法語、德語等；能使用工具完成復雜業務流程的自動化

從測試結果來看，在多語種、RAG和工具使用這三個維度上，Command R+都達到了GPT-4 turbo的水平。

但在輸入成本方面，Command R+的價格僅為GPT-4 turbo的1/3。

輸出成本方面，Command R+則是GPT-4 turbo的1/2。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

正是這點引發了不少網友的關注：

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

不過，盡管在大模型競技場這種人類主觀評測上表現搶眼，還是有網友甩出了一些不同觀點。

在HumanEval上，Command R+的代碼能力就連GPT-3.5都沒打過，在兩組測試中分別排在32位和33位。

最新版GPT-4 turbo則沒有懸念地拿下了第一。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

另外，我們也在最近剛登上正經論文的弱智吧benchmark上簡單測試了一下Command R+的中文能力。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

你給打個分？

需要說明的是，Command R+的開源只面向學術研究，并不能免費商用。

One More Thing

最后的最后，還是多聊一嘴割麥子小哥。

Aidan Gomez，Transformer圓桌騎士中最年輕的一位，加入研究團隊時只是個本科生——

不過，是在多倫多大學讀大三時就加入了Hinton實驗室的那種。

2018年，割麥子被牛津大學錄取，開始像他的論文搭子們那樣攻讀CS博士學位。

但在2019年，隨著Cohere的創立，他最終選擇退學加入AI創業的浪潮。

Cohere主要是為企業提供大模型解決方案，目前估值達到了22億美元。

— 完 —

Tags:

戰報競技場

GPT-4omini排名雪崩，大模型競技場規則更新，奧特曼刷分小技巧無效了

2024-09-04

國產大模型全陣容，中文大模型競技場推出！

2024-06-01

3D生成競技場來了！比拼360°環繞視頻，最強模型由你pick

2024-05-30

黑馬！大模型競技場榜單更新，國產玩家首次進入全球總榜前10

2024-05-22

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

2024-04-11

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

GPT-4omini排名雪崩，大模型競技場規則更新，奧特曼刷分小技巧無效了

國產大模型全陣容，中文大模型競技場推出！

3D生成競技場來了！比拼360°環繞視頻，最強模型由你pick

黑馬！大模型競技場榜單更新，國產玩家首次進入全球總榜前10

開源模型首勝GPT-4！競技場最新戰報引熱議，Karpathy：這是我唯二信任的榜單

熱門文章