免费九九视频,日韩精品在线国产丝袜,欧美一级片免费在线

首頁 > AI資訊 > 行業動態 > 微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

新火種 2024-04-24

Llama 3發布剛幾天，微軟就出手截胡了？

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

剛剛發布的Phi-3系列小模型技術報告，引起AI圈熱議。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

其中僅3.8B參數的Phi-3-mini在多項基準測試中超過了Llama 3 8B。

為了方便開源社區使用，還特意設計成了與Llama系列兼容的結構。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

微軟這次打出“手機就能直接跑的小模型”的旗號，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

這意味著，現在手機上能本地運行的最佳開源模型，已經做到ChatGPT水平。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

在技術報告中還玩了一把花活，讓phi-3-mini自己解釋為什么構建小到手機能跑的模型很令人驚嘆。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

除了mini杯之外，小杯中杯也一并發布：

Phi-3-small，7B參數，為支持多語言換用了tiktoken分詞器，并額外增加10%多語種數據。

Phi-3-medium，14B參數，在更多數據上訓練，多數測試中已超越GPT-3.5和Mixtral 8x7b MoE。

（大杯他們目前不打算做）

作者陣容一看也不簡單，一眼掃過去MSRA和MSR雷蒙德團隊都投入了不少人。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

那么，Phi-3系列到底有什么獨特之處呢？

根據技術報告中披露，其核心秘訣就在于數據。

去年團隊就發現，單純堆砌參數量并不是提升模型性能的唯一路徑。

反而是精心設計訓練數據，尤其是利用大語言模型本身去生成合成數據，配合嚴格過濾的高質量數據，反而能讓中小模型的能力大幅躍升。

也就是訓練階段只接觸教科書級別的高質量數據，Textbooks are all you need。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

Phi-3也延續了這一思路，這次他們更是下了血本:

投喂了多達3.3萬億token的訓練數據（medium中杯是4.8萬億）大幅強化了數據的”教育水平”過濾更多樣化的合成數據，涵蓋邏輯推理、知識問答等多種技能獨特的指令微調和RLHF訓練，大幅提升對話和安全性

舉個例子，比如某一天足球比賽的結果可能對于大模型是良好的訓練數據，但微軟團隊刪除了這些加強知識的數據，留下更多能提高模型推理能力的數據。

這樣一來，對比Llama-2系列，就可以用更小的參數獲得更高的MMLU測試分數了。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

不過小模型畢竟是小模型，也不可避免存在一些弱點。

微軟透露，模型本身參數中沒能力存儲太多事實和知識，這一點也可以從TriviaQA測試分數低看出來。

緩解辦法就是聯網接入搜索引擎增強。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

總之，微軟研究院團隊是鐵了心了要在小模型+數據工程這條路上走下去，未來還打算繼續增強小模型的多語言能力、安全性等指標。

對于開源小模型超過ChatGPT這回事，不少網友都認為壓力現在給到OpenAI這邊，需要趕快推出GPT-3.5的繼任者了。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

Tags:

模型網友

NVIDIA深度適配通義千問大模型，推出艙駕融合大模型解決方案

2024-09-20

NVIDIA深度適配通義千問大模型推出艙駕融合大模型解決方案

2024-09-20

哈啰亮相2024云棲大會：展示AI整體布局及大模型案例

2024-09-20

在線可玩！智譜開源圖生視頻模型，網友直呼Amazing！

2024-09-20

奧特曼：o1僅僅是“推理模型的GPT-2”；黃仁勛：我給你加速50倍

2024-09-20

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

微軟推出iPhone能跑的ChatGPT級模型，網友：OpenAI得把GPT-3.5淘汰了

NVIDIA深度適配通義千問大模型，推出艙駕融合大模型解決方案

NVIDIA深度適配通義千問大模型推出艙駕融合大模型解決方案

哈啰亮相2024云棲大會：展示AI整體布局及大模型案例

在線可玩！智譜開源圖生視頻模型，網友直呼Amazing！

奧特曼：o1僅僅是“推理模型的GPT-2”；黃仁勛：我給你加速50倍

熱門文章