首頁 > AI資訊 > 最新資訊 > 雷軍花千萬挖人、頭部量化私募創(chuàng)立、95后AI“天才少女”,這家AI公司刷屏

雷軍花千萬挖人、頭部量化私募創(chuàng)立、95后AI“天才少女”,這家AI公司刷屏

紅星資本局    2024-12-31

  紅星資本局12月30日消息,近日,國(guó)產(chǎn)大模型DeepSeek在全球爆火,并帶火95后AI“天才少女”羅福莉。據(jù)悉,羅福莉曾在DeepSeek參與了DeepSeek-V2的研發(fā),是這款模型的關(guān)鍵開發(fā)者之一。

  AI的風(fēng)狂吹,小米創(chuàng)始人雷軍聞聲而動(dòng),在DeepSeek-V3發(fā)布前幾天,其已開出千萬元年薪招攬羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì)。今年11月,小米還成立了專門的AI平臺(tái)部。

“AI界拼多多”面世

來自量化資管巨頭幻方量化

  近日,國(guó)內(nèi)AI初創(chuàng)公司DeepSeek發(fā)布了新一代大語言模型DeepSeek-V3,同時(shí)宣布開源。在多項(xiàng)基準(zhǔn)測(cè)試中,V3的成績(jī)超越了主流開源模型,并和世界頂尖的閉源模型不分伯仲。

  同時(shí),由于其極低的訓(xùn)練成本,DeepSeek-V3被稱為“AI界拼多多”。

  據(jù)最新發(fā)布的技術(shù)報(bào)告,DeepSeek-V3參數(shù)量為671B,激活參數(shù)為37B,使用的預(yù)訓(xùn)練token量為14.8萬億。其多項(xiàng)評(píng)測(cè)成績(jī)超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他開源模型。此外,其訓(xùn)練成本僅為GPT-4o的二十分之一;售價(jià)也低,輸入+輸出價(jià)格約為GPT-4o的十分之一。

  DeepSeek在其53頁的技術(shù)論文中披露:“我們的預(yù)訓(xùn)練階段在不到兩個(gè)月的時(shí)間內(nèi)完成,成本為2664K GPU小時(shí)。結(jié)合119K GPU小時(shí)的上下文長(zhǎng)度擴(kuò)展和5KGPU小時(shí)的后訓(xùn)練,DeepSeek-V3的完整訓(xùn)練成本僅為2.788M GPU小時(shí)。假設(shè)H800 GPU的租金為每GPU小時(shí)2美元,我們的總訓(xùn)練成本僅為557萬美元。”

  極高的性價(jià)比讓DeepSeek-V3一經(jīng)發(fā)布便引發(fā)國(guó)內(nèi)外驚嘆。

  公開資料顯示,DeepSeek專注于開發(fā)先進(jìn)的大語言模型和相關(guān)技術(shù),由國(guó)內(nèi)知名量化資管巨頭幻方量化于2023年7月創(chuàng)立,也因此獲得資本市場(chǎng)的廣泛關(guān)注。

95后AI“天才少女”火出圈

北大畢業(yè),曾就職于達(dá)摩院

  DeepSeek爆紅后,DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉也火出圈,被稱為95后AI“天才少女”。

圖據(jù)“羅福莉”微信公眾號(hào)

  公開資料顯示,羅福莉本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語言學(xué)專業(yè)。2019年,還在北大讀碩士的她在人工智能領(lǐng)域頂級(jí)國(guó)際會(huì)議ACL上發(fā)表8篇論文(其中2篇一作),登上了知乎熱搜。

  碩士畢業(yè)后,羅福莉先是進(jìn)入阿里達(dá)摩院做人工智能研究,從事預(yù)訓(xùn)練語言模型相關(guān)的工作,負(fù)責(zé)阿里達(dá)摩院AliceMind開源項(xiàng)目,主導(dǎo)開發(fā)了多語言預(yù)訓(xùn)練模型VECO。2022年,羅福莉加入幻方量化從事深度學(xué)習(xí)相關(guān)策略建模和算法研究,后又跳槽到DeepSeek擔(dān)任深度學(xué)習(xí)研究員,參與研發(fā)MoE大模型DeepSeek-V2。

  今年5月,在DeepSeek-V2發(fā)布以后,羅福莉在知乎上撰文,發(fā)表了對(duì)于DeepSeek-V2的看法。她表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國(guó)內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬輸入Tokens的價(jià)格,只有GPT4價(jià)格的1/100,性價(jià)比之王”。

雷軍砸千萬招人

小米11月剛成立專門的AI平臺(tái)部

  據(jù)報(bào)道,在DeepSeek-V3發(fā)布前幾天,小米創(chuàng)始人雷軍已開出千萬元年薪招聘羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì)。

  值得注意的是,小米在AI領(lǐng)域早有布局,羅福莉的加入無疑是助力。

  2023年4月,小米正式組建了AI實(shí)驗(yàn)室大模型團(tuán)隊(duì),并表示將不斷挖掘AI相關(guān)的用戶場(chǎng)景,發(fā)揮自身技術(shù)優(yōu)勢(shì),并以開放的態(tài)度與合作伙伴開拓更多機(jī)會(huì)。

  今年11月,小米成立了專門的AI平臺(tái)部,小米的元老級(jí)技術(shù)大牛張鐸為負(fù)責(zé)人。張鐸本碩畢業(yè)于清華計(jì)算機(jī)系,曾被雷軍公開稱贊是“小米的大神”,送以“鐸神”的稱號(hào)。

  此外,小米近段時(shí)間正在搭建GPU萬卡集群,規(guī)模較其大模型團(tuán)隊(duì)成立時(shí)的約6500張GPU大幅增加。這一計(jì)劃已施行數(shù)月,由雷軍親自領(lǐng)導(dǎo)。

  小米集團(tuán)總裁盧偉冰透露,預(yù)計(jì)2024年小米研發(fā)費(fèi)用將達(dá)到240億元,2025年更是將攀升至300億元。他預(yù)計(jì),自2022年至2026年的五年內(nèi),小米的研發(fā)投入將超過1000億元,主要聚焦于AI、OS、芯片三大底層技術(shù)的研發(fā)。

  數(shù)據(jù)顯示,小米自2016年組建AI團(tuán)隊(duì)以來,經(jīng)過多次擴(kuò)展,相關(guān)領(lǐng)域人員規(guī)模已達(dá)3000多人。

(文章來源:紅星資本局)

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章