智源聯(lián)手浪潮信息,大模型產(chǎn)業(yè)開源走進(jìn)算力層
2024年,隨著大模型應(yīng)用逐漸深入以及多模態(tài)模型的快速發(fā)展,企業(yè)對(duì)算力的需求持續(xù)增加,對(duì)算力的依賴性顯著提升。
從模型需求角度上看,根據(jù)Huggingface的模型下載量統(tǒng)計(jì),目前模型的需求已經(jīng)呈現(xiàn)出兩級(jí)分化的趨勢(shì),數(shù)百億級(jí)以上的強(qiáng)大稠密模型,以及10B以下的小模型更受歡迎。對(duì)此,智源研究院副院長(zhǎng)兼總工程師林詠華表示:“從全球模型的發(fā)展情況來(lái)看,模型尺寸正呈現(xiàn)分化趨勢(shì)。”
從算力的層面來(lái)看,目前仍呈現(xiàn)出“需求大、能耗高、效率低”的發(fā)展態(tài)勢(shì)。以2020年發(fā)布的GPT-3與最新發(fā)布的LLaMA3-405B進(jìn)行對(duì)比為例,盡管模型規(guī)模僅增大2.3倍,但所需算力卻增長(zhǎng)了116倍。算法的創(chuàng)新使算力需求一直處于高增長(zhǎng)狀態(tài),同時(shí),算法結(jié)構(gòu)的創(chuàng)新也帶來(lái)了MoE、模型量化、定制算子等更加復(fù)雜的計(jì)算需求。
隨著技術(shù)的不斷更新迭代,多元多模的技術(shù)發(fā)展也為客戶的應(yīng)用開發(fā)提供了更廣闊的選擇空間和更高的靈活性。而“百花齊放”的多樣性也帶來(lái)了挑戰(zhàn):多元算力因各家硬件架構(gòu)、指令集的差異以及算子庫(kù)的獨(dú)立實(shí)現(xiàn),導(dǎo)致整個(gè)生態(tài)系統(tǒng)割裂且難以形成強(qiáng)大合力。
從目前發(fā)展角度來(lái)看,當(dāng)下生態(tài)的現(xiàn)狀抬高了大模型應(yīng)用的技術(shù)門檻。技術(shù)力量薄弱的傳統(tǒng)企業(yè)用戶,不僅在多元的芯片、模型中難以選擇,而且即使部署成功,也存在軟件框架多、易用性差等問(wèn)題,也這使得后期開發(fā)使用較為困難。浪潮信息高級(jí)副總裁劉軍表示,所有難題都匯總到一點(diǎn)——如何構(gòu)建好一個(gè)可持續(xù)的AI底層生態(tài),讓多元算力更通用、更普惠,讓系統(tǒng)的算效更高、基礎(chǔ)模型更好用。
12 月 25 日,浪潮信息與智源研究院達(dá)成戰(zhàn)略合作協(xié)議,共同宣布智源開源大模型通用算子庫(kù)FlagGems正式接入浪潮信息元腦企智 EPAI 企業(yè)大模型開發(fā)平臺(tái), 面向大模型應(yīng)用開發(fā)場(chǎng)景提供強(qiáng)大的多元算力系統(tǒng)支持,助力企業(yè)實(shí)現(xiàn)更快速、更廣泛、更高效的多元算力適配與使用,大幅降低企業(yè)開發(fā)大模型應(yīng)用的算力門檻,共同促進(jìn)多元算力系統(tǒng)生態(tài)的發(fā)展。
開源開放顯然是目前構(gòu)建生態(tài)的最佳路徑,劉軍表示,開源開放是創(chuàng)新活力的源泉,在互聯(lián)網(wǎng)時(shí)代,開源開放打破了過(guò)去的技術(shù)壟斷,使得更多人參與到開源社區(qū),貢獻(xiàn)代碼,貢獻(xiàn)想法,共謀發(fā)展。而在如今的AI時(shí)代,開源開放會(huì)起到更大的、更積極的促進(jìn)作用。
“具體來(lái)說(shuō),以應(yīng)用為導(dǎo)向,以系統(tǒng)為核心,以開源、開放、多元多模來(lái)激發(fā)創(chuàng)新的活力,以系統(tǒng)創(chuàng)新全局優(yōu)化來(lái)拓展創(chuàng)新的路徑,以協(xié)同共生開放共贏的生態(tài)加速創(chuàng)新的落地,從而實(shí)現(xiàn)AI創(chuàng)新和AI應(yīng)用的協(xié)同發(fā)展,激發(fā)AI的創(chuàng)新活力,開源開放是這里面的核心和源泉。”劉軍強(qiáng)調(diào)。
FlagGems 是由智源研究院于2024年6月推出的面向多元算力的開源大模型通用算子庫(kù),在Triton 生態(tài)開源開放的基礎(chǔ)上,面向多元算力,遵循統(tǒng)一的中間語(yǔ)言、統(tǒng)一的算子接口和統(tǒng)一的開源算子庫(kù)實(shí)現(xiàn)路徑,以大模型需求為導(dǎo)向,為多元算力提供開源、統(tǒng)一、高效的算子層生態(tài)接入方案。截至12月,F(xiàn)lagGems已提供超過(guò)130個(gè)大模型算子,是目前提供算子數(shù)量最多、覆蓋廣度最大的開源算子庫(kù)。
元腦企智EPAI(Enterprise Platform of AI) 是浪潮信息為企業(yè) AI 大模型落地應(yīng)用打造的高效、易用、安全的端到端開發(fā)平臺(tái),支持主流開源與閉源大模型的應(yīng)用快速開發(fā),可實(shí)現(xiàn)大模型應(yīng)用在跨算力平臺(tái)上的無(wú)感遷移,降低多元、多模的適配與試錯(cuò)成本。
此次智源研究院攜手浪潮信息,將FlagGems算子庫(kù)與元腦企智EPAI內(nèi)置的核心計(jì)算框架進(jìn)行深度融合,其核心意義在于—確保大模型應(yīng)用開發(fā)能夠使用高性能、跨硬件、多框架兼容的算子集合,順利跨越各類硬件架構(gòu),滿足多種開發(fā)框架的需求。
“浪潮信息與智源研究院在生態(tài)上可以形成優(yōu)勢(shì)互補(bǔ),智源研究院是AI領(lǐng)域的一個(gè)新興研發(fā)機(jī)構(gòu),在重視原始創(chuàng)新,開源了很多的基礎(chǔ)模型、算子庫(kù)、OS(操作系統(tǒng))、數(shù)據(jù)集等重要的研究成果。”劉軍進(jìn)一步指出,“而浪潮信息致力于為客戶提供軟硬件協(xié)同的全棧的AI基礎(chǔ)設(shè)施的解決方案,在產(chǎn)業(yè)化落地領(lǐng)域,我們有著比較豐富的生態(tài)支持和實(shí)踐經(jīng)驗(yàn)。雙方的合作,一方面將加速AI相關(guān)基礎(chǔ)研究在產(chǎn)業(yè)側(cè)、行業(yè)側(cè)的落地應(yīng)用,另一方面,通過(guò)在產(chǎn)業(yè)側(cè)的應(yīng)用效果,不斷修正和優(yōu)化基礎(chǔ)研究的成果。”
據(jù)了解,在FlagGems算子庫(kù)接入后,企業(yè)依托元腦企智 EPAI 大模型開發(fā)平臺(tái),可以利用針對(duì)大模型應(yīng)用開發(fā)場(chǎng)景優(yōu)化的先進(jìn)算子集合,在多種算力平臺(tái)上高效構(gòu)建、優(yōu)化和執(zhí)行復(fù)雜的行業(yè)應(yīng)用算法。在復(fù)雜的訓(xùn)練任務(wù)及實(shí)時(shí)性要求嚴(yán)苛的推理場(chǎng)景中,均能實(shí)現(xiàn)穩(wěn)定且高效的運(yùn)算性能。
此外,企業(yè)無(wú)需關(guān)心多元異構(gòu)加速卡之間的軟硬件差異,真正實(shí)現(xiàn)大模型應(yīng)用在跨算力平臺(tái)上的無(wú)縫開發(fā)與遷移。而開源開放的生態(tài)對(duì)于AI大模型的應(yīng)用落地起到了關(guān)鍵作用,可以有效降低大模型落地的試錯(cuò)成本、創(chuàng)新成本,以及應(yīng)用成本。(本文首發(fā)于鈦媒體APP,作者|張申宇,編輯丨蓋虹達(dá)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。