首頁(yè) > AI資訊 > 最新資訊 > 最近爆火的DeepSeek和GPT的差別有多大?中國(guó)AI真的已經(jīng)引領(lǐng)世界了嗎?

最近爆火的DeepSeek和GPT的差別有多大?中國(guó)AI真的已經(jīng)引領(lǐng)世界了嗎?

新火種    2025-03-05

近期,爆火的DeepSeek大模型突然出現(xiàn)在人們的視野當(dāng)中,成為現(xiàn)下全社會(huì)的討論熱點(diǎn)。那么,DeepSeek究竟有哪些技術(shù)領(lǐng)先優(yōu)勢(shì),讓整個(gè)AI行業(yè)都為之震撼?它為什么如此備受關(guān)注?下面我們就來(lái)和大家說(shuō)道說(shuō)道。

首先是技術(shù)架構(gòu)全面優(yōu)化,徹底擺脫算力的束縛。

DeepSeek:采用混合專家(MoE)架構(gòu),運(yùn)用多頭潛在注意力(MLA)技術(shù)和多令牌預(yù)測(cè)(MTP)等,通過(guò)動(dòng)態(tài)路由機(jī)制,每個(gè)輸入僅激活部分參數(shù),可處理長(zhǎng)序列。并且采用“三階段過(guò)濾法”確保訓(xùn)練數(shù)據(jù)質(zhì)量,通過(guò)DualPipe并行算法和FP8混合精度訓(xùn)練,還針對(duì)MoE架構(gòu)特性開發(fā)了動(dòng)態(tài)負(fù)載均衡策略,緩解“贏者通吃”問題,后續(xù)這項(xiàng)關(guān)鍵技術(shù)很可能被各大AI開發(fā)商跟進(jìn)。

另外,DeepSeek的MoE架構(gòu)采用動(dòng)態(tài)路由機(jī)制,每個(gè)輸入僅激活部分參數(shù)。例如,DeepSeek擁有6710億參數(shù),但在處理每個(gè)輸入時(shí)僅激活約370億參數(shù),可根據(jù)任務(wù)需求靈活調(diào)用“專家”模塊,降低計(jì)算能耗,提高特定任務(wù)處理精度。

而GPT-4之前版本基于標(biāo)準(zhǔn)稠密Transformer架構(gòu),GPT的Transformer架構(gòu)較為依賴密集自注意力機(jī)制,處理每個(gè)輸入時(shí)需使用所有參數(shù),在處理長(zhǎng)文本時(shí),會(huì)導(dǎo)致顯存占用和計(jì)算成本大幅增加。

其中,DeepSeek訓(xùn)練成本約為557.6萬(wàn)美元,使用成本為0.0012美元/千token,支持本地部署,硬件要求降低60%。GPT-4的訓(xùn)練成本約1億美元,GPT-4 Turbo使用成本為0.03美元/千token。兩者的成本差距達(dá)到了25倍(0.03 / 0.0012 = 25),這徹底打破了此前對(duì)于強(qiáng)算力的絕 對(duì)依賴,也直接證明了領(lǐng)先的AI并不一定需要強(qiáng)大的算力。因此,西方高算力的AI芯片封鎖,已經(jīng)沒有意義。

使用PTX指令集,不再完全依賴CUDA。

作為NVIDIA的核心技術(shù),CUDA是專門為NVIDIA的GPU設(shè)計(jì)的,與NVIDIA的硬件架構(gòu)緊密結(jié)合。要想使用CUDA,用戶必須購(gòu)買NVIDIA的GPU硬件。這種硬件與軟件的強(qiáng)綁定關(guān)系形成了較高的技術(shù)壁壘,限制了其他競(jìng)爭(zhēng)對(duì)手進(jìn)入市場(chǎng),讓NVIDIA在AI硬件上保持領(lǐng)先。

然而,DeepSeek采用了PTX指令集。PTX能夠直接與GPU驅(qū)動(dòng)函數(shù)進(jìn)行交互,允許開發(fā)者對(duì)硬件進(jìn)行更為精細(xì)的操作與控制,如寄存器分配、線程/warp級(jí)別的調(diào)整等,這些是標(biāo)準(zhǔn)CUDA編程無(wú)法實(shí)現(xiàn)的,可充分發(fā)揮GPU性能。這是一種類似于匯編語(yǔ)言的底層指令集,可以更好地調(diào)用GPU的函數(shù)進(jìn)行交互,提升整體的運(yùn)行效率,而不是去依賴CUDA提供的高級(jí)接口,減少了對(duì)NVIDIA特定API的依賴,在硬件適配上有著更高的靈活性和自主性。

在實(shí)際應(yīng)用方面,DeepSeek在訓(xùn)練擁有6710億參數(shù)的V3混合專家(MoE)語(yǔ)言模型時(shí),采用PTX指令集對(duì)英偉達(dá)H800 GPU進(jìn)行了重新配置,在132個(gè)流式多處理器中專門分配20個(gè)用于服務(wù)器間的通信任務(wù),用于數(shù)據(jù)壓縮和解壓縮以克服處理器連接限制,加快數(shù)據(jù)傳輸速度。還采用先進(jìn)的流水線算法,進(jìn)行了更為精細(xì)的線程/線程束級(jí)別的調(diào)整操作。

最終,DeepSeek僅用2048個(gè)H800 GPU,耗時(shí)約兩個(gè)月就完成了模型訓(xùn)練,效率比Meta等人工智能行業(yè)領(lǐng)軍企業(yè)的同類模型訓(xùn)練高出10倍。

重要意義:打破美國(guó)AI算力為上的神話

DeepSeek證明了在AI模型訓(xùn)練中,即使沒有頂 級(jí)的硬件配置和海量算力,通過(guò)技術(shù)創(chuàng)新也能取得優(yōu)異成果。采用PTX指令集等技術(shù)對(duì)硬件進(jìn)行深度優(yōu)化,還在架構(gòu)設(shè)計(jì)、算法優(yōu)化等方面進(jìn)行創(chuàng)新,如在H800芯片上對(duì)其中20個(gè)流處理器核心進(jìn)行重新配置以專門管理跨芯片通信,減少了對(duì)最 先進(jìn)、最 高算力芯片的依賴,降低了對(duì)大規(guī)模算力的需求。

長(zhǎng)期以來(lái),AI行業(yè)形成了一種依賴大量資金投入和巨大算力來(lái)推動(dòng)發(fā)展的模式,大家普遍認(rèn)為只有堆砌硬件資源才能訓(xùn)練出高性能的AI模型。DeepSeek以低成本、相對(duì)低算力實(shí)現(xiàn)高性能的AI模型,對(duì)這種傳統(tǒng)模式提出了挑戰(zhàn),促使其他企業(yè)重新審視自身的發(fā)展策略,思考如何在有限資源下實(shí)現(xiàn)技術(shù)突破。

DeepSeek的出現(xiàn)改變了AI行業(yè)的競(jìng)爭(zhēng)格局,給其他企業(yè)帶來(lái)了更大的競(jìng)爭(zhēng)壓力。它使得更多企業(yè)意識(shí)到,即使沒有雄厚的資金和強(qiáng)大的算力支持,也有可能在AI領(lǐng)域取得成功,這將激發(fā)更多企業(yè)參與到AI技術(shù)的研發(fā)和創(chuàng)新中,推動(dòng)行業(yè)競(jìng)爭(zhēng)更加激烈。

此前,AI領(lǐng)域過(guò)度強(qiáng)調(diào)算力的重要性,似乎強(qiáng)大的算力是決定AI模型性能的唯 一關(guān)鍵因素。DeepSeek讓人們看到,算力并非是AI成功的唯 一決定因素,技術(shù)創(chuàng)新、算法優(yōu)化等同樣重要,打破了市場(chǎng)對(duì)算力的盲目崇拜,使人們更加理性地看待AI發(fā)展中的資源投入。

DeepSeek的成功可能會(huì)引導(dǎo)投資者重新評(píng)估AI項(xiàng)目的投資價(jià)值,不再僅僅看重算力資源的投入,而是更加關(guān)注技術(shù)團(tuán)隊(duì)的創(chuàng)新能力、算法的先進(jìn)性等因素。這有助于將投資引導(dǎo)到更加注重技術(shù)創(chuàng)新的方向上,促進(jìn)AI行業(yè)的健康發(fā)展。

對(duì)于國(guó)家層面而言,在美對(duì)中實(shí)施科技制裁,限制高端芯片等先進(jìn)技術(shù)和設(shè)備出口的背景下,DeepSeek的成功表明:即使面臨外部限制,中國(guó)企業(yè)仍能通過(guò)自主創(chuàng)新在AI領(lǐng)域取得突破,凸顯了美國(guó)圍堵政策難以達(dá)到預(yù)期效果,證明了在AI發(fā)展中,并不一定需要依賴美國(guó)的技術(shù)和資源,也可以通過(guò)自主創(chuàng)新實(shí)現(xiàn)發(fā)展,激勵(lì)更多國(guó)家和地區(qū)加大在AI領(lǐng)域的投入和研發(fā)。

總結(jié):DeepSeek的出現(xiàn)是中國(guó)AI領(lǐng)域的一次重大突破,展示了技術(shù)創(chuàng)新的巨大潛力。雖然中國(guó)AI在某些方面已經(jīng)取得顯著進(jìn)展,但要實(shí)現(xiàn)全面引領(lǐng),仍需在更多關(guān)鍵領(lǐng)域取得突破。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章