DeepSeek又更新了!化身更強AI設計師、程序員比肩全球最強代碼生成器?
《科創板日報》3月25日訊(編輯 宋子喬) 3月24日晚間,DeepSeek上線了小版本更新后的DeepSeek-V3模型。新模型的版本號為DeepSeek-V3-0324,模型參數為6850億,較初代V3版本的6710億有小幅增長。DeepSeek尚未放出新版模型的系統卡。
開源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324值得注意的是,DeepSeek將開源秉持到底,這次將DeepSeek-V3模型的開源協議更新為與DeepSeek-R1一致的MIT協議,這一協議更為寬松,允許模型蒸餾、商用等行為,給了開發者更多的自主權。
在性能上,編程能力的優化成了最大亮點,新版本DeepSeek-V3生成前端代碼的能力大大提升。
網友讓模型設計的天氣頁面(左由新版DeepSeek-V3生成;右由初代DeepSeek-V3生成)網友用V3新版本設計的個人網站頁面網友用V3新版本寫的小游戲網友用V3新版本寫的文字卡片據多個博主的測試,新版DeepSeek-V3在網站開發能力、UI設計方面表現優秀,只需要簡單的文本提示就能快速開發各種網站、App,審美比肩目前全球最強的閉源代碼模型Claude 3.7 Sonnet思維鏈版本。
由新版DeepSeek-V3生成由Claude 3.7 Sonnet生成圖1 DeepSeek V3生成圖2 DeepSeek V3 0324生成圖3 Claude Sonnet 3.7生成《科創板日報》曾報道過初代DeepSeek-V3,該模型甫一上線便以性價比“聞名”。在多項基準測試中,DeepSeek-V3的成績超越了Qwen2.5-72 B和Llama-3.1-405 B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
幻方量化在已開源的論文中強調其訓練成本極低——通過對算法、框架和硬件的優化協同設計,假設H800GPU的租用價格為每塊GPU2美元/小時,DeepSeek-V3的全部訓練成本總計僅為557.6萬美元(注:該成本僅包括DeepSeek-V3的正式訓練,不包括與先前在架構、算法或數據上的研究和消融實驗相關的成本)。
DeepSeek-V3的API服務定價將上調為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元,按緩存未命中的輸入價格計,加總成本是10元人民幣。
同類型模型中,OpenAI的GPT 4o定價相當高,輸入:5美元/百萬Token,輸出:15美元/百萬Token,加總成本是20美元,約合人民幣140元。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。