亞馬遜云科技深夜拋出“王炸”:文生/視頻生等6款大模型發布,推出基于自研Trn2AI芯片的最強AI服務器
安迪·賈西發布Amazon Nova系列模型
亞馬遜云科技深夜拋出“王炸”,不僅一口氣推出6款大模型,Amazon用于深度學習和生成式AI場景,基于自研芯片的最強EC2實例也來了。
大模型方面,Amazon Nova系列基礎模型包括Micro、Lite、Pro、Premier四款。其中,Micro為純文本模型,128k上下文窗口;Lite和Pro為多模態模型,300k上下文窗口;Premier也為多模態模型,可用于執行復雜的推理任務。亞馬遜CEO安迪·賈西(Andy Jassy)在介紹時透露,Micro、Lite和Pro模型已全面開放可用,Premier模型會將于2025年第一季度推出。
“要是將它(Pro模型)與GPT-4 O進行比較,在20個基準測試中的17個上相等或更優,和Gemini對比,在21個基準測試中的16個上相等或更優。”賈西介紹。他也強調了四款模型的成本效益很高,相較于Amazon Bedrock中的其他領先模型,Nova能便宜大約75%。
四款基礎模型不僅集成在Amazon Bedrock中,還與Amazon Bedrock里的所有功能進行了深度整合,任何模型提供商都可以使用并供開發者進行微調。Nova模型還與蒸餾功能整合,可將大模型的智能“轉移”到更小的模型中,這些小模型成本效益更高,延遲更低。
另外,賈西也宣布推出了圖像生成模型Amazon Nova Canvas及視頻生成模型Amazon Nova Real。其中,Amazon Nova Real即將推出可以制作6秒視頻的功能,未來幾個月內,還會推出能夠制作最長2分鐘視頻的功能。
值得一提的是,亞馬遜云科技CEO馬特·加爾曼(Matt Garman)也在現場宣布,Amazon Bedrock multi-agent collaboration多智能體協作功能同步推出,這意味著Amazon Bedrock智能體能夠處理復雜的工作流程。“多個智能體返回了信息,它還能進行協調處理,確保所有這些智能體之間能夠有效協作。”馬特表示。
馬特·加爾曼宣布推出基于Trn2的EC2實例
繼AI大模型公司Anthropic宣布下一代Claude模型將在Amazon Project Rainier上進行訓練,并產生擁有數十萬個Amazon Tranium2 芯片的亞馬遜集群之后,馬特當地時間12月3日上午便宣布推出由Amazon Trainium2提供支持的Amazon Elastic Compute Cloud (Amazon EC2)實例,新的Trn2 UltraServer、下一代 Trainium3 芯片也同步推出。
“今天,我很高興地宣布Amazon EC2 Trn2實例正式可用,這些實例由Trainium2芯片提供支持。Amazon EC2 Trn2實例是我們為生成式AI設計的最強大的實例,這都得益于這些完全由亞馬遜云科技內部定制構建的處理器。”馬特在現場表示。
據鈦媒體App了解,基于Amazon Trainium2的Amazon EC2實例,能夠訓練和部署當今最新的AI模型以及未來的大型語言模型(LLM)和基礎模型(FM)。與當前一代基于 GPU 的 EC2 P5e 和 P5en 實例相比,Trn2 實例的性價比提高了 30-40%,并具有 16 個 Trainium2 芯片,可提供 20.8 petaflops 的峰值計算能力,非常適合訓練和部署具有數十億個參數的 LLM。
Amazon Trainium2芯片
Amazon EC2 Trn2實例服務器托架
對于需要更多計算的最大模型,Trn2 UltraServer 允許客戶將訓練擴展到單個 Trn2 實例的限制之外,從而減少訓練時間,加快上市時間,并支持快速迭代以提高模型準確性。Trn2 UltraServer 是一種全新的 EC2 產品,它使用超快的 NeuronLink 互連將四臺 Trn2 服務器連接在一起形成一臺巨型服務器,可擴展至 83.2 petaflops 的峰值計算能力,將單個實例的計算、內存和聯網能力提高四倍,從而能夠訓練和部署世界上最大的模型。
借助新的 Trn2 UltraServer,客戶可以跨 64 個 Trainium2 芯片擴展其生成式 AI 工作負載。對于推理工作負載,客戶可以使用 Trn2 UltraServer 來提高生產中萬億參數模型的實時推理性能。
“Trainium2 專為支持最大、最前沿的生成式 AI 工作負載而構建,用于訓練和推理,并在 AWS 上提供最佳性價比,”亞馬遜云科技計算和網絡副總裁 David Brown 說。“隨著模型接近數萬億個參數,我們了解客戶還需要一種新穎的方法來訓練和運行這些龐大的工作負載。新的 Trn2 UltraServer 在 AWS 上提供最快的訓練和推理性能,并幫助各種規模的組織以更快的速度和更低的成本訓練和部署世界上最大的模型。
以AI大模型公司Anthropic 為例,Claude系列大模型讓Anthropic 在全球備受關注。AI大模型公司Anthropic聯合創始人兼首席計算官Tom Brown當地時間12月2日宣布,公司旗下下一代的Claude模型將在Project Rainier上進行訓練,他表示這將是一個新的亞馬遜集群,擁有數十萬個Amazon Tranium2 芯片。優化完成后,該集群預計將成為迄今為止世界上最大的 AI 計算集群,可供 Anthropic 構建和部署其未來模型。
“數十萬個芯片意味著數百個密集的億次浮點運算,比我們曾經使用過的任何集群都多五倍以上。這意味著客戶將可以更低的價格、更快的速度獲得更多的智能。有了 Amazon Tranium2 和 Project Rainier,我們不僅僅是在構建更快的人工智能,還在構建可擴展的、值得信賴的人工智能。”Tom Brown表示。此前一周亞馬遜宣布追加對Anthropic的第二筆40億美元的投資(目前共計亞馬遜投資80億美元),進一步深化兩家公司在人工智能領域的合作,加快Anthropic的發展。
同日,亞馬遜云科技 也推出了專為滿足生成式 AI 工作負載而設計的下一代AI訓練芯片Trainium3 芯片,Trainium3 將成為第一款采用 3 納米工藝節點制造的 Amazon 芯片,為性能、能效和密度設定了新標準。由 Trainium3 提供支持的 UltraServer 的性能預計將比 Trn2 UltraServer 高 4 倍,使客戶能夠在構建模型時更快地迭代,并在部署模型時提供卓越的實時性能。第一批基于 Trainium3 的實例預計將于 2025 年底推出。(作者 | 秦聰慧)?
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。