面向生成式AI的云上創(chuàng)新,亞馬遜云科技為我們打了個樣
本月,素有「云計算春晚」之稱的 re:Invent 大會在拉斯維加斯開幕,亞馬遜云科技拿出了一系列新技術與產品,從大模型、芯片、算力服務到開發(fā)工具,以全棧聯(lián)動的方式重塑了云上創(chuàng)新的體驗。
總結下來,今年 re:Invent 的發(fā)布聚焦生成式 AI、數據戰(zhàn)略和云服務三大領域:
在生成式 AI 領域,亞馬遜云科技推出 Amazon Nova 系列基礎模型并強化 Amazon SageMaker、Amazon Bedrock 和 Amazon Q 等核心服務,通過更低的訓練和推理成本、更多的模型選擇、更深入場景的應用全面加速企業(yè)應用生成式 AI 創(chuàng)新;在數據戰(zhàn)略方面,亞馬遜云科技發(fā)布新一代 Amazon SageMaker 為數據、分析和 AI 提供統(tǒng)一平臺;同時,Amazon S3 新增了 Tables 存儲類型和元數據功能,以及無服務器分布式 SQL 數據庫 Amazon Aurora DSQL 將進一步提升用戶的數據管理能力;在云服務方面,亞馬遜云科技推出搭載 Trainium2 芯片的新型計算實例和為萬億參數模型提供實時推理性能的超級服務器。近日,re:Invent 2024 中國行全國巡展活動正式開啟,亞馬遜云科技的高管持續(xù)向我們分享了今年發(fā)布的技術要點。
「我們不僅在云的核心服務層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化,」亞馬遜云科技大中華區(qū)產品部總經理陳曉建表示,「我相信,只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當今客戶的發(fā)展需求,加速前沿技術的價值釋放,助力各行各業(yè)重塑未來。」
陳曉建在亞馬遜云科技 2024 re:Invent 中國行北京站上進行了主題分享。
亞馬遜云科技認為,幾乎所有的應用程序都可以分解成為數個核心構建單元,構建出優(yōu)秀的核心單元,就可以方便用戶通過自由搭建的方式,滿足他們在特定場景下不同的業(yè)務需求。
基于這樣的思考,亞馬遜云科技構建了覆蓋基礎設施、模型和應用的全棧技術創(chuàng)新。
從大模型開始,技術平臺全面進化
最近在科技領域,生成式 AI 的產品發(fā)布節(jié)奏已大幅加快,對于亞馬遜云科技來說也是如此。僅在 re:Invent 期間,基礎模型托管服務 Amazon Bedrock 的新特性就多達 21 個。
在生成式 AI 領域,亞馬遜云科技全面強化基礎設施、模型和應用三層技術棧,希望能夠幫助企業(yè)更輕松、更經濟地將生成式 AI 應用于實際業(yè)務場景。
今年 re:Invent 上宣布的更新包括:推出 Amazon Nova 六款基礎模型;Amazon Bedrock 新接入 100 多款模型,并推出 AI 防護、多智能體協(xié)作和模型蒸餾等重磅更新,優(yōu)化推理場景的準確性、成本和響應速度;Amazon Q 更加深入軟件開發(fā)和商業(yè)應用場景,并為傳統(tǒng)工作負載轉型開辟新途徑;Amazon SageMaker AI 將幫助客戶更快更輕松地構建、訓練和部署模型等等。
在這其中:
? 自研生成式 AI 多模態(tài)大模型 Amazon Nova 在多種任務中達到了 SOTA 水平,也在性價比層面實現了業(yè)界領先。它包括 Nova Micro、Nova Lite、Nova Pro 和 Nova Premier 基礎模型,以及用于生成高質量圖像的 Nova Canvas 和生成高質量視頻的 Nova Reel。在各自智能類別中,Amazon Nova Micro、Lite 和 Pro 應用成本比 Amazon Bedrock 中表現最佳的模型至少降低 75%,同時也是 Amazon Bedrock 中對應類別速度最快的模型。
Amazon Bedrock 平臺在今年得到了全面升級,亞馬遜云科技首發(fā)提供了 Luma AI 和 poolside 模型,更新了 Stability AI 的最新模型,并通過新推出的 Amazon Bedrock Marketplace 功能為客戶提供 100 多個熱門、新興及專業(yè)模型。Amazon Bedrock 推出了低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率,同時支持 GraphRAG 等知識庫功能增強數據利用能力。另外,其通過自動推理檢查功能和多智能體協(xié)作等創(chuàng)新,進一步增強 AI 安全性并推動智能體發(fā)展。人工智能助手 Amazon Q Developer 增加了三款新智能體,能進行自動執(zhí)行單元測試、文檔編制和代碼審查流程,并通過與 GitLab 深度集成,擴展應用場景。亞馬遜云科技推出了轉型功能以加速 Windows.NET、VMware 和大型機工作負載的遷移和現代化,縮短轉型時間并降低成本,并強化了 Amazon Q Business 和 Amazon Q in QuickSight 洞察能力,并簡化了復雜工作流程的自動化實現方式。在基礎設施層面上,亞馬遜云科技推出 Amazon SageMaker AI 的四項創(chuàng)新,包括 Amazon SageMaker HyperPod 的新訓練配方功能、靈活訓練計劃和任務治理功能,以及在 Amazon SageMaker 中使用亞馬遜云科技合作伙伴的熱門 AI 應用。這些功能將幫助客戶更快開始訓練流行模型,通過靈活訓練計劃節(jié)省數周時間,并將成本降低高達 40%。亞馬遜云科技表示,在 2024 年已觀察到許多客戶對生成式 AI 的引入已經從思考階段進入實踐階段。到 2025 年,情況將發(fā)生變化,很多產品將從原型驗證轉為生產階段。屆時客戶將提出更加復雜的需求,需要各種技術支持。
一系列工具的升級滿足了這些需求。
統(tǒng)一平臺,釋放數據價值
在大模型時代,數據管理和使用的重要性還在持續(xù)提升。在數據分析領域,亞馬遜云科技同樣提供了最全面、最深入的專用服務組合,包括數據倉庫 Amazon Aurora redshift、大數據處理的 Amazon Aurora、Amazon Elasticsearch Service(OpenSearch)用于搜索分析、流數據的分析 Amazon Kinesis、Amazon MSK,還有數據的聚合 Amazon Glue、交叉的分析 Amazon Athena 以及 BI 工具 Amazon QuickSight 等多個領域的不同產品和服務。
亞馬遜云科技推出的新一代 Amazon SageMaker 包括一個新的、統(tǒng)一的工作室,可為客戶提供一個單一的數據和 AI 開發(fā)環(huán)境,用戶可以在其中查找和訪問其組織中的所有數據,為各種常見的數據用例選擇最佳工具,并將數據和 AI 項目擴展至團隊內不同分工角色以實現協(xié)作。
新一代 Amazon SageMaker 將快速 SQL 分析、PB 級大數據處理、數據探索和集成、模型開發(fā)和訓練以及生成式 AI 等功能統(tǒng)一到一個集成平臺上。通過全新的 Amazon SageMaker Unified Studio,客戶可以輕松查找和訪問組織內的所有數據資源,并借助 Amazon Q Developer 選擇最適合的工具進行處理。Amazon SageMaker Catalog 和內置治理功能確保數據、模型和開發(fā)組件的合規(guī)訪問,此外,通過 Zero-ETL 與領先 SaaS 應用程序的集成,客戶無需構建復雜的數據管道,即可在 Amazon SageMaker Lakehouse 和 Amazon Redshift 中分析第三方應用數據。
Amazon SageMaker Lakehouse 則實現了數據湖、數據倉庫、運營數據庫和企業(yè)應用程序中數據的統(tǒng)一管理,支持客戶使用熟悉的 AI 和機器學習工具或 Apache Iceberg 兼容的查詢引擎進行訪問和處理。
亞馬遜云科技一直在倡導打破數據孤島,朝著 Zero ETL 這樣的愿景邁進。無論在 Amazon S3、Amazon Aurora、Amazon RDS、Amazon DynamoDB 還是 Amazon Redshift 之間,都正在或已實現了 Zero ETL。但在生產環(huán)境中,大量數據分布在不同孤立的數據源上,于是亞馬遜云科技推出了應用 Zero ETL 的集成方法,讓人們無需構建和管理數據渠道,就可以分析在各種主流第三方 SaaS 所應用的數據。
從 AI 芯片開始,升級全棧聯(lián)動
作為全球云計算的開創(chuàng)者和引領者,亞馬遜云科技在計算、網絡、存儲和數據庫等核心領域持續(xù)創(chuàng)新,為各類工作負載提供更強大的底層支持。
在自研芯片方面,其基于 Amazon Trainium2 的 EC2 Trn2 實例已宣布正式可用,較當前 GPU 實例性價比提升 30-40%。它推出了配備 64 個 Trainium2 芯片的 EC2 Trn2 UltraServers 服務器,提供高達 83.2 Petaflops 浮點算力,計算能力是單一實例的四倍。在大規(guī)模訓練方面,Project Rainier 集群搭載數十萬個 Trainium2 芯片,算力超越以往集群 5 倍以上。采用 3 納米工藝的下一代 Trainium3 芯片預計將在 2025 年末上線,預計將使集群性能提升 4 倍,并在性能、能效和密度上樹立新標桿。
在網絡基礎設施方面,亞馬遜云科技推出了第二代 UltraCluster 網絡架構,也稱為「10p10u」網絡,支持超過兩萬塊 GPU 協(xié)同工作,帶寬達 10Pb/s,延遲低于 10ms,這一突破性升級將模型訓練時間縮短至少 15%。
在存儲服務方面,Amazon S3 新增 Metadata 元數據功能實現自動獲取和實時更新;推出專為 Iceberg 表優(yōu)化的 S3 Tables 存儲類型,將查詢性能提升 3 倍,事務處理能力提升 10 倍。
在數據庫服務方面, Amazon Aurora DSQL 是一款全新的無服務器分布式 SQL 數據庫,采用 active-active 架構并具備自動故障恢復功能,支持應用程序在任意端點進行讀寫。它不僅提供 99.999% 的多區(qū)域可用性,還能實現近乎無限的可擴展性,且無需進行數據庫分片或實例升級。同時,Amazon DynamoDB global tables 也增加了多區(qū)域強一致性支持,進一步增強了其分布式數據庫服務能力。
亞馬遜云科技還重塑了數據中心設計的基礎架構。通過簡化電力分配和機械系統(tǒng),實現基礎設施可用性達 99.9999%,將受電氣問題影響的機架數量減少 89%。創(chuàng)新的「液體到芯片」冷卻系統(tǒng)無縫集成空氣和液體冷卻功能,機械能耗降低 46%。全新設計讓每個站點提供增加 12% 的計算能力,同時在可持續(xù)性方面取得重要突破,采用可再生柴油作為備用發(fā)電系統(tǒng)燃料,與傳統(tǒng)化石柴油相比溫室氣體排放可減少 90%,數據中心建筑的混凝土固有碳排放量較行業(yè)平均水平最高可降低 35%。
推動生成式 AI 重塑未來
眾多初創(chuàng)企業(yè)與行業(yè)領袖正在使用亞馬遜云科技持續(xù)創(chuàng)新。在亞馬遜內部,Amazon Kindle 的技術支持工程師采用 Amazon Q Developer 的運營調查功能后,問題解決速度提升了 65-80%,這使他們能夠更快地響應客戶需求,確保提供卓越的用戶體驗。
Amazon Music 的開發(fā)人員將 Amazon Q 視為全天候的得力助手,它能夠自動調查并識別各種潛在問題,極大提升了他們的響應速度。初期的使用數據顯示,Amazon Music 的問題解決速度提高了一倍,確保了聽眾能夠不間斷地享受他們喜愛的音樂。
大模型初創(chuàng)公司 Anthropic 的旗艦產品 Claude 已被優(yōu)化在亞馬遜最先進的 AI 硬件 Trainium2 上運行。Anthropic 將使用數十萬個 Trainium2 芯片,該規(guī)模是其之前集群的五倍以上,為使用 Amazon Bedrock 上的 Claude 客戶提供卓越的性能表現。
近日,亞馬遜云科技新任 CEO Matt Garman 提出了一個發(fā)人深省的觀點:人工智能是一場沒有終點的競賽,它將永遠持續(xù)下去。目前這場競賽已經快要到了技術的應用階段。
「亞馬遜云科技提出的一系列增強功能,從根本上定義了構建和擴展基礎模型訓練的方式,能幫助你在降低成本的同時實現最優(yōu)的訓練效率。當然,除了數據的處理和模型訓練,AI 工作流程中還有很重要的一個工作就是推理,」陳曉建表示。「當模型訓練結束,你可能需要強大的平臺和工具來把實現結果放到推理環(huán)境,為真實業(yè)務帶來價值。」
這意味著推理將無處不在,所有業(yè)務可能都需要應用到大模型所提供的推理能力,亞馬遜云科技正在提供能夠支持規(guī)模化推理的平臺,能夠幫助客戶充分用好自身的私有化數據,并在模型的性能、功能和成本方面取得平衡。
或許很快,我們就會看到幾乎所有的應用都會進化成為生成式 AI 應用,新技術會在不同場景和業(yè)務中帶來價值。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。