首頁 > AI資訊 > 行業動態 > 人人都能GPT!微軟開源DeepSpeedChat幫用戶訓練模型

人人都能GPT!微軟開源DeepSpeedChat幫用戶訓練模型

新火種    2023-10-30

微軟宣布開源DeepSpeed Chat,訓練速度可提升15倍以上。

當地時間4月12日,微軟宣布開源系統框架DeepSpeedChat,幫助用戶訓練類似于ChatGPT的模型。與現有系統相比,DeepSpeedChat的速度快15倍以上,可提升模型的訓練和推理效率。

來源:微軟

ChatGPT是OpenAI于去年11月推出的聊天機器人,其訓練基礎是為RLHF(ReinforcementLearningfromHumanFeedback),即基于人工反饋進行強化學習。

對于想要開發類似于ChatGPT模型的研究人員而言,難題之一是市面上缺乏支持端到端的RLHF系統框架。為此,微軟開源其系統框架DeepSpeed Chat,幫助數據科學家和研究者更易于使用ChatGPT類型的模型。

據介紹,DeepSpeed Chat能夠簡化ChatGPT類型模型的訓練過程、強化推理體驗。其中的DeepSpeed-RLHF系統能夠在推理和訓練兩種模式之間進行切換,使復雜的RLHF訓練速率更快、易于大規模推廣。

根據微軟,DeepSpeed-HE比現有系統快15倍以上,且成本更低。在微軟云Azure上,該系統只需9小時即可訓練一個OPT-13B模型,只需18小時即可訓練一個OPT-30B模型,且這兩種訓練分別花費不到300美元和600美元(OPT為臉書母公司Meta發布的語言模型)。

此外,面對于擁有1750億參數的模型,DeepSpeed-HE的訓練時間只需不到一天的時間。

對于微軟開源DeepSpeedChat,海外知名科技社區HackerNews的用戶總結道,微軟不僅向OpenAI投資了100億美元,同時還為公眾提供一種免費工具,幫助他們研發OpenAI同款產品。也有用戶認為,微軟選擇開源DeepSpeedChat,是為了在業內獲得領先優勢。

還有用戶認為這一系統框架前景可期,“我可以預見,未來每家公司都會擁有自己的‘AI模型助理’,其能夠定期對公司內部數據進行培訓或更新。公司的電子郵件、slack/team消息、文檔等或許都將成為AI模型的數據來源。”

來源:HackerNews

微軟和OpenAI的合作可以追溯到2019年,在這一年OpenAI獲得了微軟10億美元的投資,并對微軟獨家授權部分AI技術,雙方合作替微軟云Azure開發人工智能技術。

今年2月初,微軟推出搭載ChatGPT同源功能的新版必應(Bing),使得該軟件的全球下載量在一夜之間猛增10倍,并躥升至蘋果App Store應用商店最受歡迎的免費應用榜中的第十位。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章