數據搭建大模型應用基石,廠商試水軟硬件新融合
11月27日,獵戶星空發布Orion-MoE8×7B大模型,系開源混合架構MoE(專家)大模型,同時推出基于該模型的數據服務產品——AI數據寶AirDS(AI-Ready Data Service),主要提供包括數據清洗與數據標注在內的服務。
獵豹移動董事長兼CEO、獵戶星空董事長傅盛在談及現在推出MoE模型與數據閉環服務時表示,產業鏈里決定大模型基礎能力的核心是標注后的數據,當下行業的重點在于如何將高質量數據找出來,與應用實現高度結合。傅盛認為,今天行業最好的突破點就是高質量數據與AI Agent框架對應用的需求,如今的模型即使不再進步,水平也足夠解決相當大一部分的問題,且是革命性體驗的需求問題。
行業共同期待的是一次AI應用爆發,谷歌、OpenAI、阿里、華為等大型企業都在側重利用MoE提升大模型性能和實用性,與此同時,也有一些國內企業在嘗試以軟硬件結合的方式尋找更多落地的可能性。用好大模型不簡單2024年全球MoE大模型數量呈爆發增長態勢。
目前基于Transformer的MoE已成為大模型領域主流架構,優勢在于可以將神經網絡拆分成多個專家子網絡,面對一次輸入,既可以指定某一位“專家”來回答,也可以要求多位“專家”回答,甚至全部參與回答,最終依據權重綜合給出結果。開發者可以在一個巨型模型上繼續增加參數量,進行橫向擴展。因為 MoE可以選擇只啟用部分專家子模型,在保持性能的同時,能夠降低推理成本。
相比于算法和算力,在大模型商業閉環中,獵戶星空認為數據成為最直接影響大模型在垂直行業落地效果的關鍵。這也是如今獵戶星空發布數據寶產品的原因。獵戶星空首席科學家韓堃稱,大模型與實際應用之間還有很大的差距,這個差距并非數據本身,而是圍繞數據進行的一系列服務,包括數據標注、提示詞撰寫、提示詞優化、模型評測等,廠商在推出大模型之后還需要教會客戶如何用好模型。此次推出的AI數據寶AirDS提供的大模型數據服務涵蓋數據收集、清洗、標注、提示詞工程以及評估等環節。在實際應用中,AirDS已服務包括移動通信終端、互聯網娛樂、新能源汽車等多領域的中國出海品牌。知道創宇安全中心總經理鄢曉玲對記者表示,就目前所接觸到的市場情況而言,數據清洗與標注的客戶需求有非常明顯的增加,甚至可以說達到了翻倍的增長。
從行業發展趨勢來看,數字化轉型全面提速,各行業深度依賴數據驅動。無論是新興的電商直播精準推薦,還是傳統醫療行業的病歷數據分析輔助診療,都離不開高質量數據,而數據清洗與標注是保障數據質量的必不可少的一環。落地場景之中,機器人也是獵戶星空大模型選擇的重要場景之一。傅盛強調,大模型是基于語言學習后對世界產生理解,并有自己邏輯和推理能力的一個模塊。以前的機器人本質上沒有大腦,更多是個自動化機器。加入大模型后,傅盛表示,可以提高機器人自主決策的能力,例如講解交互、任務處理。長遠來看,機器人真正參與一些勞動,如把機械臂加到機器人身上,讓它幫你端杯水,這些很快能夠實現產品化。
因此,整體來看,在探索AI應用場景過程中,韓堃表示,一方面,客戶對大模型的需求是既要效果好又要速度快;另一方面,相比稠密模型的“通才”,一群“專家”的MoE能更高效專業地完成企業復雜任務,且在不顯著增加計算成本的前提下大幅增加模型容量。開箱即用才好說服客戶買單獵豹移動高級副總裁孫明焱認為,數據服務要做好,企業需要有足夠的應用實踐,才可以為客戶的任務針對性提供正確的數據集,這是大模型廠商的優勢。要怎樣的應用才能說服客戶買單?將大模型與數據包打包發布,在獵戶星空的商業邏輯里是為了打通商業閉環,也是今年大模型行業從訓練端轉向推理端的一大體現。伴隨大模型應用的興起,獵豹移動副總裁童寧對記者表示,公司對接的企業客戶幾乎都在All in AI。
但不同之處在于,過去對接的是客戶技術部門,但現在更多對接的是業務部門。這在童寧看來,是很大的變化。過去獵戶星空提供的業務服務主要面向基礎架構層,面向IT部門。而現在AI或大模型要解決的問題存在于客戶企業的核心業務里,包括供應鏈等。童寧認為,客戶核心痛點的解決是大模型廠商都會去投入的方向,只是各自的切入點不同,目前行業呈現百花齊放的狀態。但如何用好大模型,是行業普遍關心的。獵戶星空做的就是將大量沒有結構化的數據進行處理,這也是大模型廠商所擅長的。因此,這就需要把大模型變成“開箱即用”的應用。
“當AI有這么大關注度的時候,我們一直在思考如何讓客戶把AI運用起來,從中獲取價值?!敝袊萜沼邢薰緜€人信息產品部高級計算與解決方案產品部總經理徐鳴說。這家以硬件制造為主的一個領先的科技企業也敏感地注意到了AI正在成為一個主流趨勢,并嘗試通過進行硬件與軟件的結合,讓更多的企業把大模型應用到生產業務之中。最近惠普和星環科技與一家央企共同簽署了戰略合作協議,正式成為他們的IT合作伙伴。該央企計劃構建一個專屬的知識庫,并通過深度學習技術對其數據進行分析,以便更有效地解讀歷史經營數據?;萜张c星環科技共同探討并制定了一套方案,旨在為他們提供一個合適的模型架構、選擇恰當的硬件配置,并決定部署位置,同時預估了項目實施的時間表。在前端部署完成后,惠普和星環科技還將在中后端進行模型的持續維護,并針對在實際使用過程中可能產生的訓練需求,以及對內部員工的培訓持續合作。通過一體機的方式,依托惠普提供算力支撐的工作站,加上星環提供的Knowledge Hub,把數據通過惠普的硬件設施,結合星環科技的產品技術,可以把數據轉化為企業內部的知識沉淀。
星環科技聯合創始人、副總裁朱珺辰認為,大模型的應用意味著從以前的數據基礎設施(Data Infra)向AI基礎設施(AI Infra)做轉變。企業可以把這些信息做更好的、特征化的處理,能夠更好地利用這些數據的價值。對于大多數企業來說,他們所期望采購的大模型并非只是一個空洞的框架,而是一個全面的解決方案?!凹词勾竽P图夹g發展了,也需要軟件與硬件結合,才能真正落地,產生價值?!敝飕B辰說。
(本文來自第一財經)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。