字節旗下火山引擎發布AI助手:背靠自研大模型原生應用仍需時日
“(做大模型),主要是看怎么做,怎么說的意義不是特別關鍵。”
9月19日,字節跳動旗下火山引擎總裁譚待在接受澎湃新聞等媒體采訪時,談到了大模型“打法”。
作為互聯網巨頭之一,字節跳動的大模型路線圖一直廣受外界關注。9月7日,騰訊正式發布混元大模型,并宣布通過騰訊云對外開放,至此,包括阿里、百度、騰訊、京東等多家科技公司已經官宣入局“百模大戰”,而字節跳動的自研通用大模型“云雀”始終保持低調,甚少公開披露信息。
9月19日,火山引擎在其舉辦的“V-Tech數據驅動科技峰會”上宣布,火山引擎數智平臺VeDI推出“AI助手”,通過接入人工智能大模型,幫助企業提升數據處理和查詢分析的效率。
即使是不會寫代碼的運營人員,和大模型對話也能做好業務運營數據的取數、看數和歸因分析。
這也是字節首次公開披露“云雀”的相關應用。據字節跳動數據平臺負責人羅旋向澎湃新聞記者介紹,在技術上,AI助手主要背靠的大模型就是自研的“云雀”,以及火山方舟上的一些合作伙伴。
原生AI應用成熟要等年底
通俗而言,此次發布的AI助手,是為了讓企業更方便地進行數據消費。譚待認為,數據資產的檢索和開發非常依賴專業人員,使用大模型之后可以極大降低門檻。非研發人員使用AI助手能夠更高效地搜索到相應數據,更高效地進行數據開發。
羅璇表示,目前AI助手還不算完全成熟的狀態,希望一點點逐漸打磨產品,和客戶深度共創,更成熟以后,再大規模對外公開。
此前6月28日,火山引擎發布大模型服務平臺“火山方舟”,面向企業提供模型精調、評測、推理等全方位的平臺服務(MaaS,即Model-as-a-Service),目前集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研團隊的大模型,類似于為各行各業提供了一個“大模型商場”。
談到目前火山方舟上一些大模型具體的商業表現,譚待坦言,目前相比全球最高水平,國內的一些大模型還存在差距,目前更多廠商還是在測試階段,“等到AI原生應用真正成熟,可能要期待底座大模型達到GPT-3.5以上的水平,到了年底這件事才會清晰一些。”
值得注意的是,譚待曾在接受采訪時坦言,火山引擎本身不做自研大模型,而是將接入多家大模型深度合作,為大模型廠商提供服務。
火山引擎智能算法負責人吳迪曾告訴澎湃新聞,和其他很多云廠商單純提供算力不一樣,火山方舟一方面會在資源和優化上與模型提供商進行深度合作,把推理成本往下打。另外一方面,火山算法團隊會和客戶做重點的應用共建和應用落地。“我們想催化整個大模型大算力在千行百業的落地速度,這應該是兩者最大的不同了。”
多箭齊發,進軍AI和大模型
業內的共識是,目前大模型的“幻覺”問題還未能徹底解決。所謂的“幻覺”,指的是大模型在回答提問時會出現答非所問、胡說八道的現象。
羅璇介紹,可以通過將大模型的思維過程、分析過程展現出來,從而使客戶意識到大模型的推理存在錯誤。另一方面,模型能力本身的能力提升,例如從GPT3.5升級到GPT4,也能緩解這個問題。此外,還能對模型進行精調,在通用基礎上加上一些領域的專業知識,也有利于在具體領域內讓幻覺變得更小、準確率更高。
雖然火山引擎主要定位于大模型服務商,但這只是字節跳動在AI布局的一部分,字節仍在低調進軍自研大模型。
公開資料顯示,早在2016年,字節就成立了人工智能實驗室AI Lab,聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。
8月17日,字節跳動公測基于云雀大模型開發的AI對話產品“豆包”,有網頁端、iOS和安卓客戶端,預置了英語學習助手和寫作助手兩個功能。
云雀大模型的定位是一個自然語言內容生成和內容理解的AI大模型,該模型基于字節機器學習平臺開發,它可以通過自然語言處理技術與用戶進行對話,回答用戶的問題,提供相關的信息和建議。
除了語言產品“豆包”,字節研究團隊還曾公布一個多模態大模型的學術研究項目BuboGPT,該模型能夠處理包括文本、圖像和音頻在內的多模態輸入,即指,不僅可以理解圖像、音頻和文本,并將這些理解與文本輸入和輸出相結合,還可以定位和描述圖像中的物體以及聲音的來源。
(文章來源:澎湃新聞)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。