2024WAIC|巖芯數智RockAI劉凡平:讓每個機器人都有自己的大腦
2024世界人工智能大會于7月4日至7日在上海隆重舉行,來自國內外的數百款大模型集體亮相,幾十場圍繞大模型的主題論壇,讓大模型成為2024世界人工智能大會當之無愧的“頂流”。本次大會上,RockAI攜Yan1.2多模態大模型亮相,以其無損跑通樹莓派的卓越性能和跨模態能力,吸引了參展觀眾的目光。
大會期間,RockAI CEO劉凡平做客直播間,就大模型與AI機器人這一話題進行了深度交流,他還帶來了一款具備高度交互能力的多模態機器人——小智。
劉凡平介紹,“小智”機器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片。并且,采用非Transformer架構的Yan1.2多模態大模型能夠在此機器人上流暢運行。
劉凡平在現場展示了小智在完全斷網和極低算力設備上的強大多模態能力。首先,他向小智傳達“你看到了什么”的指令,小智僅用頭上一顆30萬像素的攝像頭就能對環境進行精準感知,并對采訪間的環境和人物形象狀態進行了具體描述。然后,他又讓小智在四步之內完成一首七言絕句,小智也在規定的四步之內流暢完成了詩詞創作。最后,劉凡平拿出一本故事書放在小智面前,小智很快反應并對內容進行閱讀和總結。
Yan1.2與低算力的“跨域融合”
實現多模態大模型在低算力芯片上并非易事,他認為其中主要有三個難點。其一是將一個原本龐大且復雜的大模型嘗試部署到資源受限的環境時,直接運行幾乎是不可能的。“早期嘗試通過大量的量化裁剪,雖然勉強實現了運行,但效率極低,每秒僅能處理一到兩個token,且由于模型的壓縮和裁剪,其性能已大幅受損。”劉凡平說道。
為解決此問題,RockAI探索了非傳統路徑,采用創新的Yan架構。該架構的核心創新在于其內置的仿生神經元驅動選擇算法,該算法模擬生物神經系統的工作機制,通過動態激活與任務相關的神經元部分,而非全面激活,從而高效且精準地利用神經元,實現大模型在樹莓派上的優化運行。
“第二個難點是確保遷移到樹莓派的大模型保持其完整性和自主學習能力。這要求模型在部署過程中避免量化裁剪,因為裁剪會嚴重損害其再訓練能力,甚至使其無法有效學習。因此,我們的目標是實現無損遷移。”劉凡平如是說。為實現這一目標,RockAI對模型進行了全面而細致的優化,包括動態參數量調整等關鍵要素,以確保模型在保持原有特性的同時,能夠適配樹莓派的硬件限制。
第三個難點是將復雜的自然語言處理有效地部署到資源受限的樹莓派平臺上,不僅挑戰了自然語言處理的難度,還因多模態特性要求模型能處理多樣化的輸入,而樹莓派上的低算力更是加劇了這一難度,對模型的場景理解和處理能力提出了極高要求。
劉凡平將難點逐一突破的原因歸于創新,他將創新劃分為三個遞進層次:應用型創新、架構創新及基礎研究創新。應用型創新作為行業共識,是起步的基石。他表示,RockAI通過架構創新,在大模型領域推出Yan架構大模型,實現了訓練效率和吞吐量的顯著提升,超越了傳統Transformer架構的性能。
據悉,RockAI推出的同步學習理念使模型在推理的同時進行知識更新和學習,無需像云端大模型一樣“返廠”進行再次更新或預訓練。從而實時、有效且持續性地提升大模型的智能密度,應對各類個性化場景中出現的問題。
劉凡平認為要實現真正的自主學習,基礎研究創新是關鍵。當前AI企業底層技術廣泛依賴的反向傳播算法,他認為其限制了模型的自主學習能力。因此,RockAI提出了同步學習的創新概念。“同步學習作為一種革命性的進化策略,實現了訓練與推理的并行處理,打破了傳統訓練流程的束縛,縮短了訓練周期、降低了成本,為模型面對新知識更新提供了更高效的學習方式。”
最重要的是算法
目前,大模型市場的競爭可以用“百模大戰”來形容,有的大模型廠商將發展方向放在卷算力、卷參數,也有AI大模型廠商掀起“降價潮”以搶占市場。
對此,劉凡平表達了他的看法:“在人工智能領域,算力、數據和算法是三大基石,其中最重要的是算法。隨著技術進步,算力將會持續增強,但數據未來一定會越來越少,少不是說數據變少了,而是模型依賴的數據會越來越少。”算法的重要性在于其引領了AI發展的每個關鍵階段,從感知器到人工神經網絡,再到深度學習技術,每次技術飛躍都離不開算法或架構的創新。
他表示,在RockAI的探索中,基礎算法與架構的研究至關重要。鑒于當前大模型技術仍有巨大潛力待挖掘,且如比爾·蓋茨所言,部分技術已近性能極限,這凸顯了在基礎算法上尋求突破的重要性。
劉凡平認為當前的首要任務是優化架構和反向傳播算法,這兩者是AI領域的主要瓶頸。他表示,反向傳播算法似乎已趨于成熟,但學術界對該領域目前正持續關注和深入探索。
劉凡平預計,反向傳播算法的突破將帶來三大變革:算力成本降低、數據使用效率提升以及模型自我學習能力的顯著增強。因此,RockAI在過去一年中專注于基礎算法研究,“因為我們認識到每個參數所代表的信息量是衡量模型價值的真正標尺。通過優化算法,我們將提升每個參數的信息承載能力,進而推動人工智能技術邁向新的高度。”
機器人落地關鍵在于大腦
當前人工智能機器人發展迅速并且功能不斷完善,但并沒有實現大規模商用。對此,劉凡平表示“機器人落地的關鍵是在于其大腦。”他認為,具身智能機器人價格較高,主要原因是智能能力不夠,缺乏實際應用場景,導致銷量不佳,形成“智能-場景-銷量”的惡性循環。機器人目前運動控制能力較強,但缺乏“大腦”,這是阻礙其廣泛落地應用的關鍵因素。
未來趨勢是希望讓世界上每一臺設備都擁有自己的智能,以提升其適應更多場景的能力,而不僅僅是作為展示品。通過為機器人配備多模態大模型,可顯著提升其表達能力和理解能力,使其在教育陪伴等領域具有應用價值。未來若能在更多場景中安裝智能大腦,機器人將變得更加聰明和實用,從而促進其更廣泛的落地應用。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。