首頁 > AI資訊 > 最新資訊 > 埋頭鉆研一年后,階躍星辰交出了第一份答卷

埋頭鉆研一年后,階躍星辰交出了第一份答卷

新火種    2024-04-13

歷經去年持續一年之久的百模大戰后,今年伊始,落地應用開始成為大模型的主流敘事方式。本以為,在月之暗面、智譜、MiniMax、百川、零一萬物等一眾明星企業之后,關于通用大模型的格局既定,沒想到,平靜水面下泛起漣漪,新玩家浮現……

其實,“新玩家”一詞用來形容階躍星辰并不恰當,去年年末,階躍星辰以一家通用大模型初創公司的身份開始出現在公眾視野,AI科技評論當時也就此做過報道。

但彼時網上關于這家公司的公開信息并不多,公司屬于微軟系創業,由前微軟 NLP 大牛姜大昕創立,成立于2023年4月,發力自研大模型+AI原生應用,僅此而已,寥寥數筆就可以勾勒出大致輪廓。

神秘、低調,大概是階躍星辰留給大家的第一印象。

而如今,在距離公司成立近一周年的時間點,階躍星辰交出了第一份答卷。

堅持一條自研大模型+AI原生應用的路線

今年3月底,階躍星辰正式對外發布自研大模型——Step 系列通用大模型,包括 Step-1 千億參數語言大模型、Step-1V 千億參數多模態大模型,以及 Step-2 萬億參數 MoE 語言大模型預覽版。

同時,階躍星辰還發布了兩款 ToC 產品——躍問與冒泡鴨。

躍問是一款 AI 聊天類應用,定位個人效率助手;冒泡鴨則是一款由劇情和角色構成的 AI 開放世界,可以為用戶提供娛樂和社交。

埋頭鉆研一年后,階躍星辰交出了第一份答卷

整體來看,躍問作為一款 AI 聊天類應用,定位是個人效率助手,頁面簡潔明了,目前可支持上傳圖片、文檔和網址,以及具有聯網搜索功能。據了解,當前躍問的知識庫信息儲備截止到2023年,后面的信息可基于聯網搜索提供。

從很多用戶的使用反饋來看,躍問的效果得到了一眾好評,“對于上傳的文檔,躍問可以快速輸出總結結果,而且總結的能力還不錯。”“計算會調用Python,保證了數據的準確性?!薄澳軌蜃R別圖片?!?/p>

而說到圖像識別能力,這也是躍問的顯著優勢之一,基于背后的多模態內容理解能力,它能夠幫助用戶識別真實世界的萬事萬物,像是理解和分析復雜的金融領域的數據圖表、理解解讀熱門圖片中的深意等。

比如,在輸入框輸入一份某公司的營業數據,要求將其轉換為表格形式,并計算出每年的凈利潤增長率。根據輸出內容可以看出,躍問明確訴求后,快速對數據進行分析、處理,給出結果。

埋頭鉆研一年后,階躍星辰交出了第一份答卷

埋頭鉆研一年后,階躍星辰交出了第一份答卷

另外,針對當前的熱門電影《你想活出怎樣的人生》,也輸入了一張劇照,讓躍問幫忙解讀其中的意義,后者給出了以下的解讀內容:

埋頭鉆研一年后,階躍星辰交出了第一份答卷

可以看出,對于圖像中的內容,躍問可以給出具體的描述,而對于其中的內涵和情感,剖析得也不錯。

而另一款產品冒泡鴨則呈現了一個全新 AI 開放世界。

在這里,用戶可以探索故事、創作角色,沉浸屬于自己的開放世界。不僅如此,用戶還可以選擇自己上手去創造屬于自身的獨特角色。

埋頭鉆研一年后,階躍星辰交出了第一份答卷

據體驗,目前冒泡鴨上面用戶玩的比較多的故事劇情是《逃離精神病院》,在對話過程中,不僅可以自定義回復內容,上面還提供選項,從而讓用戶以一種更便捷、快速的方式進入沉浸式劇情體驗。

不管是躍問還是冒泡鴨,一款好的、能夠滿足用戶需求的產品背后都離不開大模型的支撐。

正如階躍星辰創始人、CEO 姜大昕所堅信的,模型和產品的關系就像是靈魂與皮囊,靈魂更加有趣一點,才能顯示出產品的不同。

而躍問和冒泡鴨產品的靈魂就是此次發布的兩款自研千億級參數大模型——Step-1 千億參數語言大模型和Step-1V 千億參數多模態大模型。

據了解, Step-1 千億參數語言大模型在邏輯推理、中文知識、英文知識、數學、代碼方面表現出色,性能全面超越GPT-3.5。

Step-1V 千億參數多模態大模型擁有出色的圖像理解、多輪指令跟隨、數學、邏輯推理、文本創作等能力。

國內的大型模型評估平臺“司南”(OpenCompass)多模態模型評測結果顯示,Step-1V 位列第一,性能比肩 GPT-4V。同時,Step-1V 的多模理解能力突出,可以精準描述和理解圖像中的文字、數據、圖表等信息,并根據圖像信息實現內容創作、邏輯推理、數據分析等多項任務。

躍問和冒泡鴨可以對電影海報、網絡熱門表情包等圖像進行多方位解讀,依托的就是該能力。

即便階躍星辰此次發布的兩款千億參數模型已經帶給大家足夠的驚喜,但這只是第一步,他們腳踏實地的同時還在仰望星空,向著通用人工智能(AGI)的方向奔去。比如,階躍星辰這次還發布了 Step-2 萬億參數語言大模型預覽版,直接將大模型的戰場升級到“萬億參數時代”。

其實,階躍星辰從成立起,設定的航向就是AGI,并基于此目標,總結出了一條獨特的前進路線。

一方面堅信Scaling Law方向,模型參數量決定模型智能水平的上限,完成 Step-1 千億參數語言大模型的訓練后,馬不停蹄地投入 Step-2 萬億參數大模型的訓練工作。另一方面是認識到多模理解和生成的統一是通往AGI的必經之路。

這也是為什么在大模型戰場“打得”如火如荼的時候,階躍星辰還能耐得住寂寞,埋頭磕技術難點,鉆研打磨產品,直到現在才正式發布。

抵達AGI的決心與底氣

盡管探路者曾經一次次想象、描摹抵達AGI后的景象會是如何,但不可否認,大模型是一門流動的、仍在成長的技術,OpenAI 也還只是路上走得比較快的探索者,每一個高舉旗幟的探路者都有可能通往終點。

而那些在理念、技術、人才、資本的累積上更豐富的玩家,更有可能接近正確答案。

在理念與技術上,階躍星辰交出的答卷已經言明了,而人才上,階躍星辰擁有一支強大的隊伍。

早在今年年初,一位接近階躍星辰的投資者就告訴,階躍星辰在算法、數據、系統方面都有足夠的人才。

只是那時出現在公眾視野的只有微軟出身的 CEO 姜大昕,大家對其他核心團隊成員信息知之甚少,直到這次階躍星辰正式對外公布。

據了解,目前階躍星辰的團隊規模在 150 人左右,核心創始團隊成員包括創始人、CEO 姜大昕、系統負責人朱亦博、數據負責人焦斌星。

姜大昕大家都很熟悉,早年從紐約州立大學布法羅分校取得計算機科學博士學位后,赴新加坡南洋理工大學計算機科學與工程學院任助理教授,2007 年加入微軟亞洲研究院任首席研究員。

在決定離職創業前,姜大昕任微軟全球副總裁,負責的團隊規模一度達到 400 多人,包括研究搜索和 AI 算法、應用程序和平臺的應用科學家、工程師等。

而在微軟長達16年的職業生涯,讓姜大昕在機器學習、數據挖掘、自然語言處理和生物信息學等方面累積了豐富的研究和工程經驗。

系統負責人朱亦博也是微軟出身,曾在字節跳動、Google等公司任職,擁有多次單集群萬卡以上的系統建設與管理實踐經驗。

數據負責人焦斌星曾擔任微軟必應引擎核心搜索團隊負責人,負責利用數據挖掘和NLP算法優化索引和搜索質量。

而基于強大的人才儲備,階躍星辰自成立起,便以Scaling Law為準則,在算力、數據、算法和系統這四大要素上進行綜合布局,鑄就自身高高的護城墻。

算力上,階躍星辰采取的是“自建機房+租用算力”的做法;系統方面,有經驗豐富的朱亦博坐鎮;數據方面,由焦斌星負責;而算法方面,由創始人姜大昕負責。

對于大模型的研發來說,參數量從千億增長到萬億,是一個數量級的變化,對算力、系統、數據、算法都有著極高的要求,而目前階躍星辰作為國內第一家邁入萬億參數階段的初創公司,這方面的積累在業界來說也是極為罕見。

資本方面,目前階躍星辰在融資方面并未有消息透露。但是,單憑他們在完成 Step-1 千億參數語言大模型的訓練后,又火速開啟 Step-2 萬億參數大模型的訓練,就可以看出來,階躍星辰“不差錢兒”。

另外,一位投資人還向表示,除了上述的諸多硬性優勢外,階躍星辰還有一個長板,那就是團隊成員大多歷經過上一代 AI 的浪潮,該踩的坑也踩了很多,試錯經驗更豐富,在這一波浪潮中會避免踩一些不必要的坑。

階躍星辰會是最后一家通用大模型公司嗎?

這是在此次階躍星辰正式公開亮相時,大家的疑惑與好奇。

畢竟當大模型故事線延伸至今,落地、商業化已然成為主旋律,還會有誰會選擇,甚至成功切進通用大模型賽道?似乎很難,看似剛剛入場的階躍星辰,其實也是早早入局,潛心鉆研,等待一個厚積薄發的時機。

不過,可以肯定的是,隨著萬億參數大模型浮出水面,通往AGI的戰場已經升級,進入新階段。接下來,水面下是否還有像階躍星辰這樣的公司在暗地涌動、等待,都是一個未知數,唯一確定的是,在這場競賽中,故事變得越來越精彩了。

本文作者(vx:youlinancy)長期關注月之暗面、階躍星辰等 AI 初創公司的大模型敘事,不止于技術發展、人物故事、行業動態,歡迎交流!

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章