王小川發(fā)布搜索增強(qiáng)的Baichuan2接口產(chǎn)品,稱AI大模型不再是工具而是“新物種”
百川智能創(chuàng)始人、CEO 王小川
隨著新一輪 AI 大模型浪潮席卷一年多之后,王小川團(tuán)隊加速推進(jìn)大模型成果,以完成百川智能的生態(tài)布局。
鈦媒體App獲悉,12月19日下午,王小川創(chuàng)立的 AI 大模型公司百川智能,在北京發(fā)布基于搜索增強(qiáng)的Baichuan2-Turbo系列API(應(yīng)用程序編程接口),包含Baichuan2-Turbo-192K 及Baichuan2-Turbo產(chǎn)品,即日起產(chǎn)品可開放使用,從而逐步構(gòu)建百川智能完整的大模型技術(shù)棧。
百川智能創(chuàng)始人、CEO王小川表示,大模型+搜索構(gòu)成了完整的技術(shù)棧。搜索增強(qiáng)是大模型發(fā)展的必由之路,解決了搜索+長窗口結(jié)合產(chǎn)生的技術(shù)挑戰(zhàn)。他指出,將動態(tài)知識引入模型中,在垂直領(lǐng)域,尤其是領(lǐng)域知識不易公開獲取的場景,模型本身的領(lǐng)域知識嚴(yán)重不足,而借助搜索增強(qiáng),則可以實現(xiàn)大模型和領(lǐng)域知識、全網(wǎng)知識的全新鏈接。利用大模型+搜索增強(qiáng)方案可解決99%企業(yè)知識庫的定制化需求。
王小川對鈦媒體App表示,現(xiàn)在的 AI 大模型不是在創(chuàng)造工具,而是創(chuàng)造更像人一樣的“新物種”。
“在互聯(lián)網(wǎng)時代,火車、計算機(jī)、電腦、AI 更多是工具,都要求精確的方式進(jìn)行互動,提高人類效率。但今天,其實我們造的是‘新物種’,‘造’的是一種人類伙伴,它就不需要像工具一樣那么精確。所以在 AI 大模型時代下,我們對它的定義和思考方法是有別于此前的想法。”王小川表示。
據(jù)悉,百川智能創(chuàng)立于2023年4月10日,由搜狗公司創(chuàng)始人、前CEO王小川創(chuàng)立,旨在打造中國版的OpenAI,構(gòu)建中國最好的大模型底座,幫助大眾輕松、普惠地獲取世界知識和專業(yè)服務(wù),并在醫(yī)療、互聯(lián)網(wǎng)等領(lǐng)域應(yīng)用落地。其核心團(tuán)隊由搜狗、谷歌、騰訊、百度、華為、微軟、字節(jié)等科技公司的 AI 頂尖人才組成。
目前,百川智能的團(tuán)隊規(guī)模已經(jīng)超過200人,其中研發(fā)人員占比超80%。
過去的253天里,百川智能平均每四個星期發(fā)布一款大模型,已經(jīng)接連發(fā)布Baichuan-7B/13B、Baichuan2-7B/13B四款開源可免費(fèi)商用大模型,以及530億參數(shù)的Baichuan-53B、Baichuan2-53B、Baichuan2-192K三款閉源大模型。其中,Baichuan-7B/13B兩款開源大模型在多個權(quán)威評測榜單均名列前茅,累計下載量超過600萬次,在寫作、文本創(chuàng)作等領(lǐng)域能力已達(dá)到行業(yè)較好水平。
融資方面,截至目前,百川智能已公布首輪和A1輪戰(zhàn)略融資,累計融資額已超過3.5億美元(約合25億元人民幣),投資方包括阿里、騰訊、小米、深創(chuàng)投、基石資本等機(jī)構(gòu)。百川智能贊未透露當(dāng)前具體估值,僅表示融資后公司躋身于科技獨(dú)角獸行列。根據(jù)一般定義,獨(dú)角獸估值超過10億美元(約合72.66億元)。
8月31日,百川智能率先通過國家《生成式人工智能服務(wù)管理暫行辦法》備案,是首批八家公司中唯一一家今年成立的大模型初創(chuàng)公司,并于9月25日開放Baichuan2-53B API接口,正式進(jìn)軍To B企業(yè)端領(lǐng)域,開啟商業(yè)化進(jìn)程。
12月4日晚間,鴻博股份披露一則合同公告,百川智能最近與英博數(shù)科簽署了《云服務(wù)協(xié)議》,在協(xié)議期限內(nèi)英博數(shù)科向百川提供高性能計算或GPU算力技術(shù)等服務(wù)。協(xié)議涉及交易總金額預(yù)計13.82億元。
此次,百川智能主要圍繞“大模型+搜索增強(qiáng)”方案公布Baichuan2-Turbo系列API技術(shù)細(xì)節(jié)。
百川智能稱,Baichuan2-Turbo系列API在支持192K超長上下文窗口的基礎(chǔ)上,還增加了搜索增強(qiáng)知識庫的能力。即日起,API用戶可上傳文本資料來創(chuàng)建自身專屬知識庫,從而根據(jù)自身業(yè)務(wù)需求打造更完整、高效的智能解決方案。
百川智能表示,其自研的向量模型使用了超過 1.5T token 的高質(zhì)量中文數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并在通用RAG(檢索增強(qiáng)生成)的技術(shù)基礎(chǔ)上增加大模型自省技術(shù),以解決“幻覺”加重的現(xiàn)象。而且,百川智能通過長窗口+搜索增強(qiáng)的方式,在192K(19.2萬)長上下文窗口的基礎(chǔ)上,將大模型能夠獲取的原本文本規(guī)模提升了兩個數(shù)量級,達(dá)到5000萬tokens,通過搜索增強(qiáng)等技術(shù)放置在長窗口模型中有效節(jié)省了推理費(fèi)用和時間成本,并且稀疏檢索+向量檢索的方式可以實現(xiàn)95%的回答精度,高于單純的向量檢索80%的回答精度。
百川智能強(qiáng)調(diào),搜索增強(qiáng)技術(shù)是大模型落地應(yīng)用的關(guān)鍵,能夠有效解決幻覺、時效性差、專業(yè)領(lǐng)域知識不足等阻礙大模型應(yīng)用的核心問題。這種技術(shù)不僅有效提升了模型性能,并且使大模型能“外掛硬盤”,實現(xiàn)互聯(lián)網(wǎng)實時信息+企業(yè)完整知識庫的“全知”,而且還能讓大模型精準(zhǔn)理解用戶意圖,在互聯(lián)網(wǎng)和專業(yè)/企業(yè)知識庫海量的文檔中找到與用戶意圖最相關(guān)的知識,然后將足夠多的知識加載到上下文窗口,借助長窗口模型對搜索結(jié)果做進(jìn)一步的總結(jié)和提煉,更充分地發(fā)揮上下文窗口能力,幫助模型生成最優(yōu)結(jié)果,從而實現(xiàn)各技術(shù)模塊之間的聯(lián)動,形成一個閉環(huán)的強(qiáng)大能力網(wǎng)絡(luò)。
據(jù)鈦媒體App了解,目前,基于百川通用大模型的搜索增強(qiáng)服務(wù)價格為0.03元/次(接口自動判斷調(diào)用搜索增強(qiáng)服務(wù)的次數(shù));而基于知識庫API接口,費(fèi)用包括模型調(diào)用Embeddings和文件數(shù)據(jù)存儲兩部分,收費(fèi)價格分別為0.0005元/千tokens,以及每天每GB(千兆字節(jié))內(nèi)存1.5元。
王小川12月18日公開演講中表示,上個時代的重要工具突破是“搜索引擎”,其作為人類文明的“載體”,成為信息時代的中心應(yīng)用。而今天,ChatGPT等 AI 大模型所代表的是信息本身的收集和整理,并且在信息之上能產(chǎn)生知識。因此,基于基礎(chǔ)大模型,未來大模型將分為三種發(fā)展模式:生產(chǎn)力提升、智能助理和開放世界,從而重塑現(xiàn)有行業(yè)以及創(chuàng)造全新價值。
“今年下半年之后(至今),我們看到的不再是一股腦地追最新的技術(shù),而是大模型與現(xiàn)有搜索產(chǎn)品的結(jié)合,這種結(jié)合能夠顯著減少幻覺問題和時效性問題,從而實現(xiàn)更有潛力的一個應(yīng)用?!蓖跣〈ū硎?。
百川智能表示,目前,多個行業(yè)的頭部企業(yè)已與百川智能達(dá)成合作,在深度融合百川智能的長上下文窗口和搜索增強(qiáng)知識庫的能力基礎(chǔ)上,對自身業(yè)務(wù)進(jìn)行了智能化升級。
談及更大參數(shù)模型是否開源,王小川對鈦媒體App等表示,“從開源角度看,7B(70億)、13B(130億)這種參數(shù)模型比較合適的,未來可能會考慮把更大模型打開(開源),但在目前情況下,百川希望讓‘這些企業(yè)最輕巧的能用(性能)最低GPU就能跑起來’。如果遇到復(fù)雜問題的時候,要么是自研,要么就交給百川來進(jìn)行?!?/p>
王小川指出,“中國(大模型)現(xiàn)在總體分成三個階段,第一階段是恐慌期,OpenAI有了之后看中國公司還不行,數(shù)據(jù)飛輪美國先跑起來,是不是那個 AI 要來了,大家有這個探討;第二階段我做百川,大家開始火熱地關(guān)注這件事;第三階段,大模型學(xué)術(shù)進(jìn)展是很快的,每天會有新的進(jìn)展出來,技術(shù)人員每天都要跟進(jìn)最新東西,不斷迭代、不斷改進(jìn),行業(yè)發(fā)展速度其實超出外界看法,目前需要快速迭代技術(shù)?!?/p>
王小川最近表示,百川智能在進(jìn)行超級應(yīng)用的探索。他期望在未來兩年內(nèi),百川智能能證明大模型能夠在健康、娛樂和創(chuàng)造上成為超級應(yīng)用,帶給人們像互聯(lián)網(wǎng)時代那樣的巨大幫助和希望。五年后,人們可能會有新的互動方式,比如擁有機(jī)器人、戴著VR眼鏡以及每個人都有數(shù)字分身等。
“五年的時間太長,能夠想到兩年的畫面,我就很滿足了?!蓖跣〈ū硎?。
王小川曾對外透露,預(yù)計明年一季度前后推出百川智能的“超級應(yīng)用”。但鈦媒體App問及目前“超級應(yīng)用”進(jìn)展情況和發(fā)布時間等問題,王小川未予回應(yīng)。
“我覺得今天能做體量比較大的模型,還能做超級應(yīng)用,這種公司最多5家?!蓖跣〈▽︹伱襟wApp等表示,“今年是中國 AI 大模型發(fā)展的元年,明年國內(nèi)各家公司都會有相應(yīng)的成績出來。而今天,大家需要把精力放在模型本身,應(yīng)用還處于初期狀態(tài),明年會差不多?!?/p>
(作者|林志佳)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。