從“百模大戰”到應用賽跑
2023年國內各大科技廠商和創業公司紛紛投入到大語言模型的研發中。從2023年3月百度率先推出“文心一言”,到阿里巴巴、科大訊飛、華為、京東、字節跳動等公司陸續推出了大模型產品,國內市場呈現出“百模大戰”的狀態。
然而,在國內各大廠商激戰大模型時,市場另有一種聲音逐漸升起——以百度創始人兼首席執行官李彥宏為代表的業內人士多次發言表示:“卷大模型沒有意義,卷應用機會更大。”
2023年年底,硅谷風頭大盛的一款大模型應用——AI視頻生成產品Pika,僅4個人的團隊就撐起來2.5億美元的估值。同一時期的另一個重要事件是,OpenAI切斷了字節跳動的API接口。順福資本創始合伙人、行行AI董事長李明順對此解釋道:“這實際上反映出大模型公司開始害怕強應用,因為大模型逐漸變成明牌,大家較量的不再是技術底座,而是有多少用戶、多少場景、有多少的錢持續去找算力。用戶數、場景、投資能力會成為這一波大模型競爭的核心,在此背景下,大模型本身的重要性降低了。”
技術進步明顯
大模型是2023年中國互聯網科技領域的一大關鍵詞。在ChatGPT的影響之下,由巨頭引領,2023年千億級參數規模大模型在國內陸續落地。具體來看,2023年3月百度發布“文心一言”;4月阿里發布“通義千問”,商湯科技發布“日日新”大模型;5月科大訊飛發布“星火大模型”;7月華為發布面向行業的“盤古大模型3.0”。賽迪顧問統計數據顯示,僅在2023年1—7月,國內共計64個大模型發布。
2023年9—10月,百度、阿里、騰訊、科大訊飛等公司陸續推出了其大模型的最新版本,模型能力向GPT-3.5和GPT4看齊。
2023年11月,新華社研究院中國企業發展研究中心發布的《人工智能大模型體驗報告3.0》顯示,國內大模型廠商在技術實力上呈現出百家爭鳴態勢,與2023年8月相比,當前中國大模型產品進步顯著。相比GPT-4等國際頂尖大模型,國內大模型起步較晚,但隨著國內大模型的加速發展,參數量、訓練量的堆積,部分國內大模型已經可以與國外大模型同臺競技。從參數量來看,智譜旗下ChatGLM2-130B的參數量達到1.3萬億,僅次于GPT-4,“文心一言”4.0的參數量也躋身萬億級別;從性能來看,“文心一言”“商量”等大模型在CLiB測評中的表現要好于Meta的LLa MA-2-70B大模型,與GPT-4的差距較小。
“2023年大模型領域的最大變化是模型的規模和應用范圍的迅速擴大,背后主要原因在于數據量的爆炸式增長和計算能力的提升。隨著互聯網的普及和數字化進程的加速,每天都在產生海量的數據,這些數據為訓練更大、更復雜的模型提供豐富的‘食糧’,使大模型能更好地理解和模擬現實世界。”中國信息協會常務理事、國研新經濟研究院創始院長朱克力說,隨著深度學習技術的不斷發展和成熟,模型的性能和效率也在不斷提升,為大模型的廣泛應用提供了技術基礎。同時,云計算、邊緣計算等技術的發展也為大模型的訓練和部署提供了強大的計算資源和基礎設施支持。這些因素,共同推動了大模型領域的快速發展和變化。
“智能對話很早就在學術界開始了研究,并且有落地的產品,比如微軟小冰,但它無法完成復雜任務。直到2022年11月OpenAI發布了ChatGPT-3.5,其解決問題的能力震驚世界。國內外的大量資本都在進入,導致大模型行業快速發展起來,僅國內就催生近300家大模型公司和科研機構。”八友科技CEO梁斌博士認為,市場的最大變化是所有參與者對大模型全面改造世界的信心,這個信心在之前是沒有的,但現在大家看到了重大機會,都敢于投入。
李明順指出:“其實國內主流大模型和國外大模型的差距還在一年半以上,但這并不意味著國內大模型不行。國內的資本市場、以及做大模型的公司相對比較務實,商業化的考慮更多一些,更愿意結合場景做模型開發或者應用開發。而國外巨頭更愿意在基礎研究和前沿技術探索上投入。”
需要看到的是,大模型仍在繼續向前發展中,行業也面臨著一些亟待解決的難題。一覽科技創始人兼CEO、工信部AI應用工作組成員羅江春對《中國經營報》記者指出,大語言模型在可擴展性、與人類價值的對齊、預訓練成本、真實性和可信度方面也面臨重大挑戰。
梁斌還指出,算力被卡脖子是目前看來比較嚴峻的挑戰。從數據的層面看,中國大模型對PGC數據(平臺產生的數據)的處理能力和美國差距還很大,因為很多高科技內容、論文都是英文。
開發應用前景更好?
在“百模大戰”的大環境之下,對于中小企業和創業者來說,卷入大模型的戰爭中有意義嗎?李彥宏多次發言表示:“百模大戰是對社會資源的極大浪費,更多資源應該放在超級應用上。”
“就像搜索引擎一樣,大模型最后可能也只有那么幾家能做起來。”千里馬招標大數據平臺創始人兼CEO王劍波對記者表示。
從技術的角度來說,OpenAI只是選擇了深度學習中的Transformer架構,然后進行了改進,最后出現了“智能涌現”。如亞馬遜CEO杰夫·貝索斯所言,大語言模型更像是“發現”而不是“發明”。
獵豹移動董事長兼CEO、獵戶星空董事長王小川表示:“了解大模型的原理之后,各個公司都能做大模型,訓練并行都是工程化的事情。”
“大模型訓練技術只是一方面的難題,另一方面還需要足夠的語料和足夠的算力,其實就是源源不斷的錢。”中關村現代信息消費應用產業技術聯盟副理事長包冉認為,“只要有錢,做大模型其實是一個簡單粗暴就能做的事情,但這個投入卻是百億美元級別,無論是成熟公司還是初創企業,動用百億美元做大模型的決策難度非常大。”
但需要直面的是,技術的快速發展已經引發了行業波動。“行業正在從對AI技術的探索階段,轉向深入理解如何將這些技術有效融入具體的業務流程和服務中。面對這種變化,關鍵在于找到并掌握真實的應用場景、即時有效的數據反饋體系、有效的技術應用開發能力以及相對完整的產業鏈支持。”羅江春說。
對于大模型公司來說,挑戰是怎么找到應用場景,因為場景其實分散在各行各業。王劍波對記者說道,大模型公司離客戶比較遠,常常是拿著AI的榔頭到處去找釘子,但很多場景可能是偽需求,AI創造新場景的概率也很小。
這也引發了一些大模型公司對于強應用、強場景公司的警惕。在2023年年底OpenAI就切斷了字節跳動的API接口。“像字節跳動這樣擁有巨大用戶基礎的公司是OpenAI所害怕的,因為像字節跳動的很多產品未來會嵌入AI。”李明順說道,尤其剪映(海外版為capcut)這樣的短視頻制作工具使用AI后,未來可能會成為全球第一的短視頻工具,遠遠超過今天大家看到的Pika。
對中小創業者來說,大模型領域的創新正轉向提供針對性強、高度定制化的垂直行業解決方案,即使是小的創業團體,站在大模型的肩膀上也能做出很成功的AI應用產品。
2023年國內大模型市場還有一個比較明顯的變化趨勢是多樣化和深度集成。“變得更加專注于特定行業的需求,提供更為精細化的服務,如法律、醫療和金融等,以及對應的深度集成趨勢,這種深度集成使得AI技術能更好地服務于特定行業的特定需求。”羅江春說道,市場對這些新型技術工具的接受度也在不斷提高,企業和消費者開始更多地依賴這些AI工具來提高工作效率和決策質量。同時,對于這些技術的適應性要求也在增加,即它們需要能夠根據不同行業和應用場景的具體需求進行調整。
“2023年下半年,在工業、游戲、電商、酒店等場景里已經出現了一些大模型應用。2024年基于場景和AI結合,產生大模型應用的情況還會繼續發生。”但李明順適時指出,如今大模型在行業中的認可度已經越來越高,憑空地去做一些基于大模型的輕度應用已經很難建立自己的壁壘,創業者還是應該結合自身的場景能力,尤其是基于過去積累的資源,通過行業壁壘來結合大模型做應用創新才有機會。
“垂直行業大模型、大模型應用的訓練需要大量的行業內的高質量數據,在此過程中,如何有效地獲取和處理數據、如何提高模型的性能和效率、如何保障應用的安全性和可靠性,都是亟須解決的問題。”朱克力表示。
(文章來源:中國經營網)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。