大模型應用如何點燃?
ChatGPT 還沒有顛覆世界。
身處“第三次信息革命”,很多人被濃烈的FOMO(Fear of Missing Out)情緒裹挾。
業界的共識是,隨著技術迭代曲線放緩、基礎大模型賽道的競爭格局企穩,生成式AI市場的性質正在發生變化,更多的創新和價值創造正在向應用層匯聚。但目前的現狀是,2C端入口難覓超級應用,2B端高附加值的閉環應用尚未規模化呈現。
從“百模大戰”到“降價潮”,從“卷技術”到“卷價格”再到“卷應用”,真正可行的商業模式究竟幾何——擅長回答問題的GPT們還無法給出答案。國內廠商螞蟻、字節、騰訊以及初創企業已經在趟不同的路了。或許,他們的行動能帶來未來的答案。
國內首款辦事型AI生活管家“支付寶智能助理”
當AI進入“補貼互聯網時代”
李開復說,美國人的“ChatGPT時刻”發生在17個月前,但中國用戶卻還在翹首以待屬于自己的“中國式AI時刻”。
比“AI時刻”更早到來的是中國人熟稔的大模型“價格戰”。6月,OpenAI發出封禁郵件選擇“脫鉤”,幾乎所有國產大模型均表示要以降價或免費的方式兼容OpenAI。5月,字節跳動旗下云平臺火山引擎宣布,其自研的豆包大模型正式對外提供服務,并給出大幅低于行業主流水平的定價。隨后,阿里、百度、騰訊、訊飛等廠商紛紛跟隨降價。
行業計價標準從以分計價發展到以厘計價。可以說,“百模大戰”硝煙未凈,國內大模型已從參數規模、性能指標“卷”到了token價格。AI快速進入了補貼互聯網時代。
各大模型降價的目標很明確:吸引開發者,推動大規模應用落地。但有業內人士認為,當前的大模型價格戰,表面上是在降低使用門檻,實際則是由于市場需求不足,企業不得已而為之。
在供給端,價格戰的背后是當前大模型產品能力的逐漸趨同——這也并不是僅僅中國市場的問題,Scaling Law 是否還會持續有效最近受到熱議也與此有關。
最典型的信號是GPT-5的一再跳票。OpenAI首席技術官Mira Murati近日透露,GPT-5有望在2025年底或2026年初推出,而市場此前的預測時間是2023年底或2024年夏季。
獵豹移動董事長兼CEO傅盛認為,目前大模型在性能上遭遇了提升瓶頸,各家難以拉開顯著差距,于是降低成本、降低售價成為了當前各家公司的首要任務。
低價是優勢,但不一定構成競爭力。只有真正能結合場景,把大模型用起來,才能疏通供需兩端。
工作與娛樂:大模型應用的兩個場景
中國大模型市場的競爭無疑非常激烈。但歷史經驗告訴我們,競爭是產品創新最重要的催化劑。
沒有科技公司想錯過這波AI應用浪潮,中國的大模型技術已經“卷”出了多種多樣的創新應用。
一些互聯網科技企業集體出動:支付寶開發出了智能助理,下拉支付寶幫你辦事,簡單方便,實用;百度已通過文心一言大模型調整搜索結果的傳統信息,還發布了多個AI社交應用、AI繪畫工具與醫療AI產品;微信推出了元寶小程序,實現AI搜索、文檔總結和AI作圖功能;科大訊飛除了“訊飛星火”聊天機器人,還推出了AI口語助手和多個提高效率的工具;商湯科技不僅發布了其大模型,還推出了生成式AI應用如“商量”和“秒畫”。
創業公司同樣積極入局,典型者如月之暗面(Moonshot AI)旗下國產大模型Kimi智能助手一度憑借200萬字級的長上下文處理能力驟然走紅。
總結目前中國市場上的大模型應用,可以大致分為娛樂場景下的對話工具和工作場景下的生產力工具。
前者如抖音“豆包”、微軟“小冰”、微信“小微”,它們普遍具備聊天、陪伴、寫作文案、翻譯等多種功能。這類大模型應用富有情感和互動體驗,可以滿足用戶的情感需求。
而生產力工具典型者如Kimi、百度飛槳(PaddlePaddle)以及各類智能客服機器人、寫作助手、代碼助手等等,它們往往聚焦于某一具體的生產力環節,通過工具的智能化幫助企業實現效率提升。
據了解,一些傳統辦公軟件甚至已經可以支持寫Java代碼。沒有專業IT團隊的制造業工廠的員工可通過簡單的培訓學習,自主開發特定需求的應用程序。
同時,編程助手確實已成為大模型落地的重要場景。螞蟻已經有一半員工用他們自己研發的代碼大模型codefuse寫代碼,去年的支付寶“五福”項目開發里,程序員的工作效率提升了30%。騰訊云稱,“AI代碼助手對鵝廠整體研發效能的提升,超過20%。”
可以說,通用生產力工具和娛樂型對話代表著中國大模型應用發展的兩個方向。生產力工具專注于提升企業效能和決策能力,推進各行業智能化變革;而娛樂型對話則致力于提升用戶體驗,通過互動和娛樂功能增加用戶參與度。
這兩條路徑展示了大模型在不同領域的應用潛力。雖然未來的商業化前景還是未知數,但龐大的用戶規模和既有的場景能力,意味著巨大的增長潛力。
專業智能體,中國大模型的下一步
如果我們將觀察大模型的視野向深處探究,中國的智能體未來將走向何方?
在筆者看來,智能體的生命力在于應用,而應用的核心在于能否真正解決用戶的問題。
沿著這一邏輯,在既有的工作和娛樂之外,大模型還有另外一個應用場景的增量,那就是垂直領域專業服務。越是復雜的問題,越是專業的領域,越能孕育出更具價值的智能體。最典型者如醫療、金融等行業。
中國蓬勃發展的移動互聯網為大模型行業提供了豐富而復雜的應用場景,以醫療和金融為代表的高專業度、高壁壘行業,雖然已經初步實現數字化或線上化,但在大模型時代,誰能深刻改造這些場景,破解更復雜的問題,誰就能抓住發展的先機。
在2024年世界人工智能大會上,螞蟻集團一連對外展示了三個“AI管家”,分別對應金融、醫療和生活場景。在這些場景下,智能體為用戶提供的都是專業服務——不是簡單的聊天式對話,而是要在對話交互之后配合理財分析、輔助診療、消費預定等一系列服務。
螞蟻集團董事長兼CEO井賢棟在世界人工智能大會上提出“專業智能體”概念,“從我們的實踐來看,專業智能體是大模型落地嚴謹產業的最佳路徑。”
螞蟻集團的最新動作,也代表了中國大模型產業發展的一個面向。
螞蟻集團大模型應用總經理顧進杰向鈦媒體App進一步闡釋了“專業智能體”。所謂“專業”,即指向那些更需嚴謹的產業,需要在相當程度上確保服務的準確性和可靠性。
業界普遍認為,通用大模型落地嚴謹產業,面臨著三個“能力短板”:領域知識相對缺乏、復雜決策難以勝任,以及對話交互不等于有效協同。
這幾點得到顧進杰的認同。他提到,以醫療行業為例,醫療行業的大量知識并沒有在互聯網上呈現,甚至很多都是醫生經驗性的認知積累。行業內擅長復雜推理的專家,其最具價值的思維框架、思維模式遠未形成文檔化或者數字化。
更進一步地說,單純的對話形態產品一定解決不了全部問題——比如,問答可以實現醫療問診,但是不能幫你掛號、幫你回復藥品相關問題以及幫你復診。
為了解決這些問題,螞蟻集團采取了多層次的策略。
以醫療行業為例,螞蟻做的第一件事,就是強化大模型的專業認知。基于螞蟻百靈大模型開發的支付寶醫療大模型 ,背后是支付寶與合作機構構建的全國權威醫學專業教材醫療知識圖譜;螞蟻和上海市一醫院聯合打造Al就醫助理,背后是上海市一醫院自建的“服務與病例知識庫”。
這些垂直領域不同類型的數據,進而被抽象成不涉及隱私信息的領域知識,“合成〞為大模型的“專業教材〞。
在處理復雜決策方面,螞蟻的大模型方案中引入了“專家級決策框架(FoE)”——即通過一種框架機制,讓AI的決策機制線性化、流程化,讓AI在某一專業領域模仿人類專家的思維方式進行決策。例如,醫療管家“安診兒”不僅能解答問診問題,還能提供精細的治療建議。智能金融管家則通過綜合分析市場和風險,為用戶提供個性化的投資方案。
顧進杰還提到,“RAG(檢索增強生成,可以在一定程度上克制幻覺)在嚴謹行業下不能完全解決問題,RAG實際上也會引入其他類型的幻覺錯誤”。在螞蟻看來,單一大模型無法解決全部問題。專業智能體的進步,還需要更多行業專家、生態伙伴的參與,全行業的協作,可以有效提升智能體的“專業性”。
第二個層次的工作,是讓智能體的能力更具綜合性。螞蟻的策略是多智能體協作。專業智能體不僅要在單一領域表現出色,還可以覆蓋用戶的多種需求。比如,在醫療場景中,用戶可以通過“安診兒”幫助病情診斷,并由“生活管家”安排就醫相關交通和住宿。對用戶而言,這些交互都可以在支付寶App內完成,支付寶App也由此從移動互聯網入口升級為智能AI入口。
如果將大模型時代與移動互聯網時代相比照,在移動互聯時代,APP、小程序是應用的關鍵載體;大模型時代,智能體則成為新的應用范式,聚焦嚴謹領域的“專業智能體”是中國智能體的新方向所在。
在今年的世界人工智能大會(WAIC)上,專業智能體和它背后的相關技術也受到了廣泛關注和認可。支付寶針對生活場景開發的支付寶智能助理入選八大“鎮館之寶”,而螞蟻與浙江大學合作開發的用于提升AI在嚴謹產業中的認知、推理和決策能力的“ 智能認知決策技術與平臺”也獲得了2024WAIC的SAIL(卓越人工智能獎)TOP30。
在井賢棟看來,通過專業智能體的深度連接,Al會像互聯網一樣,帶來服務的代際升級。
盡管在中國,關于大模型的商業模式的討論尚顯早期,但智能體,尤其是專業智能體,蘊藏著巨大的潛力。通過“專業智能體”實現各領域的深入應用,解決用戶的實際問題,這是大模型的中國機遇,超大市場規模和海量需求,也會釋放專業智能體的商業價值。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。