首頁 > AI資訊 > 最新資訊 > AIGC年度激辯:3輪交互內準確率95%以上才能真正應用|中國AIGC產業峰會

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用|中國AIGC產業峰會

新火種    2024-05-20

“ROI是衡量AIGC應用價值的唯一標準。”

“現在AIGC客戶的需求有兩類,一類是嘗鮮,一類是真正在工作流里應用。后者如果類比AI 1.0時代的應用金標準,在AI 2.0時代,應該就是在至少3輪交互內要達到95%以上的準確率。”

“AIGC應用落地的關鍵,還是要從業務和場景中來,到業務和場景中去,拿結果說話。”

“如果是高質量的、投入真金白銀去做的百模大戰,那么就是有意義的。”

……

從ChatGPT帶動AI產業爆火,再到現在越來越多AIGC應用的出現,AI行業已經從初步探索期,發展到應用落地期。今年也被很多人稱為“AIGC的應用元年”。

那么對于所有AIGC玩家來說,都會面臨一個現實的問題:怎么將AIGC應用落地,如何賺錢?

圍繞這一問題,阿里云通義大模型業務負責人徐棟、輕松集團技術副總裁高玉石和瀾碼科技創始人兼CEO周健在本次中國AIGC產業峰會的圓桌環節,詳細分享了自己的看法。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

公司產品類型、模式都不同的三位玩家,對AIGC應用落地的探索都到了什么階段?

現在的AIGC應用,又有什么價值?

以及最重要的,AIGC應用如何落地、怎么賺錢?

中國AIGC產業峰會是由新火種主辦的行業峰會,20位產業代表與會討論。線下參會觀眾近千人,線上直播觀眾300萬,獲得了主流媒體的廣泛關注與報道。

話題要點AIGC應用已在不同細分賽道上崗AIGC產業確實越來越卷,但也越來越成熟AIGC應用落地變現的方式AIGC應用的價值如果是高質量、投入真金白銀的百模大戰,那么是有必要的

(圓桌環節由新火種主編金磊主持。在不改變原意的基礎上,新火種對內容進行了編輯整理。希望能夠給你帶來更多的啟發與思考。)

論壇實錄

(話題要點為后添加)

AIGC應用已在不同細分賽道上崗

新火種金磊:感謝各位嘉賓朋友參加這次圓桌,我們這次峰會的主題叫做「你好,新應用」。為此我們邀請到不同產業和領域的落地先鋒代表。

從ChatGPT問世到現在一年半的時間里,我們看到生成式AI行業發展有一個非常明顯的趨勢:從基礎層的建設和探索,逐步在向怎么把他們用起來去發展,今年也被很多人認為是AIGC的應用元年。

我們覺得在這個時間節點上有必要坐下來聊一聊與AIGC有關、且非常接地氣的話題:「怎么落地,如何賺錢」。

緊扣這次圓桌的話題,我想先問一個開門見山的問題,就像剛才快刀青衣老師說的,不要告訴我大模型有多厲害,要告訴我它們用得怎么樣了。

首先想請教一下高總,輕松集團在去年年底的時候對輕松問醫Dr.GPT做了全面升級,相應發布了7個創新應用,目前病患和醫生對新應用的使用情況是怎么樣的?

輕松高玉石:我來介紹一下我們輕松集團的落地情況,算是對應快刀青醫老師說的企業落地實踐的過程。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

我們在去年上半年發布了輕松問醫的大模型,是醫療健康領域的大模型。

隨著下半年整個應用和場景的拓展,我們在去年年底做了升級。基于輕松問醫大模型,還有具體應用場景里面應用模型的結合,我們在醫生和患者端確實做了落地的應用,目前看效果還可以。

比如醫生端,我們會給醫生提供過往積累了很多的病例數據,并且我們做了病例識別AI模型,結合輕松Dr.GPT對于健康醫療數據識別的能力和推理能力,我們向臨床研究部分推出臨床預分析的數據能力。

做臨床研究的這些醫生,他臨床收集的病例只需要提交上來,很輕松就可以拿到識別結果包括結構化,甚至說他在臨床研究過程中收集到各種其他類型的數據,都可以綜合做一個預分析。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

目前我們看到的情況,在我們平臺上采用這種方式去做的,在同等工作上效率相對于傳統臨床研究能提升2倍,目前整體用的效果還是非常不錯的。

同時,我們平臺上還有很多醫生在做科普。我們能給他們提供一些文字或者視頻類科普內容創作過程中的AI輔助工具。

目前看來,這部分醫生在我們平臺上每個月可以利用這個工具生產或者說創作內容,大概維持在萬這個級別的規模。

同時,我們還給醫生推出輔助診療AI工具。它可以自己跟患者溝通、交流,會預生成出診斷結果的判斷,包括給診療建議,最終醫生會對結果做整體的復核并給出最終結論。

我們跟一家互聯網醫院做試應用,目前看來這個結果被醫生的采納率能達到86%。一個醫生正常問診的過程之前是10分鐘左右,現在只需要1-2分鐘,這是我們醫生端的。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

從患者端來說,因為我們C端用戶比較多,所以做了健康顧問。

比如對慢病患者,它會提供用藥提醒;對普通用戶,特別我們中老年用戶比較多,它可以提供飲食、生活的健康建議。

我們目前這個顧問覆蓋30多萬用戶,活躍率可以做到70%多。這在過往很難做到,因為這種方式跟用戶溝通需要非常大的人工團隊去維護,但現在有了大模型,這個事情可以做得非常輕松了。

包括我們健康商城里在線的智能客服,整體上了大模型之后收縮了70%人工人力成本、人工客服的成本。由于時間關系,還有其他的應用我這里不詳細的展開了。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

新火種金磊:剛才高總提到病例分析任務,這對于醫生來說應該是必須嚴謹且耗時的工作,有沒有數據通過Dr.GPT給醫生帶來省時的數據呢,節省多少時間?

輕松高玉石:對于一個完整的問診過程來說,在線問診比線下問診時間耗時較長。正常情況下,原本是10分鐘左右,現在大概降到1-2分鐘。

前面很容易的溝通不需要人工,用機器就能收集上信息,最后醫生做出決策之前,可以看到大模型提取完的結果。

如果他想要的信息沒有完整提取到,因為這不僅是完整模型而是一套系統,系統自動就會把想問的問題用人工跟患者溝通,整個過程看下來時間節約了很多。因為醫生看病大量時間都用在前面的過程,最后出結論時,很多時候很快。

新火種金磊:接下來想問問徐總,咱們通義千問正式開放也有半年多的時間了,現在用戶使用的情況是怎么樣的?

阿里云徐棟:我跟高總的角度可能會不太一樣,因為我們是云廠商,再加上模型服務面向全行業。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

坦白說很多客戶比較兩極分化,一方面認為模型是萬能的,另一方面有些用戶覺得模型是對原有搜索的增強,可能是這么兩個角度。我們把市場去做個分割,AIGC怎么應用的情況可以分兩個層面。

第一個,大模型塑造了產業的核心商業模式。比如游戲行業的NPC、社交領域的角色扮演,包括高總講的范圍像是SaaS的場景,它是AIGC內容生產的上游和下游,而且它有自己特定的work flow,這個產業鏈也是在快速變化。

除此之外可以看到像智能硬件包含的范圍很廣,包括車機、智能座駕、手機,也能看到手機廠商和PC廠商分別把名字都改了,叫AI Phone或者AI PC。還有像鼠標這種消費電子類的穿戴設備,都有模型上的場景應用。

可以把這一大類通稱為大模型對商業模式做的大升級,它們或多或少可以把模型集中進來。

第二大類是企業級市場,未必是對商業模式做了根本性重塑,而是在降本增效場景作用比較突出,比如最典型的客服場景、知識庫的問答等等,這些場景在企業內部對提效來說有非常多的幫助。

快刀青衣老師在剛剛講的時候,說團隊規模未必未來會足夠大,原因也是這樣。因為你會發現很多原有崗位角色都是圍繞著具體的業務場景的,這個場景下面很多角色通過AI被提效,因此可以做更好的降本增效模式的改變。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

講到阿里巴巴集團模型內部的模型使用情況,有一個很好的案例,有機會可以聽釘釘總裁分享。釘釘是非常好的工具鏈SaaS企業,他們應用分了三步。

第一步把原有IM的Saas應用AI化。比如閃記、視頻會議還有文檔,全部接入了像魔法棒這樣一個能力,所有內容都跟AI打包了。

第二步推出了釘釘超級助理。因為AI助理、AI Agent這個場景,也就是一個AI助理幫助企業通過IM使用相應的功能,不管調用功能還是做摘要都會變得很方便。

第三個是釘釘走的另外一條更有突破性的路線,它有一個場景叫“煉丹爐”,也就是一個企業可以把能力包括知識庫跟釘釘原有場景結合,變成自己所需要的AI助理,或者特定企業的數字員工。我覺得這樣場景也是非常有意思的。

今天很多AIGC應用場景在慢慢發展,也在不斷地分層,我們自己看到這兩個層面客戶的需求會不太一樣,毫無疑問調用量也正在非常快速的增長,不管在第一個場景還是在第二個場景。

新火種金磊:接下來想請教一下周總,瀾碼科技是去年2月份成立的,可以說是非常典型的AI 2.0公司,咱們去年年底發布了AI Agent平臺AskXBOT,那么咱們這款應用現在目前使用情況是怎么樣的?

瀾碼周健:我們一開始從自動化的視角設計AI Agent,我們關注到企業內部員工,特別是一線員工,處理的很多都是數據、文檔、應用、流程,這四個核心要素,我們就圍繞這幾個打造了核心能力。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

去年比較多的能力還是在文檔這個維度上面,比如說最簡單的政策解答、出題判卷,包括保險產品條款的回答,這樣做一系列的應用。今年我們開始有一些所謂的Chart能力或者Work Flow的能力,我們把這些能力組裝在一起,就可以做高級一些的增強自動化,專家可以通過知識去賦能基層的業務員工。

這里有一個典型場景,以前保險代理只能通過盲打電話推銷新的保險產品,成功率非常低,現在保險代理可以根據體檢情況生成的個性化保險產品推薦,去推薦給對應的體檢客戶,并且推薦的產品也符合他的健康情況,從而可以大大提高銷售轉化率。

另外一個場景是銀行普惠金融,政府現在也希望引導銀行資金能夠到優質的中小企業那里去,這時候就需要對申請資金的企業撰寫盡調報告。

過去一個客戶經理要花半天時間寫報告,因為要收集各種各樣的信息,例如公司章程、營業執照、銀行流水、財務報表,大概要花半天。但是通過Agent,10分鐘就能生成一份報告,再檢查一下,基本上30分鐘就能完成一份報告。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

我們自己總結下來,一種是日常辦公的增強自動化,包括剛才講的查詢文檔、差旅預定、會議預定、智能客服等都是降本增效,另外可以做一些創新業務。

過去因為企業內部的專家供給是稀缺資源,專家的時間一天也是24個小時,像剛才講的保險代理、理財經理,不可能每個理財經理都是專家,一定是初級、中級、高級員工匹配起來,這個時候專家時間的供給是瓶頸。

而今天有了AI Agent或者用上大語言模型之后,智能體能發揮出來專家的能力,這時候專家時間就不再是瓶頸資源了,我們可以做一些新的業務。原來覺得不可能、質量太差或者風險太高的業務,現在就都有可能了。

這個是我們看到很多落地的場景中,企業特別想要去購買的應用。

新火種金磊:好的,從三位嘉賓的分享我們可以看到,AIGC應用已經在不同的細分賽道上很有效地上崗了。

AIGC產業越來越卷,也越來越成熟

新火種金磊:與此同時我們也看到這一年半以來,AIGC的應用越來越多,在功能上也呈現出你追我趕的現象。總而言之,越來越卷。

所以我想先請教一下徐總。咱們通義千問應該算是大廠AIGC應用的代表,是否有感受到同類產品迭代速度過快,感受到了一些壓力?

阿里云徐棟:因為通義千問跟別的廠商還有區別,它的開源力度非常大。比如兩周前和一個月前,我們分別開源了兩次,所以在社區里會得到很多關于效果的反饋。有的時候一個模型剛放出來,第一周都是噪音,一個月之后才會慢慢知道效果怎么樣。

坦白說今天如果要卷的話,我們對效果還是比較有信心的,很多客戶會給我們一些反饋,覺得效果還可以。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

但是我們今天已經開始卷到另外一個維度,我認為是好事情。一個叫做延時,我現在發現有些場景對時間會非常敏感。比如說有些外呼的場景,還有對圖片語義理解的場景,用戶能接受的時間點一定是在2秒,2秒以上沒辦法接受。

我們其實跟一個手機廠商合作,是面向視障人士,他們可以通過手機去識別當下環境的物體是什么樣子。大家都知道視障人士非常敏感,能感受到100毫秒的輔助聲音的理解,但是在今天時間如果要超過3秒或者4秒、5秒,這個場景就不可用。

而且性能、延時、并發,是我們目前覺得是重點要去卷的方向。

另外一個我們發現今天對成本的敏感度也越來越高。因為過去調用量不大,所以大家覺得成本還好,但是今天我們發現在成本方面卷得也是非常厲害的。從效果卷到了性能、延時、成本,這是目前看到比較多的方向。

不過這代表產業越來越成熟了,進入了一些核心的敏感領域,所以才會提這么多需求給我們,這是一方面。

第二方面我們不能只卷語言模型,我們現在在卷多模態的理解、多模態的生成,比如剛才講到怎么理解圖像,怎么理解聲音。

前段時間有個客戶告訴我,開水的聲音和冷水的聲音是不一樣的。聲音代表很多信息、有很多標簽,所以我說聲音的識別不是把語音轉化成文字的模式。

有可能今天所有模型輸入的信息可以多元,可以是聲音、圖片、文本,也可以是視頻,輸出內容也可能是多元的。如果再加時間軸,有可能變成視頻。

所以我覺得多模態應該是今年下半年卷得最厲害的方向,也是因為上半年OpenAI在春節的時候發布了Sora這個模型。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

除此之外,我覺得還有一個目前卷的壓力比較大的方向,準確地說是插件生態,或者說是工具鏈。

過去大家都知道工具鏈的核心講的是怎么做SFT,后來開始卷RAG。現在我們發現隨著Agent成為重要的商業化出口后,就需要越來越多的工具或者API,這些API背后代表是不同能力的插件。

所以今天我們能看到,什么樣的模型服務能夠提供更豐富的插件服務,可能也是一個非常重要的事情。

所以我覺得分幾個層次,我們倒未必覺得今天在效果上會有足夠大的壓力,當然我們也是在不斷對標國際上最先進的模型。

但是我們覺得落地場景上來說,可能會在其他幾個方面卷的更厲害,而且這幾個方面真正決定了客戶能不能用模型取得正收益,這是我們的觀察。

新火種金磊:剛才徐總談到卷的不同方向,但是阿里本身通義大模型就是很卷了。10天前在4月7日的時候,阿里通義千問剛剛開源了千問1.5的34B這個大模型,在今天又開源了一個CodeQwen1.5-7B和Qwen-7B-Chat。

接下來在To B應用當中醫療是非常火熱的賽道,其實市場上已經有很多醫療大模型和相關的應用了。高總,您覺得整個醫療的AIGC應用,目前的困境是什么?

輕松高玉石:首先我覺得這可能是目前整個AIGC落地過程中普遍存在的問題,就是怎么找到一個比較合適的場景,能夠把它解決實際問題,落得下去。

而不是說現在依然大家看到發布各種各樣的內容、造概念、追熱點,甚至說我先把大模型搞出來,然后再去找場景。

我的建議還是從業務和場景中來,到業務場景中去,拿結果說話,有沒有增效,有沒有增收。其實這個說起來很容易,做起來很難。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

我們今年1月份的時候做了年終總結,大家看到我們去年AI落地情況,真正應用起來和對業務產生價值,成功率只有30%多一點。等于我做三個嘗試,最后只能成一個,這個東西說起來也很容易,做起來其實挺難的。

第二點是醫療的高質量的數據還是比較少的,而且數據也比較分散,是先天的一些因素造成的比較分散,而且這個行業里面還有部分數據的封閉性比較強。怎么把數據有效利用起來,能夠給模型強化出來更好的能力,從目前看來可能更好的方式還是通過國家,在數據要素這一系列建設上和規劃上怎么緩解這個問題。

第三點是醫療這個場景是一個很嚴肅的場景,對于容錯率要求是非常高的。

包括剛才徐總也講,我們會有一些SFT,包括一些微調,還有檢索增強的方法,能把這些提升和強化。以現在實際情況看,我個人建議還是以輔助的方式為主,比如說無人化和自動化的方式,我建議不宜過早和樂觀地做這件事情,這是我個人的觀點。

新火種金磊:那在成本上呢,很多客戶肯定都是會希望能拿到一個又快又好又省錢的解決方案和產品。咱們的產品在上崗醫院的時候,在成本上是怎么做到降本增效?

輕松高玉石:這個核心點在于算賬,用的過程中一定要算賬。

大家都講ROI,有些場景里面,你能獲得的收益其實是很高的,就可以用到更好的或者說可以付出更大的成本,但有些成本其實很低的,所以說這個過程中就需要去平衡。我們那2/3失敗的項目,里面有一部分項目是用起來確實不錯,但最后確實成本扛不住。

新火種金磊:好的,剛才提到成本,咱們AI Agent屬于AIGC技術里面非常潮流的一個,雖然這種方法在交互的場景中效果比較好,但是它的成本應該算是一個硬傷。

所以想請教一下周總,咱們在這個方面是怎么解決的?

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

瀾碼周健:在我們實際實現過程中,基本上還只是先拿最好的模型去驗證這個場景的可實現性。

如果現在在GPT-4上面,通過提示詞也沒有辦法做到的話,基本上我們會拒絕這個項目。如果能做的話,我們的客群里面很多是要私有化部署,因此還是想要通過拆解去解決。一方面通過輔助專家知識,這樣的話就把大模型的能力局限在很多語言理解上,只是去處理、總結或者說去做自然語言,還有的是實體識別、或者意圖識別、意圖分類等這樣一些事情。

這時候對底下模型的推理能力的要求就會大大降低。所以這樣的話,對于整個端到端解決方案,就會比用最貴的模型要好很多。

新火種金磊:那么除了在產品應用越來越卷之外,放眼整個宏觀的AIGC市場,必然也產生了一定的變化。還是想先請教一下周總,您覺得市場對于AIGC應用的產品是不是越來越嚴格了?

瀾碼周健:您是說客戶嗎?

新火種金磊:對。

瀾碼周健:客戶的需求其實是兩類,一類只是嘗鮮,這時候是不會真的用起來的。第二類是真的要在實際生產工作流里面被用起來,在AI 1.0時代都有明確的可以被用起來的指標,當然今天稍微有一些不同。

以前在人臉識別的應用場景,準確率95%就是金標準,如果準確率達不到95%,肯定沒有辦法上線。現在可能可以放寬到在交互三輪以內一定要達到95%的準確率,這個還是必須的。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

新火種金磊:咱們高總這邊呢?有這個感覺嗎?

輕松高玉石:在這個過程中,我覺得用戶對于我們容忍度是比較高的。

包括用戶也好,包括內部使用一些供給也好,因為是新事物,所以本身先天有一定的興趣。在這個過程中,他是接受的。但是可能在這個過程中需要適當地控制好預期。如果給出的收入預期以及實際情況的預期過高,之后帶來的結果可能會走向另一個極端。

至于另一個點,目前整個市場上對于AIGC有點跟過往的情況不一樣。過往說有一個比較好的增長就行了,現在可能收入和利潤是同等重要的。如果從資本的層面看,其實對AIGC產品的要求比以前要高很多。

新火種金磊:現在我想問一問徐總,這一年半來,咱們有沒有對AIGC市場有一個新的感受?

阿里云徐棟:我個人感覺越來越樂觀了。

因為大家過去卷的都是在卡層面,前段時間紅杉在美國有一個報告,去年花了500億美元買卡,真正的AIGC產值就30億美金,大概是這么一個結構。今天來看,剛才周總、高總講了一個觀點我特別認同,就是客戶的預期變了。原來是認為你一上來就是一個pilot,不是copilot。

所以有些用戶對準確率不是那么敏感了,他覺得夠用就可以,甚至有些客戶因為成本和性能,主動選擇從千億參數模型改變到了14B甚至7B的模型,因為他知道自己要什么了,這是非常大的轉變。

很多客戶今天跟我們聊的時候,好像不需要這么大的模型了,因為這個量太大了。而且我覺得是一個copilot,我不需要把它直接變成最終的生產的結論,所以我覺得這是一個非常大的變化。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

第二個我自己覺得市場為什么越來越好了,因為原來一開始都是像在生產力的辦公工具,或者說像Office 360這個方向轉。現在看到越來越多不一樣的場景,特別是To C的場景。原來是To B多,因為過去To B的融資比較容易,而現在看到To C的AIGC融資慢慢起來了。這和基礎模型能力的提升,以及性價比越來越高是有關系的。

另外還看到了一個快速發展的市場,比如智能硬件,尤其是穿戴設備和一些帶攝像頭的,或者帶一些語音和麥克風的小的設備。

這些設備原來有一定的ASI或者TTS的能力,或者說有一些圖象識別能力,但泛化性很差,商業價值沒有辦法被發揮出來。今天我們看到淘寶很多類目里面,你搜消費電子產品前面加一個“AI”、加一個“智能”,鼠標、攝像頭、耳機、手表排名都很靠前。幾乎所有的智能硬件的廠商都在做這件事情。

因為今天不管從投融資角度還是從客戶的預期角度,大家對大模型的認知越來越準確、清晰了。一開始覺得什么都行,或者什么都不行,但目前需求開始分層了。有些場景的準確率要求依然很高,需要做精準的幻覺控制,有些場景覺得不需要。我看還有人做審核,對前面所有鏈路做了大幅提效,這個場景還是挺有意思的。

我個人覺得越來越樂觀,今天有跑不完的客戶提需求,而且需求越來越分層,這是非常有意思的事情。

AIGC應用落地變現的方式

新火種金磊:接下來我們聊一個更直接一點的問題:怎么變現,怎么賺錢?

還是想先請徐總分享一下,通義千問目前在C端沒有采取收費模式,接下來在商業變現方面有怎么樣的計劃呢?

阿里云徐棟:我們對標其他廠商的話,比如ChatGPT就是訂閱制,對用戶收訂閱費,根據時間觀察我們的action是什么,我想先分享一下大的邏輯。

我覺得一旦有新的技術出現之后,會形成新的產品體驗,新的產品體驗會把流量吸過來,快速形成洼地,基于流量看到有很多很成熟的商業模式。不管是廣告,還是最早的短視頻和直播,都跟廣告和電商有關,還有些做金融服務、增值服務賣虛擬商品等等等等。今天還沒有看到C端產品到兩千萬DAU,每個DAU時長超過60分鐘,所以今天聊商業化或者長期商業化還有點過早。

而今天成熟的商業模式還是就那些,LM-Base的Agent或者說to C的應用,有沒有可能產生一些新的付費模式?我覺得是有可能的。

有可能是一個訂閱制的模式,但訂閱制模式有點太泛了,需要訂閱多個AI Agent,不同Agent之間怎么通信,這些東西可能都是隨著下半年multi-agent架構越來越成熟再解決。比如一個To C產品背后不是一個模型,它可能是多個模型,甚至多個模型上面分裝出的多個Agent,之間會相互通信。

我在線下跟高總聊multi-agent這個架構,這個架構其實未來可以看到這樣的情況。

假設我們致力于做一家量化教育的基金或者私募,今天首先需要一個做基本面分析的分析師,需要一個在二級市場搜集信息、爬取數據的一個角色;同時需要有個寫代碼的人;另外還有去挑戰前面所有人邏輯的反對者,它可能就是multi-agent架構。基于這個架構可能就會產出一個小型的私募量化交易公司,有可能持續迭代,甚至可能會比人的例如效果會更好一點,因為它所有記憶都會存在,也很理性。

我想當下單個To C,尤其是像ChatGPT場景,是不是訂閱費是唯一的方法呢?我覺得現在聊這個可能過早。我們可以到下半年看一看,看看有沒有新的商業模式可以跑出來,不管是Kimi也好,還是其他的廠商。

我們看到現在流量增長都非常快,但是具體怎么收費,我覺得是一個短期還沒有那么明確,可以觀察一下下半年基于multi-agent架構,或者多模態的架構,有沒有新的商業化的可能性出現。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

新火種金磊:那么高總,請問咱們產品面向B端進行商業變現,是按需付費還是其他的模式?以及對未來新出現的變現模式有什么樣的想法?

輕松高玉石:我們是健康保障的科技公司,做很多東西還是圍繞著既有業務和生態整合的。所以我們變現模式相對非常純粹的AI公司來說更自如一點。

我們目前的產品主要服務大量C端用戶,他們對健康有很大的需求,包括還有一些機構、醫生。所以說我們變現模式是圍繞這些用戶做的。C端圍繞增值服務,我們提供一些保險的保障,還有健康TPA的服務,包括用戶可以通過商城、通過健康管家的服務來購買我們健康的產品,甚至有些用戶對于我們客戶的知識比較感興趣的話,可以買高端科普的內容。

而B端主要以安全付費的方式。一類像醫療、醫藥的機構做臨床研究,他會做一些付費,另一部分則是還有很多的機構的用戶,有健康教育的需求,這類需求也是可以得到滿足的。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

新火種金磊:那么周總這邊呢?

瀾碼周健:我們做AI Agent,最近大廠把這個品類炒起來了,甲方現在要采購一個Agent平臺基本上成為共識。這是傳統軟件的方式。

還有一些應用的方式,不管像剛才提到的信貸盡調報告,還是政策解答,我們看到有一種可能性,可以按照數字員工按月收費。因為現在很多業務的客戶,比如像某個分行在很多時候去采購GPU算力非常困難,需要找算力廠商。這套用現在比較時髦的詞來說就是,AI智能體是新質生產力,專家知識、模型、算力都是全新的生產要素。

假如算力廠商愿意以租用的方式,倒過來變成分行每個月雇傭員工一樣付費,再分成分給模型或者說算力的廠商,這是現在正在探索的一種新的商業模式。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會AIGC應用的價值

新火種金磊:好的,那接下來這個話題是比較開放的:AIGC應用的價值。

因為三位嘉賓每個人所身處的細分賽道也是不同,想必感受也是會有略微的不同。我們按照順序,從高總這邊來依次聊一聊,您覺得什么樣的AIGC產品才算是好產品,才算有價值,這個有價值的標準是什么?

輕松高玉石:從企業經營角度,特別這兩年基本上各家企業都比較頻繁的提到一個概念,就是降本增效增收。如果我們把它擴展到C端的層面,可能還會有一個體驗的點。

我覺得這四個點同樣適用于,現在去評價AIGC產品到底有沒有價值。就是對于個人,對于企業,對于社會有沒有做到降本、增效、增收,或者說帶來很好的體驗。如果能做到其中的一到兩個點,我覺得這個產品在嚴格意義上是有價值的。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

新火種金磊:徐總呢?

阿里云徐棟:我覺得大家思路差不多,看ROI。

這樣一個場景,或者產品,或者用了大模型,用和沒用之間的差額是什么樣子。大家都知道用大模型是有成本的,而且成本不低,起碼從目前來看,背后是跟GPU掛鉤的。所以我覺得ROI這件事情是衡量到底有沒有價值的第一標準。

但是每個企業來評價ROI的邏輯和方法是不一樣的。比如一個場景是,一個企業每個月大概有百萬左右的詢單,但是銷售只能接觸其中10%的訂單,原因是大量商品是非標的,需要去通過工單的方式問技術人員,技術人員給他一來一回的反饋。那如果你讓客戶來補充這個信息,客戶可能只發一個截圖過來,我只要這個商品,你給我報個價。所以在這種場景下面,90%的生意都丟失了。

但如果在這種場景下,用AI的方式就很容易理解。用一個chat bot也好,還是說能夠自動生成一個報價單,讓90%那原本會丟掉的生意能夠接起來,這就是對這個企業的ROI的非常正面的場景。

所以在這種場景下,對成本不會特別敏感,就會達到非常好的ROI的效果。

但這個前提也很復雜,需要建很好的知識庫、需要把RAG調到自己覺得可用的狀態、模型推理效果要好、最后生成的格式是相對標準化的,并且可能還要嵌入到工作流里面,能讓最終銷售人員點擊確認……所以還是一個比較復雜的體系。但很明顯大家能感受到,這個場景是ROI比較高的場景。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

還有一些用法不一樣,就是短視頻公司、互聯網公司,拿大模型或者是AIGC內容做導流。大家都知道通義千問上面有一個場景叫做全民舞王,給一張照片能讓里面的人跳起來。因為這個場景非常有意思,能做流量轉化,很多互聯網公司愿意拿這樣一個場景對外投放,投放能導回到APP,對他來說也是算ROI。

所以我覺得每個行業、每個場景的價值判斷不太一樣,但是唯一標準是看投出去算力卡的資源和最終收益比例是什么樣子。有的很敏感,有的不一定很敏感。

比如按照云計算的邏輯看,其實手游絕大部分都在云上面。當時我們測算過,云的成本占手游公司的收入差不多是2%-4%,這就是ROI非常大的場景。因為手游核心成本除了人力之外就是服務器的成本,因為要擴服。

我覺得如果未來大模型的成本或者算力的成本,能夠占到客戶營收或這件事情的10%以下,那我覺得就是非常成功,行業變化一定非常大。

新火種金磊:那么請問周總這邊,您覺得什么樣的AI Agent產品是有價值的?

瀾碼周健:第一個是所謂的崗位增效。過去AI 1.0時代,是用數字化的方式把崗位的重復性工作替代掉。今天提供了一個可能性,是說能夠用專家的方式把這個崗位的部分任務自動化掉,這其實是一個很明顯的提供價值的方式。

第二個是管理的增效。我們現在有個客戶是做中介平臺,交易員很多信息其實沒有被傳遞到其他交易員那里去,AI Agent就相當于在流程當中,能夠把這個信息更有效、更及時、更可信地傳遞出去。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

過去一直說前線聽得到炮火聲的人能夠呼喚炮火,但中間還是需要通過人去傳遞信息,所以速度會慢,信息會有失真。今天如果中間是一些AI智能體去負責傳遞,前線可能只是把這個信息像無人機一樣傳遞回去,后臺由Agent總結,再讓專家做出決策,這可能會帶來更大的價值。

就像我剛才提到的,我們有服務過一個獵頭公司,他內部有700個獵頭,一年可能發4500個offer,最終接受offer的只有3000個,剩下1500個是優秀的候選人,那么能不能通過他內部的700個獵頭把這1500個優秀候選人的線索傳遞出去?這產生的價值其實很難用崗位增效去衡量。本質上,基于大語言模型的AI提升了信息處理的生產力,我們其實能看到它在管理上的增效。

One More Thing:百模大戰,還有必要嗎

新火種金磊:熟悉新火種的朋友都知道,在我們公眾號文章底部,經常會有一部分內容叫“One More Thing”,這次我們在圓桌也設置了這樣一個環節,想請三位嘉賓發表一下自己的看法。

現在AIGC應用的產品越來越多,對于市場和用戶來說是一件好事情,可以促使產品自身變得更加優質。但是反過來看底層的大模型,去年百模大戰的盛況,現在還有必要嗎?訓那么多的大模型,是不是資源的浪費、重復造輪子?以及會不會出現大模型層面上的一次大洗牌?

先請高總聊一聊。

輕松高玉石:百模大戰如果是高質量的、確實投入真金白銀去做的,我個人覺得是比較有價值的。

因為目前AI這一波的發展,特別是生成式AI這一波的發展,整體還是暴力美學的邏輯,是靠大量堆算力、堆數據去做的,就是一個典型的scaling law的方式。所以說為什么會這樣,它的一些理論到現在也沒有完完全全地透徹出來。整個模型從訓練到推理各個環節,現在也還是有存在很多需要去探索的地方。

舉個例子,我在前兩天看到中科院發了論文,意思是說百度貼吧的弱智吧是最強的中文語料庫,訓練處理模型的效果甚至要超過豆瓣、小紅書、百科這一類,過往認為是非常高質量的傳統內容平臺。

所以這種高強度的競爭,必然會加速對未知、未確定東西探索的過程。而這對于加快整個AI一系列技術的發展是比較有價值的。只是在這個過程中,可能適當做得更開放一點,可以緩解一些資源損耗。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

至于會不會出現洗牌,我個人的觀點是看現在整個AI技術發展的曲線,依然是非常陡峭的,還沒有看到任何放緩或者說見頂的態勢。在這種情況下,其實很難判斷會不會見頂。

舉一個最明顯的例子,AI視頻領域,在去年像Runway或者Pika基本上就是風頭無二的狀態,但是今年初Sora一出,整個AI視頻領域競爭態勢發生了很大的變化,現在像Runway或者Pika的處境也是挺微妙的。

但是這不代表著所有東西都是不確定的,我覺得還是有一定的確定性。因為目前這一波AI是重資本、重算力、重數據、重人才大的方式。所以洗牌大概率會發生在科技巨頭,或者說這些巨頭支持的創意公司。而且我個人覺得后者的可能性會更大一些。當然目前還是局限于整個基模這一套,因為在應用層面完全是另外一套邏輯。

新火種金磊:那徐總您覺得現在還需要那么多大模型嗎?

阿里云徐棟:如果站在我的工作角度當然不需要,大家用通義千問就可以了。

事實上我們可以把這個問題稍微剖析一下,看看是不是所有大模型都是同質的?如果都是同質的,那么這個問題可以探討一下。

大家知道過去很多做基模的團隊,有一些做垂直模型,比如做金融模型、做教育模型等等。以我們的觀察來說,這樣的方向可能有一定的價值,因為其實是它們有獨立的詞表、有自己特定的下游任務,有一些自己finetune用的數據對在里面,包括對齊的方式都不一樣。所以我們可能還需要探討一下,所謂的基礎模型強調的是所有東西都懂,而且還有很好的泛化性。

那垂直模型未來不一定叫垂直模型了,有可能叫垂直的Agent,有可能因為上面的插件會有差異化所獨占的特點,它的詞表到下游任務、到對齊方式可能完全不一樣。甚至可以閹割掉很多基模原有的能力,就為這個場景服務;有可能能在成本和性能方面做到極致。

其實市場有很多小的模型,其實做得也非常好,就是專門做閑聊方面,成本極低,千token的成本甚至可以做到1厘以下,這也是非常好的方式。

所以我覺得關鍵看訓練這個模型的團隊目標是為了去對標ChatGPT,還是說解決具體的問題?這可能會不太一樣。這是第一個角度。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

第二個角度是,過去這樣卷挺好的,好在哪里?好在人才都慢慢被培養出來。過去很多人才都是從NLP或者CV領域慢慢轉型到大模型,去做這件事情。大家卷到后面會發現一個問題,其實并不是要做模型架構,而是很多人會重新理解數據工程。

什么叫好的數據、數據的多樣性是什么樣子的。比如音樂數據和語文數據和數學數據,多樣性是什么樣子的;每個數據怎么構建復雜度。因為數據構建越復雜,最后的效果可能會更好。

另外什么叫做好的數據質量,包括不同的數據的配比。為什么我覺得這件事情是有意義的,是因為很多基模的知識經驗,未來完全可以被復用到在下游任務的finetune環節。因為知識會傳播,所以有這么多人才做這件事情,這對未來整個模型探索商業化,最終搭出足夠有用的、正ROI的Agent一定有非常大的幫助。

所以從我的角度來說,我覺得過去卷一卷并沒有造成太多浪費,還是挺好的一個方向。當然也特別歡迎大家多用用通義千問,不管是開源還是閉源的,因為效果確實還是不錯的。

新火種金磊:最后請周總談談對于這個問題的看法。

瀾碼周健:我覺得既多又不多。我挺同意徐總講的,攀科技樹這邊最后應該只會剩下幾家,因為中國并不需要一百家能夠追趕GPT4、GPT-5的大模型公司。

今天從商品的角度上來講,往下細分,比如像代碼的生成模型已經明顯占據一個品類了,而其他的大家現在更多都是在用13B、33B、72B,這是很詭異的一件事情。包括像大家買商品買的是代碼模型、金融模型,不會買一個多少參數的模型。我覺得不同專業場景下會有不同的數據集,他們能夠發揮出來更好的用途。

AIGC年度激辯:3輪交互內準確率95%以上才能真正應用| 中國AIGC產業峰會

當然,因為這波風潮,準備好了這些人才,隨著產業逐步分化、融資游戲結束之后,二線大模型公司要找自己的定位,就需要進場景,找我們應用方、場景方合作做一些市場,正向叫Scaling law,反向實際上它需要的算力并不多。其實越小的模型,通用性能力會越弱,只能用作專業性。而就專業性情況來講,13B可能需要100個,70B可能需要10個,萬億模型只需要2、3個,這是我現在能看到的情況。

而我們這樣做Agent的廠商,希望在各種場景當中選需要的模型,現在模型都沒有什么描述,包括產品、feature、list都沒有,需要各種各樣去測才知道什么場景用哪個,這是行業最早期的時候。

我相信跟軟件行業一樣,最終會細分到ERP、CRM、OA等功能,而不會說我這是7B模型,我這是33B模型。并且下半年逐步會出來細分的模型,上面做應用的廠商就會更容易一些。如果每個應用廠商都要測,太浪費整個行業的精力了。

新火種金磊:非常感謝三位嘉賓從不同角度數據、人才、資源等等方面分享自己關于這個問題的觀點。由于時間問題,這場圓桌到此結束了。至于AIGC應用下半年又會怎么發展,我們明年大會再揭曉答案,謝謝大家。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章