一文讀懂AI創業最新趨勢
自ChatGPT引爆市場以來,創業市場開始變得熱鬧,這不由讓人想起2014年那波移動互聯網的創業熱潮。
在過去一段時間,我們看到越來越多的人開啟了AI創業之路,主要分為兩撥人。
一撥是由高校、科研院所的教授、科學家領銜的創業團隊,他們也是國內最早研究Transformer 模型,同時在生成式模型方向有多年學術沉淀的一群人,從如何更好生成到如何更可控生成,他們一直在探索AI想象力邊界。
而最近也明顯感受到互聯網大廠高管、AI 1.0時期的從業者、垂直細分領域從業者以及連續創業者也陸續加入到這波AI浪潮中,他們很多產品經理、技術出身,思維靈活,懂得設計產品,運營社區,對于用戶需求有敏銳的sense,擅長做從0到1的產品起步。當然從產品端,我們也興奮地看到國內如妙鴨類的產品引爆社交媒體。
不過,在對AI技術帶來的翻天覆地的變革感到興奮的同時,也需保持理性。工具類AI產品的商業化變現路徑在哪里,哪些競爭要素才是應用類創業者真正的壁壘?哪些場景才是真正的剛需?這又回到創業最核心的問題,PMF在哪里?
技術只有真正落到具體場景和需求中才有價值,技術能力強的團隊也需要補充更懂市場和用戶的人才能走得更為長遠。
作為多年專注于AI投資的錦秋基金,一直站在產業第一線視角洞察AI技術發展趨勢和創業市場變化,在過去已投資了多家具有全球化視野同時具備技術創新和商業化落地能力的人工智能頭部企業。
目前如火如荼的AI創業,現在是否適合入局?哪些領域的AI項目更容易獲得融資,哪類AI產品流量更大,用戶粘性更強?AI2.0 階段的創業和AI 1.0 相比哪些技術范式發生了轉移?
針對準備入局和正投身于AI領域的創業者,錦秋基金投資副總裁鄭曉超通過對AI行業、趨勢、產品等多個維度的分析,從投資視角一次性講清AI創業最需
本文為錦秋基金投資副總裁鄭曉超《從投資視角看AIGC發展趨勢》的演講精華,有刪減:
以下為本文目錄
01 AIGC正處于技術萌芽跟期望膨脹階段
02 文本和圖像類AIGC應用機會開始涌現
03 3D、音頻、視頻大模型仍處于非共識階段
04 文本和圖像類AIGC訪問量最大,商業類AIGC正在崛起
05 Chatbot 訪問量最高,虛擬陪伴應用粘性最強
06 AI濃度變高,Copilot 類創業占比近一半
07 通用場景AIGC融資較多,垂直場景啟動更易
08 從新范式轉移看AIGC創業時機
09 AI創業:from China to Global
AIGC正處于技術萌芽跟期望膨脹階段

一個新的技術在其發展過程中會經歷一個比較緩慢的蟄伏期,等過了一個臨界點后,會進入到快速發展期,之后又會進入到一個相對比較平穩的發展階段,這就是我們通常所說的創新擴散“S型曲線”。
實際上之前的幾次技術周期都經歷了這樣一個過程。在PC互聯網時期, 2011 年PC開始出貨量見頂,后面進入到逐年下降的階段。在 2012年,移動互聯網已蟄伏多年,并且圍繞iPhone 等各種移動互聯網應用也出來了,像字節也是在 2012 年時開始出現的。這個階段,移動互聯網就開始接力PC互聯網,進入到了快速增長階段,但到了2017 年,智能手機出貨量也開始見頂,從 2017 年到現在,整個移動互聯網的創新在大幅放緩。
從2017年的 iPhone 10,到最近的iPhone 15發布,作為一個重度的果粉,我都已經慢慢不追科技春晚了,因為很多的創新其實都已經變成了微創新,并沒有讓人覺得非常興奮的點。不過今年6月份蘋果發布的Vision Pro還是很讓人興奮的。Vision Pro 大概是在2015 年左右立項,也就是在智能手機出貨量開始見頂時,新的技術又開始蟄伏了。
另一個比較有意思的點是,奠定這一波大模型的基礎——Transformer 技術框架的論文《Attentions is All You Need》也是在 2017 年6月由谷歌團隊提出,又經過了多年的積累,到了今年,ChatGPT 徹底引爆整個市場,現在我們進入到了大模型快速發展的早期階段。當然大模型可能不是這個周期里唯一重要的事情,AR、 VR 也是其中不容忽視的技術變量。
再從大模型的具體發展周期來看。 Gartener 技術成熟度曲線旨在說明一般新技術出現會經歷的幾個階段,目前基于 AIGC 的 AI 2.0目前正處于技術萌芽跟期望膨脹的階段。我們看到ChatGPT 在今年 5 月流量開始見頂,最近幾個月也一直在下滑,所以整個市場預期我覺得是在慢慢變得冷靜。對于整個大模型引領的這一波新技術浪潮,我們長期會保持樂觀,但是短期還是會保持相對理性。
文本和圖像類AIGC應用機會開始涌現

每一次的技術創新在整個周期的不同階段,其價值鏈條所處位置是不同的,也就是價值鏈的傳遞。隨著價值鏈的傳遞,其市場規模是呈數量級逐漸放大的。雖然應用層的市場規模最大,但是它的市場集中度會降低,而相對來說底層技術、硬件框架、 OS 這些市場相對更集中(不然對于應用開發者會是一個災難)。所以一般來說,上游集中度很高,可能兩三家占據了一半以上的市場,但下游會呈現百花齊放的狀態,會有數量眾多的應用推出來。
比如在PC互聯網時期,早期能夠捕獲整個產業鏈價值的其實是做硬件的公司,比如IBM、蘋果,之后就會傳遞到做 OS 的微軟,做芯片的英特爾,再往后才會到應用層,像谷歌、Facebook 等。同樣,移動互聯網也會經歷類似周期,從智能手機到安卓、iOS,再到ARM或者高通,最后到像字節和美團等應用。
對于大模型來說,我們認為像大模型公司 OpenAI ,芯片公司英偉達其實發揮了大模型技術浪潮技術底座的作用。隨著大語言模型和文生圖模型的成熟,我們看到很多像 Midjourney、Character.ai這類優秀應用的出現。這里面一個takeaway是我們要在正確的時間做對的事情。在底層技術不夠成熟的情況下,你可以去做技術創新,因為這時技術優勢能帶來非常強的產品競爭力,比如 ChatGPT 之所以很強大是因為有自己的底層大模型, Midjourney 效果驚艷也是因為自己做了底層大模型,使得他們產品實力突出。但當底層技術已經非常成熟了,創業者就應該更多去尋找一些應用層的創新機會。如果此時再去做大語言模型創新的話,會非常卷,難度比較大。
3D、音頻、視頻大模型
仍處于技術發展早期
細分來看,目前不同模態大模型的技術發展程度是有差異的。大家可能目前
大語言模型
對于大語言模型來說,其實分成了幾個發展階段。第一階段是從 2017 年 6 月 Transformer 的那篇論文提出到 2018 年 Bert 的模型的出現前,這期間屬于非共識階段,大家都知道它,但并不清楚它到底能起到什么作用。2018 年 Bert 模型提出來,并開始應用在一些比如翻譯等場景中,此時大家發現基于 Transformer 預訓練的模型能夠提升翻譯各種文本的效率,但當時也只是把它作為任務能力提升的工具。到了第三階段, 隨著GPT 3出現開始形成新的共識,也就是通過預訓練的通用大模型去完成幾乎所有任務,只要下一個 token 預測越來越準確,就可能有更多的智能產生,也就是“涌現”,這就是大模型 AI 的第一性原理,以前的各種小模型、架構可能也就逐漸拋棄掉了。
現在大語言模型已經有了 GPT 4這樣閉源的基石模型,像 Llama 2等開源模型也出現了。從底層的技術角度來講,大語言模型已經相對成熟,并且已經有像 ChatGPT 月活過億的killer App教育了整個市場跟用戶。所以大語言模型進入到應用快速爆發階段,包括各個企業可能都在用 AI 的tools、 Copilot 去結合業務場景做企業知識庫、 chatbot,游戲NPC等,實際上這些都正在發生。
文生圖
圖像生成領域目前也進入到一個比較成熟的階段。 Diffusion擴散模型比較重要的基石理論是在 2020 年提出的,2021 年 OpenAI DALL -E推出,到2022年上半年,閉源模型Midjourney V 1 版本推出,但那個時候還非常粗糙,很難商業化。再到2022年 8 月, Stable Diffusion 發布了一個開源模型,然后整個這個文生圖就開始進入到一個非??斓陌l展階段,直到今年 Midjourney 發布V5版本,圖片生成的效果已經達到讓設計師感到驚慌的程度了。目前 Midjourney 的Discord 社區用戶已經超過1700 萬人,是文生圖里的killer APP。在圖像生成領域,它的閉源基石模型跟開源基石模型都出現了,開始進入到了一個應用爆發的階段,比如妙鴨、 Lensa 等一系列應用如雨后春筍般出現。
相對大語言模型和圖像,其他模態目前整個發展階段會相對落后,
3D生成
3D生成的基石理論 NeRF 是在2020年提出的,從2022年開始進入到一個加速發展階段,數量繁多的模型出現,比如初期的DreamFusion,Magic3D等,但到目前為止還沒出現一個大家公認的基石模型。不過通過不斷調研我們也發現,在一些游戲資產、元宇宙資產、數字人資產的生成中有比較多的關于3D生成應用的探索。
視頻生成
此外視頻生成也是一個非常重要的方向,它是基于圖像的 Diffusion 模型來做的,把不同的圖像一幀幀的動作連貫跟關聯起來變成視頻。其實從去年開始在視頻生成領域有非常豐富的論文跟產品出現,目前做的最好的還是 Runway,估值已經達到 15 億美金,我們判斷,目前視頻生成的商業化落地還處于比較早期階段。
音頻生成
在音頻生成領域,基于 Transformer 預訓練的新技術范式,相比于過往 TTS 的語音會有比較大的質的飛躍,但目前仍處在前期應用探索的階段,原因在于有音頻數據并沒有圖像跟文本豐富。值得一提的是,今年微軟跟Meta都提出了一些比較有意思的音頻生成模型,類似于 ChatGPT 的prompt,用戶輸入一個 3 秒鐘的語音,它就可以很快的去克隆一個用戶自己的音色,連說話的情感基調也是一樣的。不過總的來看,3D 視頻跟音頻還是處在技術創新早期。
文本和圖像類AIGC訪問量最大
商業類AIGC正在崛起
為了更加清晰明了的洞察整個AI行業創業圖譜,我們做了今年8月單月AI海外產品訪問量的梳理。如果刨除 ChatGPT 這些大的應用, 今年8月整個AI市場的產品大盤的訪問量跟我們上述介紹的分布是比較契合的。

目前訪問量最大的應用是文字,其次是圖像,之后依次是商業領域、代碼生成、音頻跟視頻。
我們發現大語言模型產品訪問最多的主要集中在虛擬角色,就類似于character.ai,其次是通用寫作。圖像則更多在圖像生成跟編輯領域。商業板塊則主要是各種垂直行業的應用。上述訪問量反映了文本跟圖像的 AIGC產品目前是比較容易找到PMF的,但也同時也說明創業者在這些領域開始卷起來了。
Chatbot 訪問量最高
虛擬陪伴應用粘性最強
從動態變化的角度我們再來看去三個月TOP100的 AIGC 產品的流量變化。

可以明顯地看到整個大盤其實從5月開始見頂,6-8月開始稍有下滑。訪問量最多的還是ChatGPT 類的chatbot,不過chatbot的流量連續三個月都在下降。而類似于像 NewBing這類搜索則流量相對平穩,圖像生成的產品流量在6-8月有微漲。從平均用戶時長角度來分析,虛擬陪伴類應用雖然訪問量并不是特別高,只在所有應用中排名第五,但是它的平均的用戶時長最長,平均為25分鐘,而且還在往上漲,如character.ai 目前的平均用戶時長為 34 分鐘。用戶時長排名第二、三位的分別是生產力助理,文檔制作。
AI濃度變高
Copilot 類創業占比近一半
YC 創業營基本是北美創業的一個風向標,我們可以從 YC 孵化器今年冬季和夏季兩期創業營的數據來觀察AI海外創業趨勢。

首先, AI 濃度在快速提高,也意味著 AI 創業更卷了。今年上半年 37% 的項目是 AI 的項目,到今年9月份AI項目的比例上升到了 60% 。
其次,不同類型的 AI 項目占比跟分類也發生了明顯變化。底層大模型創業在減少,從 14% 下降到了6%,更多的創業者開始往應用層、中間層轉移,比較多的集中在了Copilot 這塊。 今年上半年Copilot 更多還是做比較淺的 ChatUI,深度結合Workflow的Copilot成為創業熱門。以法律行業為例,法律行業Copilot 扮演著職業律師合作伙伴的角色,它可以幫律師完成審查合同、做會議紀要、做企業內部知識庫檢索等工作,而不僅僅是一個法律知識問答的對話框。
通用場景AIGC融資較多
垂直場景啟動更易
從AI創業項目融資金額來看,不同領域獲得的融資額是有所差異的。

to B應用方面,在通用場景這塊的創業公司拿到了更多的資金,而專注于垂直場景的to B應用獲得的融資大概只有其1/5 左右。to C應用主要分為個人通用類和個人效率工具,截止到9月17日,個人通用應用融資數量大約是個人效率工具的2倍左右。
同樣的趨勢也是出現在了平均單筆投資金額上。 to B 通用工具平均拿到的錢大概是做垂直場景垂直行業的 4 倍左右,通用的 to C 應用拿到的平均單筆的融資金額是單點工具的to C 應用的 2.5 倍左右。
從中我們也能得出結論,通用場景往往是比較燒錢的,因為需要兼顧不同領域的知識跟能力,面向人群也更廣,而相對而言,垂直場景或者是偏單點應用的工具其實不需要非常多的資金就可以啟動。
從新范式轉移看AIGC創業時機
在總結了過往和海外AI產品的新趨勢、變化后,回到最為核心的問題,對于創業者而言,現在到底是否合適做 AIGC 創業呢?這里想跟大家分享幾個觀點。

第一,預訓練大模型帶來了新范式的轉移,使得用 AI 技術去做應用開發的門檻比以前大幅降低,而如果你是做 to B 生意的話,也會帶來交付成本的大幅降低。
原理很簡單。在AI1.0階段,你要做一個 AI 應用,需要算力和非常多的數據準備,比如數據清洗、打標、結構化,然后根據你要完成的任務去做拆解,拆解完的各部分可能需要去訓練一個個小模型,之后還要去做模型的運維跟部署才能去支撐你的應用。而且如果你是做 to B 類的話,可能針對每個 to B 的客戶你都要把模型重新做一遍,如果沒有幾十人的團隊很難干下來。
然而到了AI2.0階段,開發門檻發生了顯著變化,上述這些復雜的工作,全都交給一個通用的大模型解決。你可以用通用大模型的API 進行調用,或者自己去借助開源模型 finetune一個出來,如果團隊能力強的話,也可以自己訓練一個大模型,這種通用大模型可以解決以前 10 個小模型解決不了的問題。
當然這是一個最簡略的圖,你還可以再加向量數據庫、思維鏈、思維樹,做AI agent 去解決更復雜的問題。但不管怎么樣,與AI 1.0時期相比,應用開發門檻是降低了一個數量級的。
第二,大模型帶來了人機協同的新范式。

過去 AI是一個簡單的工具,可能帶來的幫助并不是特別大?,F在大家在做AI的Copilot , 讓 AI 成為你工作的一個partner,你給它定目標,它快速地去執行任務,然后再由你去做修改、調整跟確認,最后 AI 結束該任務。
而我們現在正在從Copilot到agent 模式遷移。在 agent 模式下, AI 作為一名公司員工,可以自己組建團隊,你給AI agent 一個任務,它可以自動安排任務給產品經理、架構師、運維、程序員,并由他們自己去觀察、思考、行動,然后再去結束整個任務。在該模式下會誕生很多超級個體或者是超級團隊,人類在其中扮演的角色是給 AI 定目標,提供資源,做檢查跟評估、反饋。
實際上,我們發現很多 AIGC 團隊其實已經不需要那么多人了,它可能背后有很多的AI機器人在工作,比如一個10 人的AI創業團隊,你擔任CEO,CTO 可能是GPT, CMO 可能是 Midjourney。
再往下一個階段發展可能會進入到 AI Society 模式,就是人跟智能體兩者是一個相對比較平等的角色,既可以自主提需求,也可以互相提供資源,當然這是比較長遠的事情。

AIGC產品的開發門檻大幅的降低,也意味著只需非常少量的資金即可推出AI產品。根據A16Z的最新統計數據,在訪問量 TOP50 的AIGC公司中有超過二十家公司是沒有融資過的,在以前的互聯網時代其實是不會出現的。這里我們發現互聯網的燒錢邏輯變了,創業者用少量的資金推出一個 AI 產品是可行的,原因就是我們前面提到的,開發門檻降低,以及新的人機協同帶來的生產力提升。
另一方面對 AI 創業者的好消息是消費者使用和付費意愿也大幅提高了。右邊這張圖,我們在把AIGC產品跟非 AIGC產品的自然獲客進行對比后發現,AIGC最低四分位只有 2% 的流量來自于付費流量, 98% 都是自然增長,同時TOP50 AIGC公司中有 90% 的公司已經盈利了。而非 AIGC 產品的話,它的最低四分位有 70% 的流量是都是付費的。
因此 AIGC產品相比于過去的互聯網跟移動互聯網,大家使用和付費的意愿提高了很多。我覺得背后的邏輯,一個是 AIGC產品中一方面是提升生產力,大家普遍更愿意為“開源”而不是“節流”去付費,另一方面也有類似于妙鴨這樣的產品,在滿足消費者美、有趣的這種社交需求上相比前代技術有了質的提升。
回到開頭的那個問題,現在是不是AIGC創業一個好的時點?我的結論是Yes,AIGC目前還處在整個新的創新周期的早期階段。
AI創業:from China to Global

中間這張圖是我在今年2月份時候的一個截圖,我覺得這是中國移動互聯網的高光時刻:在北美的 APP store 排行榜的前五里面有四個APP都來自中國,第一個是拼多多的Temu,第二是capcut,也就是剪映,第三是TikTok,第四是谷歌,第五個是Shein。說明中國的團隊是完全有能力做出全球一流的應用的。
右邊這張圖是斯坦福的一項研究,說的是中國的AI論文指數在2020年的時候就超過了美國,說明中國的AI人才積累也是有的,但需要看清差距的是中國的AI論文數量多,但缺乏原創性和有影響力的研究。盡管這次AIGC浪潮又是美國在引領,但在OpenAI等已經把路徑走通了的情況下,對我們來說追趕也不是那么困難的事情。
我覺得中國創業者應該具有著眼全球的野心。在一些技術比較成熟的細分賽道去全球卷應用,因為中國有最好的程序員、產品經理跟運營。而在一些技術上還不是那么成熟的賽道,比如 3D、視頻、音頻、AI agent等,中國的創業者也是有能力去拓荒,成為更多行業的SOTA。
作者 | 鄭曉超 錦秋基金投資副總裁
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。