首頁 > AI資訊 > 最新資訊 > 含金量如何?將如何改變社會?……四問AI大模型“競賽”

含金量如何?將如何改變社會?……四問AI大模型“競賽”

新火種    2023-10-24
“百模大戰”激戰正酣。今年以來,生成式大模型的熱火越燒越旺,國內的企業以及科研機構紛紛下場,3月百度“文心一言”拉開序幕,4月阿里云“通義千問”、復旦大學“MOSS”、360“360智腦”上線。與此同時,科大訊飛、商湯等AI(人工智能)公司相繼入局,百川智能等因大模型而創立的公司也開始涌現。據不完全統計,截至目前國內發布的大模型數量已經超過了230家。8月31日,首批通過備案的生成式人工智能大模型開始陸續面向公眾開放,當大模型正式進入應用階段,此時此刻,究竟是如英偉達創始人黃仁勛所說,人類社會已經迎來了人工智能的“iPhone時刻”,還是未來會證明這只是一個“泡沫”,當風口退卻潮水退去,盲目跟風投入大模型的公司才知道自己是在裸泳?目前大模型“含金量”如何?大多數還談不上真正意義的創新目前為止,國內究竟發布了多少家大模型?這一點眾說紛紜,但大模型數量破百已經成為行業共識。5月28日,中國科學技術信息研究所所長趙志耕在中關村論壇上發布《中國人工智能大模型地圖研究報告》時表示,據不完全統計國內已經發布了79個大模型,從地區來看北京和廣東最多。而7月,據騰訊研究院副秘書長楊望調研分析,目前國內的大模型數量已增加至116個,優刻得CEO季昕華則在2023世界人工智能大會上稱,中國已有130家研發大模型的公司。另一方面,有越來越多的大模型選擇開源,7月19日,Meta聯手微軟宣布,繼人工智能大模型LLaMA開源后,LLaMA 2正式開源商用。9月25日,阿里云開源通義千問140億參數模型Qwen1B及其對話模型Qwen-14B-Chat,免費可商用。多個大模型的開源意味著,想要入局“百模大戰”,似乎技術并不是問題。“現在外面許多公開發布的大模型,真正擁有自研創新技術的可能不超過十家。”9月25日,一位負責為企業提供大模型落地服務的科研院所AI從業者告訴貝殼財經記者,“如果要買大模型,只需要把我們的模型‘拷貝走’就行。”在她看來,洶涌而來的大模型熱潮中,企業客戶的大模型能否具備差異性,核心點在于企業自身的數據質量,以及基于此對大模型進行的微調。在采訪中,多位企業家、專家都認為大模型本身的存在已經不再稀奇,這或許就是“百模大戰”之所以能夠出現的原因,在這一形勢下,怎樣能夠“用好”大模型就相當考驗智慧。創新工場執行董事暨前沿科技基金總經理任博冰告訴貝殼財經記者,雖然當前多家企業在投入建設大模型基座,但是“百模大戰”最終勝出的將是幾家頭部公司,包括巨頭、初創公司等在內的技術產品都出類拔萃者。對于AI初創企業來說,應用層、中間層的創業機會更多。在他看來,“百模大戰”里面有很多的大模型技術,基本都是企業自己用或者給行業里面其他人用。“‘百模大戰’并不是只有巨頭才有入場券的比賽,大戰的結果很可能是巨頭、初創企業中屈指可數的技術產品領域的領先者。”印象研究院負責人常誠對貝殼財經記者表示,在大語言模型的基礎算法早已開源的今天,GPT4之所以能夠做到當前的高度,并非在模型方面掌握了多少“獨家秘籍”,而是在模型訓練過程和訓練數據整理加工等多方面的多年經驗積累,“這些經驗中涉及的技巧是從大量失敗的實驗中堆積出來的。”被《時代周刊》評為“全球百大AI人物”之一的中國科學院自動化研究所研究員曾毅在接受貝殼財經記者采訪時表示,國內目前絕大多數大模型還談不上真正意義的創新,絕大多數的努力還是在工程優化方面。因此,未來在提升基礎模型應對復雜問題的泛化性方面,要真正做到數據規模能耗更小,卻表現出更高的智能,在模型算法結構和體系上實現協同創新,而不僅僅是提升用戶體驗,還需要一系列努力。為什么要做大模型?在交互方面的優勢無可比擬“我們從去年年底就開始關注ChatGPT(OpenAI研發的一款聊天機器人程序),我們發現,大模型和我們的研發路線以及在我們需要解決的一些產品問題上,有非常多的契合之處。”9月21日,容聯云AI研究院院長劉杰告訴貝殼財經記者。劉杰表示,大模型技術的落地實際上并不復雜,“大模型的技術方案是比較清晰的,但里面有一些技術細節,包括我們使用什么規格的模型,如何實現并行的多機多卡訓練,以及需要多少數據、什么樣的數據,以及數據的質量等工程細節上,我們花了比較多的時間。其中,一些技術細節需要反復摸索和調試。再之后,如何把大模型和具體的業務場景結合起來,進行更好的匹配,是我們后半段需要著力解決的。”“這一波大模型為什么這么火?因為它確實實用,大模型在交互方面的優勢無可比擬,這一點ChatGPT已經證明。此外,上一代人工智能,如計算機視覺在落地方面成本很高,需要裝攝像頭、軟硬件都要做,并不好落地,相比之下大模型在多個行業都有落地的場景。”上述AI從業者表示。她告訴貝殼財經記者,另一個國內企業必須研發自己大模型的理由是,國外能夠開源的大模型“肯定不會是最好的”,要求不高的業務可以承擔,但難以更進一步,此外其還存在可能的數據安全問題。在劉杰看來,大模型技術確實可以轉化成生產力,“大模型可以對企業原先就有的AI能力進行升級,如更高圖像識別的精確度以及更好的文本生成,大模型具備了很好的基礎知識和能力,可以在很少的數據訓練上就適用新場景新業務。我們擁有AI大模型后,很多以前做得不夠好,無法在產品中落地的一些能力已經可以實現落地了,比如靈活的問答和上下文理解。在業務邏輯上,我們不斷深入AI能力和業務的緊密耦合,最后要實現一個真正AI原生的智能化產品。”對于當前“百模大戰”的行業現狀,劉杰認為,競爭態勢既然存在就有一定的合理性,“一項技術或某個商業模式在步入完全成熟期之前,大家可能對其抱有比較好的預期,希望在戰略上搶得先機,所以切入到里面進行各種角度的探索。事實上,從AI技術發展的角度,如果沒有谷歌和微軟等從不同角度探索技術架構,可能也看不到現在的AI大模型,所以‘兄弟爬山,各自努力’,從不同的山坡向山頂進發,探索不同的方向也是有意義的。”為何產品紛紛接入大模型?處在AI產品爆發的“前夜”貝殼財經記者注意到,截至目前,已經有多家公司在自己的產品中接入了大模型的能力。9月26日,貝殼財經記者在打開百度搜索主頁時,發現搜索框下面的最左側已經不是“網頁”選項,取而代之的是“AI對話”,點擊進入后可以切入“AI助手”界面,直接向大模型提問,記者發現,如果進入“AI助手中心”,用戶甚至可以和AI進行“高清寫實圖片”創作或“模擬戀愛體驗”,其中前者有128.2萬人使用,后者有12萬人使用。8月22日,釘釘總裁葉軍公布了釘釘全面智能化的最新進展:已有17條產品線、55個場景全面接入大模型,完成智能化再造;釘釘同時面向生態伙伴和客戶開放智能化底座AI PaaS(平臺即服務),表示將“用大模型幫助生態把產品重新做一遍。”而早在4個月前,葉軍就在北京展示了釘釘接入大模型后的一系列功能,包括使用AI生成推廣文案、使用繪圖方式創建應用、在視頻會議中生成摘要等。印象筆記也是悄然上線大模型能力的產品之一,早在4月21日,貝殼財經記者就發現,可以通過該App的“新建超級筆記”功能,使用AI進行文檔的總結、續寫、翻譯等。在交互設計方面,AI的不少功能指明了具體場景,如“寫作文”、“采訪問題”等。“我們不希望用戶把大語言模型當做一個事實核查的知識庫系統,因為它本質上是一個統計模型,我們更應該把大模型當做一個推理工具,如果你要寫一個采訪稿,大模型可以勝任單步推理,但對于特別專業的問題,用戶應該至少能判斷結果的質量,不能單純指望語言模型完全替代用戶本身。當然,我們也會持續調優印象AI模型。”印象筆記董事長、CEO唐毅告訴貝殼財經記者。多個采訪對象表示,目前,我們還處在AI產品爆發的“前夜”,也許目前生成式大模型已經開始改變人們的生活,但這一切都是悄然發生的,就如同iPhone出現后智能手機的普及過程一樣。值得注意的是,8月31日首批通過備案的生成式人工智能大模型開始陸續面向公眾開放后,不少大模型的訪問量整體上升。根據方正證券發布的研報,百度文心一言、訊飛星火和商湯商量在8月底可以觀察到一波訪問量的上升,主要由于政策批準大模型商用化落地。百度文心一言流量上升最為明顯,可能由于百度在搜索引擎上的流量優勢,具體來看,“文心一言及訊飛星火在頁面瀏覽量上明顯多于其他三家廠商,同時注意到商湯商量的平均訪問停留時長更長,主要由于商湯大模型編程、圖片生成、模型預標注等功能吸引更多專業使用者。字節豆包的頁面瀏覽量和平均訪問停留時長一度沖高,但是其后出現下滑。”百度9月22日發布的首份《文心一言用戶使用報告》顯示,其最大的用戶群體是一線、超一線城市的中青年打工人,占比最高的兩大行業是IT互聯網和教育,最高頻的三大使用場景是知識問答、文本創作和代碼能力,并且一天24小時每一分鐘都有人向文心一言提問。從行業分布上來看,IT互聯網、教育、社會公共管理、醫藥衛生、能源采礦化工、金融保險、日化百貨等七大行業占比超5成,其中IT互聯網和教育行業用戶占比最高,每4名用戶中會有1名工程師、老師。目前,一些數據已經可以粗略展現出不同大模型在未來可能存在的差異。根據方正證券研報數據,從受眾興趣云圖來看,訊飛星火、文心一言、字節豆包、通義千問在新聞及資訊、門戶、檢索等方面有較高的用戶使用興趣。字節豆包有較大比重是在書簽欄、互聯網、電視劇等偏興趣的領域。商湯商量的用戶興趣中包含產品經理、數據庫,互聯網工具、云計算等,可以看出以工作為目的的用戶相對較多。大模型將如何改變社會?將引領一場新工業革命今年以來,大模型之所以火熱,是因為有越來越多的觀點認為,大模型將在根本上改變現有的行業和主流產品,正如英偉達創始人黃仁勛所說,就像當年iPhone的出現改變了手機市場一樣,AI也已經來到了屬于它的“iPhone時刻”。創新工場董事長、首席執行官李開復也是該觀點的贊同者之一,早在今年3月,創新工場就將“Project AI 2.0”(AI2.0項目)掛到了官網首頁,并表示將在全球范圍尋找具有 AI 大模型、語言生成模型、Multi-modality等領域能力的優秀技術人和研究員。李開復在中關村論壇上表示,大模型改革的不僅僅是人工智能,還將讓公司與公司之間產生平臺式的巨大差距,脫穎而出的必是“沒有AI大模型就不成立”的公司,即“AI first”。在他看來,AI大模型是絕對不能錯過的歷史機遇,它將是有史以來最大的平臺,比windows和安卓的作用大10倍,它將改寫每個應用,重構人類工作,將人的聰明才智放大10倍或更多,取代很多重復性勞動。對此,任博冰表示,“我們把AI 2.0生態分為基礎模型層、中間層(工具層)和應用層,相對而言,應用層、中間層創業機會更多。AI 2.0的平臺生態一旦搭建起來,市場規模將比Windows、安卓等時代大十倍。我個人是PC時代出生的,在當時的互聯網時代以及之后的移動互聯網時代,接觸新東西的能力還行,但是現在很多孩子是在AI時代出生的,他們的教育模式、擇業觀都需要革新,但好消息是,孩子們接受新事物的能力會強很多。AI 2.0的創業者在應用端也可以大膽琢磨研發一些關注更年輕一代需求的新應用。”9月25日,360方面在給貝殼財經記者的采訪回復中表示,大模型不是風口和泡沫,作為新一代的生產力工具,大模型將引領一場新工業革命,賦能產業數字化發展。未來也不會只有一個大模型,而是會像數據庫一樣,變成每個數字化系統的標配。360方面認為,當前國家的重要戰略之一是產業數字化,因此,中國發展大模型也要抓住產業機會,賦能百行千業,推動產業數字化向智能化升級,邁向數字化的頂峰。然而,通用大模型在企業級場景中無法直接使用,存在缺乏商業深度、不“懂”企業、數據安全隱患等六大問題。因此,大模型未來的發展趨勢是“垂直化”,這也將成為中國在全球大模型技術競爭格局中的另一條突破路徑。“目前,大模型是一個可以把人的能力放大的一個工具,就如同互聯網是一個很好的提供信息的工具,大模型是一個很好的智能化工具,它可以幫助我們處理信息,和外部世界進行實際的交互和響應,擁有很多的應用場景。它能表現得如何,根本上取決于使用工具的人和所在的場景,在相當長的一段時間里,行業仍然要聚焦如何研發和設計大模型的能力,再以合理的成本應用到合適的場景上去。”劉杰說。新京報貝殼財經記者 羅亦丹編輯 張冰 校對 賈寧
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章