首頁 > AI資訊 > 最新資訊 > 大模型時代,利用小模型實現(xiàn)場景創(chuàng)新也是一種新思路

大模型時代,利用小模型實現(xiàn)場景創(chuàng)新也是一種新思路

新火種    2023-11-22

在國內(nèi)企業(yè)先后發(fā)布數(shù)百個大模型之后,人們的實際生活似乎并沒有因為新一輪AI浪潮的到來產(chǎn)生容易被感知的變化。應(yīng)用端,自年初Chat GPT的爆火和AI繪圖成功破圈后,大模型的落地應(yīng)用似乎就被困在了“陪聊”和“繪畫”之中。

“大模型對于行業(yè)來說無疑是一場革命,但它并不是萬能鑰匙,我認為在很多垂直領(lǐng)域,很多企業(yè)應(yīng)該更多地建立自己能夠負擔(dān)起的‘小模型’,通過具備學(xué)習(xí)能力的AI加速小體量應(yīng)用場景的體驗更新。”未來智能CEO馬嘯告訴鈦媒體App。

作為一家在創(chuàng)業(yè)階段的人工智能硬件公司,馬嘯將目光投向了“會議耳機”品類,研發(fā)服務(wù)于在線會議和紀(jì)要、摘錄功能的智能硬件就是他口中提到的“垂直應(yīng)用領(lǐng)域”。

“生產(chǎn)力”成為耳機的附加值

后疫情時代,“混合辦公”已經(jīng)成為常態(tài)化的工作模式,受疫情影響的3年時間內(nèi),很多人從不會用、不習(xí)慣在線協(xié)同辦公、舉行會議,逐步被教育成完全適應(yīng)在線氛圍,并以此提升效率。因此在線下生活逐步恢復(fù)后,在線會議的需求非但沒有熄滅,反而實現(xiàn)了進一步增長,線下與線上呈現(xiàn)出融合趨勢,根據(jù)騰訊會議的數(shù)據(jù),到2022年,平臺用戶數(shù)已經(jīng)超過2億。

不過高效、便捷的溝通也帶來了一些“副產(chǎn)品”:大量需要轉(zhuǎn)譯的語音數(shù)據(jù),以平均150字/分鐘的正常語速來計算,1小時的會議理論上就會產(chǎn)生9000字的速記稿,這也是為何眾多會議平臺都開始推出會議紀(jì)要、速記等功能的背后原因。

“會議耳機的切口其實就是成為線上以及小規(guī)模線下溝通的‘記錄員’,相較于單純由軟件提供的轉(zhuǎn)譯、記錄功能,耳機作為硬件產(chǎn)品,其自身具備拾音和聲音傳導(dǎo)的特性,因此不會產(chǎn)生兼容性和數(shù)據(jù)跨平臺提取的問題,只要用戶需要就能隨時進行記錄。”馬嘯說到。

從產(chǎn)品搭載的實際功能來看,會議耳機產(chǎn)品等于在傳統(tǒng)的TWS耳機基礎(chǔ)上增加了與語音、文字處理相關(guān)的功能,換句話說,此類產(chǎn)品帶來的差異化體驗并不只限于是音質(zhì)、降噪、佩戴等傳統(tǒng)耳機產(chǎn)品競爭的賽道,而是更加偏向于作為提升工作效率的生產(chǎn)力工具,就跟為了碼字更快換一把鍵盤、為了剪輯視頻換一臺高性能PC同理。

但作為耳機與智能錄音筆或其他具備錄音處理能力的硬件結(jié)合體,哪個類目才是“本我”也是一項挑戰(zhàn),即:究竟是做一個耳機形態(tài)的智能錄音設(shè)備,還是做一個具備錄音轉(zhuǎn)寫功能的耳機。

剛涉足耳機領(lǐng)域時,未來智能的團隊也碰到過釘子,首款驗證產(chǎn)品直接延續(xù)了“單點打透”的思維,采用突出語音處理的功能屬性弱化耳機體驗的方式,但經(jīng)過市場驗證后很快回爐重造,事實證明用戶并不是需要一臺戴在耳朵上的“錄音筆”。

馬嘯分享到:“僅從現(xiàn)階段的產(chǎn)品表現(xiàn)來說,我們的產(chǎn)品更像是在提供一個符合同價位產(chǎn)品基礎(chǔ)體驗功能的耳機,比如目前主打的千元級價位,我們推出的Nano+同樣也支持低延遲連接、主動降噪、通話降噪等功能,同時它還擁有文本轉(zhuǎn)譯、語音記錄等功能作為‘附加值’。”他說到。

與生產(chǎn)力的高度貼合,也激發(fā)了會議耳機在內(nèi)卷嚴(yán)重的TWS領(lǐng)域獲得了較為差異化的競爭力,在此之上,馬嘯則認為獨有功能會成為用戶持續(xù)選擇旗下產(chǎn)品的“品牌粘性”之一。他提到:“傳統(tǒng)的TWS耳機除了手機+耳機的獨家生態(tài)以外,缺乏很多應(yīng)用層面的抓手,而與會議記錄場景的高度綁定,則讓用戶在保留核心功能的同時,會為周邊體驗的升級付費。”

AI不止有大模型,小模型時代也將到來

消費者端,經(jīng)過一段時間的打磨,初代會議耳機依靠簡單的文字速記、語音轉(zhuǎn)譯功能開始受到金融圈、媒體等需要高頻交流且有實時記錄需求群體的關(guān)注。而在新一代產(chǎn)品上,則增加了生成式會議助理、同傳聽譯、待辦跟進等功能。

其中,生成式會議助理可以根據(jù)通話內(nèi)容自動提取出待辦事項,這就需要利用到AIGC(人工智能生成內(nèi)容)技術(shù),這就與目前主流的大模型人工智能產(chǎn)生了交集,該行業(yè)目前也處于極速膨脹的狀態(tài),幾乎所有科技公司對大模型的趨之若鶩,甚至要花費巨量資金、人力以構(gòu)建自身的獨有大模型。

但對于未來人工智能的整體發(fā)展方向,馬嘯則提出了不同的觀點:“經(jīng)過我們的測算,不需要大模型那么大的參數(shù)量 也能夠滿足絕大多數(shù)會議紀(jì)要生成、日程提取的需要,同時由于訓(xùn)練數(shù)據(jù)更加適合專業(yè)場景,有限規(guī)模的‘小模型’反而效率更高。”

舉個例子,通用的大模型在處理語言信息的時候需要用大量廣義的資訊、文章甚至論文進行機器學(xué)習(xí),才能擁有更強的理解能力和邏輯組織能力,如果還需要增加繪畫功能,那么對模型的規(guī)模要求還會更上一層樓,因此通用場景往往需要大公司重金投入的大模型才能勝任。

但僅從會議場景和日常辦公來說,大量與生活相關(guān)或者與專業(yè)領(lǐng)域極少產(chǎn)生交叉的資料其實是不需要學(xué)習(xí)的。“從長遠發(fā)展來看,我認為每個公司甚至每個產(chǎn)品都會擁有一個適合對應(yīng)AI場景的小模型,主要是用來解決細分場景的應(yīng)用落地需求。”馬嘯表示。

構(gòu)建會議耳機品類初步認知與為產(chǎn)品加入AI延伸的功能,可以看作是未來智能公司的第一階段落成,未來在產(chǎn)品層面還會探索更多形態(tài)的同時,也還會不斷加深市場教育。在其所處的辦公賽道,其實并不缺乏競爭者,一方面視頻會議平臺本身就已經(jīng)開始涉及到硬件層面的部署,同時傳統(tǒng)的辦公場景耳機賽道,也有羅技、Poly等廠商正虎視眈眈。

馬嘯坦言:“面對競爭,我覺得AI功能也好、私有數(shù)據(jù)庫的訓(xùn)練也罷,都稱不上是未來智能公司的和訊飛會議耳機的最大競爭力,從我的視角來看,‘用戶心智’或者說對產(chǎn)品的‘第一認知’才是更重要的底牌,就像可口可樂成為了汽水的代名詞,戴森成為了高速吹風(fēng)機的代名詞,那我們的產(chǎn)品就是會議耳機的代名詞。( 作者/鄧劍云 編輯/鐘毅)

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。

熱門文章