首頁 > AI資訊 > 最新資訊 > 訊飛開大:生成式AI+ 輸入法,會說你就多說點

訊飛開大:生成式AI+ 輸入法,會說你就多說點

新火種    2023-10-28

最近,科大訊飛舉辦了 2023 年全球 1024 開發者節,全新訊飛輸入法 13.0 版本亮相,這也正臨近訊飛輸入法誕生 13 周年,本次大版本升級最大的看點就是推出了行業首款生成式 AI 輸入法。

如今生成式 AI 的發展方興未艾,而它與萬物智聯時代基礎入口的輸入法結合,也是必然的一步。今年 8 月,訊飛輸入法率先發布了基于大模型的 AI 創作助手,覆蓋 6 大場景,適配 60 多款應用,按下了大模型應用的“啟動鍵”。而這次訊飛輸入法 13.0,則是基于全新的輸入法認知大模型,將生成式 AI 能力矩陣融入輸入法的主場景,再次按下大模型應用的“快進鍵”。

它的愿景,是構建人機交互新模式,實現秒懂用戶需求,生成精彩表達,連接多元服務。

這樣的愿景背后意味著什么?訊飛輸入法又是如何去實現的?一切還得從“輸入法”本身說起。

輸入法的“第三階段”正在到來

輸入法,既是人機交互的基礎工具,也是互聯網以及萬物智聯時代的入口級產品。多年以來,輸入法主要隨著人機交互技術的進步以及智能終端產品的豐富而不斷發展,但整體來看,可以將它這些年的發展分為兩個階段。

以中文輸入為例,第一階段是五筆 / 拼音 / 手寫輸入,也就是我們熟悉的鍵盤打字、手寫識別。第二階段,隨著 AI 語音識別技術進步,語音輸入逐漸成為越發重要的輸入方式。

根據易觀分析 2022 年底做的調查報告,語音輸入在國內的滲透率已經超過 40%,成為用戶最廣泛使用的輸入方式之一。

值得一提的是,中文語音輸入的開創者正是訊飛輸入法,十三年前他們通過這一源頭創新,為人機交互方式翻開了新篇章。這十三年里,AI 語音輸入技術持續進化,在識別準確率、支持的語言類型方面都有了長足的進步。以訊飛輸入法來說,目前語音識別率已超 98%,并已支持 26 種方言、5 種民族語言、30 多種外語的語音輸入,實現了由工具產品向智能交互產品的轉換升級。。

同時,訊飛輸入法憑借持續創新的語音輸入,為用戶提供了獨特的輸入效率價值。一組最新數據顯示,訊飛輸入法日語音滲透率提升 18%,日語音調用量提升 35%,日活提升 10%,在背后提供強大支持的訊飛 AI 語音技術功不可沒。

技術進步只是推動輸入方式發展的因素之一,輸入法在深入我們互聯生活的同時也在解構我們的使用場景,滿足不斷發展變化的用戶需求。當下隨著 5G、AI 等技術的日益成熟,萬物智慧互聯的時代正在加速到來,新的用戶需求涌現,輸入法所承載的人機交互的使命也需要隨之變革。

那么,語音輸入之后的下一代輸入法會是什么樣?

Mob 研究院最近在 2023 年中國第三方輸入法行業洞察報告中指出,“AI + 輸入法 + 場景”正成為行業標配,進一步他們認為“輸入法 + AI 大模型”將成為未來的重要趨勢。

有一點可以肯定的是:“AI”一定會成為輸入法下一階段發展的重點。其實,“語音輸入”本身就已經是 AI 賦能輸入法發展的體現,因為人工智能本身也就是人機交互最前沿的形態,而作為人機交互基礎工具的輸入法,自然也深刻受到 AI 技術進化方向的影響。

從 AI 的角度來看,從 ChatGPT 火熱出圈開始,生成式 AI 認知大模型已經在全球掀起新一輪技術浪潮。過去人們總說“AI 改變世界”,但到底如何改變,答案一直是模糊的,生成式 AI 的發展和應用,仿佛讓人們第一次明確感知到“AI 真的可以改變世界”,改變我們生產和生活的方式。

可以預見,人工智能正迎來“智慧涌現”的大模型時代,在這個時代,AI 大模型將賦能千行百業,從底層重構生產力,作為人機交互入口的輸入法,與 AI 大模型能力深度融合,自然也是必須要邁出的一步。

生成式 AI 輸入法,這是第一份具體而明晰的答案

在確定了方向和趨勢后,接下來的問題就是:生成式 AI 到底應該怎樣和輸入法進行融合?

這個問題也許不同的產品會給出不同的解法,而訊飛輸入法 13.0 版本給出的答案是:在定制的輸入法認知大模型加持下,訊飛輸入法擁有了智慧表達和智能連接的超能力,并且具有自適應和自進化的特點。

作為全新一代輸入法,訊飛為了幫助用戶更好的理解數字世界,首先重構了交互界面。

據了解,在 10 多年前,訊飛輸入法定義了上方工具欄 + 下方鍵盤的現代輸入法基本形態。

隨著社會數字化的深入,用戶對輸入法的需求超越了單純的文字輸入。因此,訊飛輸入法思考著在人機交互方面再向前邁出重要的一步。

“活力視界”的全新設計,就是訊飛輸入法努力打造的數字窗口,在屏幕與鍵盤之間留有更大的空間,賦予推薦區更豐富的屬性。也對訊飛輸入法 13.0 做了搶先體驗,具體來說,在訊飛輸入法 13.0 種,打開 AI 輸入模式,即可在鍵盤上方開啟“活力視界”。

訊飛看到,在新一代 AI 浪潮下,用戶對輸入法的需求全面升維。從原本單純輸入文字,發展到主動生成表達,已是不可逆的趨勢。

智慧表達,就是輸入法要能夠理解用戶的意圖,替用戶說話、替用戶更好地完成表達,以及主動幫助用戶創作內容。

訊飛輸入法 13.0 內置剛發布的輸入法認知大模型,賦以精心調教的生成式 AI 能力。接下來,就讓我們先看訊飛輸入法 13.0 如何幫助我們更好的完成表達。

比如在聊天這一場景中,你想在晚上的聚餐群里告訴大家不能喝酒,思來想去不知該如何表達,這時就可以在活力視窗的高情商溝通里輸入“告訴大家我不能喝酒”,訊飛輸入法基于你輸入的內容,生成一段高情商的得體表達,再也不用冥思苦想或者去網上苦苦搜索了。

再比如你需要在團購網站上給餐廳寫評價參與優惠活動,也可以通過訊飛輸入法的購物評價 AI 服務,讓它根據你的意思創作一段評價文案,避免左思右想寫不出來的尷尬。

你還可以讓訊飛輸入法幫你對文字進行潤色,比如你寫了一句“今晚月亮很圓”的句子,覺得不夠優美,就可以用“潤色達人”的 AI 服務幫你潤色這句話,還能選擇不同的風格,再也不用擔心文采不夠了。

類似的使用場景還有很多,都是在從具象的需求和具體的場景去解決大家在實際溝通表達中遇到的問題,讓你從未覺得“輸入法還能這么有用”。

不僅如此,作為新一代生成式 AI 輸入法,訊飛輸入法正在跳脫工具屬性,變身為助手服務,在你需要的正確時機向正確的人提供完整服務。

比如它可以基于用戶不同場景輸入內容智能匹配輸入場景內多元服務,也可以根據用戶輸入意圖,連接輸入場景外的內容及服務。

舉個例子,當你準備發一條朋友圈時,打開訊飛輸入法 13.0,就會發現它已經智能地將 AI 服務匹配到“朋友圈”文案了,同樣,當你想發一條小紅書種草帖子時,打開訊飛輸入法也會發現它已經明白了你的意圖,匹配到了“種草文案”,這樣你就可以直接使用,整個過程非常自然。

同時訊飛輸入法 13.0 還能根據你的輸入意圖,智能連接場景外的內容和服務。比如小編在聊天的場景里和朋友談論一家餐廳,打出了“這家店”,輸入法就根據小編過去的聊天歷史,猜中了我的意圖,先后聯想到“真心”、“不錯”,當打完之句話,輸入法的活動視窗就直接連接到了“幫你擴展”這個聊天場景外的服務,小編嘗試使用了一下,它果然幫我寫了一段詳細介紹這家店哪里不錯的文字。這種輸入服務跨場景隨想隨到的體驗,讓整個溝通交流的流程都變得省心高效了。

此外,自適應以及自進化,就是在你長期使用的過程中,訊飛輸入法 13.0 會越來越了解你的輸入場景和表達習慣,從而無論是輔助表達還是內容創作,都能更準確地貼合你的意圖和喜好,也就是越來越懂你,從而讓輸入法也能千人千面,更好的滿足每一位用戶的個性化需求。

這就是訊飛對于生成式 AI 輸入法如何落地到具體產品中所給出的解答,從的體驗來看,它確實做到了“AI”+“場景”+“輸入法”的美妙融合,能夠對用戶在各種場景下的交流、表達效率和效果有非常明顯的提升,假以時日,隨著生成式 AI 技術以及產品本身的不斷完善,相信它真的能夠實現“構建人機交互新模式”的革命性愿景。

星火大模型,訊飛輸入法愿景背后的技術底座

從 13.0 版本回過頭去看訊飛輸入法這十三年的發展,AI 是他們深耕 13 年的殺手锏,同時,跟著用戶的需求“與時俱進”不斷革新,則是他們能夠越來越出色的根本原因。

科大訊飛輸入法業務部總經理程坤曾在接受媒體采訪時表示,他們做第一版訊飛輸入法時,初衷就是提升輸入效率,提供極致服務。提高效率的武器是“AI”,無論是獨樹一幟的中文語音輸入還是基本輸入體驗,都有 AI 作為基礎支撐。

而當能解決大眾普適化服務的需求被滿足后,新的需求又會衍生出來,比如在萬物智能時代面對設備多樣性會有新的需求,面對輸入場景的復雜多樣會有新的需求,面對更多元的用戶群體,也會有新的需求。而訊飛輸入法一直沒有停步,在不斷地發現新需求、解決新問題,例如在上一個大版本中,訊飛輸入法還針對這些新需求實現了噪聲、遠場復雜環境的語音識別、20 多種方言免切換、AI 智能化表達助手的多場景覆蓋等能力。

正因如此,訊飛輸入法才能持續受到大眾的認可。根據最新的數據,2023 年 10 月,在輸入法行業已經成熟的背景下,他們產品 DAU、日語音滲透率、日語音調用量、00 后用戶占仍然能獲得突破,用戶規模增速蟬聯行業第一。

這讓我們相信,在下一個生成式 AI 輸入法引領的時代,訊飛輸入法會帶來更大的想象空間和更強的競爭力,讓“輸入”這件再基礎不過的事兒在萬物智聯的世界里迸發出新的生命力。

而我們能夠如此相信的原動力,還是在于訊飛輸入法背后堅實的技術底座 —— 這里指的,自然就是訊飛星火 AI 認知大模型。

就在 9 月初,訊飛星火認知大模型正式面向全民開放。要知道訊飛星火在今年 5 月才正式發布,到正式全民開放不過四多月的時間,其技術迭代速度已然令人咋舌。

同時,在新華社研究院中國企業發展研究中心、《麻省理工科技評論》中國等權威平臺發布的大模型評測報告中,訊飛星火 V2.0 均取得了總分第一的成績,并被 MIT 科技評論認為是“最聰明”的國產大模型。

在本次科大訊飛全球 1024 開發者節上,訊飛星火也如期迎來了 V3.0 的升級,在通用人工智能的七大維度能力得到進一步升級進階,作為鏈接“數字世界”有效手段的大模型代碼能力更是重磅升級,整體超越 ChatGPT,夯實大模型國內應用第一方陣的實力。

而在技術的創新性上,我們就說支撐這一次應用在訊飛輸入法上的突破,就是在多模態能力上,訊飛星火實現了將語音、圖像、視頻等模態對齊到統一語義空間中,實現語義的貫穿、銜接以及多模態協同涌現。因此我們才能在訊飛輸入法 13.0 上用上例如“AI 皮膚”、“AI 頭像”、“AI 造字”等一系列生成式 AI 底層技術之上的獨特創新功能。。

類似的領先性技術還有很多,如前所提到的輸入法認知大模型實現了將識別、翻譯、語種分類等多任務聚合,讓信息互享互通。因而能夠在輸入法上做到多種方言多種語種免切換自動識別、翻譯,這些也都是領先于行業的體驗。

最后,星火認知大模型正在構建“1+N(重大行業)+X(細分行業及產品)”產業發展生態體系,訊飛輸入法則是“智慧輸入”的重要行業應用。隨著整個生態體系的不斷完善,訊飛輸入法與各行各業應用場景的連接緊密度必然也會迎來質的發展,這對于訊飛輸入法向 B 端的發展也帶來了更廣闊的想象力。

結語

自從移動智能終端出現,在觸控屏幕上行“如何更舒適高效地輸入”是伴隨行業發展最基本、但很多產品都沒能解決好的問題。

?但訊飛輸入法沒有因為這件事“難做”而放棄,并且幸運的是,這件事恰好天然適合以 AI 技術見長的訊飛來完成。

因為在人機交互的過程中,“輸入”這個行為的本質還是要讓人的意圖被機器理解,從這一點出發,曾經我們熟悉的鍵盤打字、手寫等,都是機器智能化程度不夠而妥協的產物,而 AI,才是輸入這件事的終極答案。

訊飛輸入法從一開始就錨定了 AI 這一點,多年以來堅持從產品定位、功能和設計等全方面強化 AI 對輸入法的賦能,最新的訊飛輸入法 13.0,就是在生成式 AI 時代來臨時,訊飛對“生成式 AI 輸入法”這一必然趨勢的前瞻布局和占位。

而在萬物智能逐漸成為現實的今天和未來,相信在訊飛輸入法的引領下,“輸入”這件事可以變得前所未有的輕松,人機交互也真的能迎來一場久違的變革。

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章