手機上無處不在的AI,原來還藏有這么多秘密
盡管2023年才過完了一半,但來自AI領(lǐng)域的科技震撼卻沒有要結(jié)束的意思。回顧過往,AI從沒像今天這般那樣受人矚目,似乎一夜之間,它就成了新的科技方向。
當(dāng)然,眼下大家所談及的AI,更多是以Chat GPT為代表的,一種基于人工智能技術(shù)驅(qū)動的自然語言處理工具。它能對話,能畫圖,能勝任各種工作;它懂邏輯,擅推理,甚至可以解讀人的情緒和態(tài)度,如此種種,一步步填補了我們對真實AI的向往。
AI在拍照中的應(yīng)用
其實聊到AI,大部分用戶都不會陌生。我們每天手機不離手,而大家最開始接觸AI應(yīng)用,很多都是來自智能手機,其中最具代表的當(dāng)屬手機影像了。
在手機拍照過程,AI的作用稱得上立竿見影。以小米13為例,當(dāng)我們進入到相機界面,在下拉菜單項中,會有一個“AI相機”字樣的選項。
開啟AI功能后,我們會發(fā)現(xiàn)照片的色彩更明艷,飽和度更高,亮度也有所變化。有了這個功能,當(dāng)你按下快門的那一刻,手機就會根據(jù)此時此刻的拍攝場景自動計算出最優(yōu)方案,從而直接“P”出一張成片,省去了后期的步驟。
如果只是做到這一點,顯然是不夠的。隨著智能手機AI能力的變化,在手機影像上,有AI參與的場景可以說是越來越深入,越來越頻繁。
其中,夜景就是一個十分典型的場景。眾所周知,CMOS的面積越大,進光量就越多,夜景照片成像質(zhì)量自然就越好。但受限于機身的尺寸,手機內(nèi)部很難塞下更大尺寸的傳感器和光學(xué)鏡頭,光線越復(fù)雜,圖像就容易產(chǎn)生噪點,看上去很模糊,手機拍夜景就會顯得愈發(fā)力不從心。
但事實上,我們發(fā)現(xiàn)手機拍攝夜景其實是很能打的,甚至不輸一些專業(yè)設(shè)備。為什么會這樣呢?答案一目了然,自然還是與AI有關(guān)。
有了AI參與之后,手機拍攝的夜景照片就不再是單次曝光所得,而是連續(xù)拍攝多張不同參數(shù)下的照片,然后進行堆棧,進而合并成一張樣張。這個過程還是比較復(fù)雜的,但利用AI可以快速找出樣張中的特征點進行校準(zhǔn),再將多幀畫面進行合成,有效去除噪點以及提升畫面細(xì)節(jié)。
除了AI模式、夜景模式等基本應(yīng)用外,隨著AI能力的提升,也衍生出了萬物追焦、疾速抓拍、魔法換天、背景虛化等進階應(yīng)用,大大豐富了手機相機的玩法,提升了拍攝體驗。
萬物追焦
就比如萬物追焦,穩(wěn)定精準(zhǔn)智能可持續(xù)地追焦能力特別適合拍攝運動中的物體,如果家中有活潑好動的小孩子或者寵物,這個功能簡直不要太好用。
魔法換天
還有魔法換天,你可以給相冊中的照片編輯各式各樣的天空效果,拍不出星軌沒關(guān)系,可以后期一鍵生成,拍不到圓月也沒關(guān)系,一鍵生成一個就完事了,甚至還能一鍵加入閃電、落日、極光、銀河……不僅玩法新穎,看上去也是毫無違和感。
AI在日常生活中的應(yīng)用
那么除了在拍照時,在日常使用時,又有哪些場景會用到AI呢?
其實還真不少,就比如在小米手機中,有一個很有意思的AI應(yīng)用,可以說是我自己的最愛之一,它就是AI通話。
當(dāng)有電話打進來時,我們無法接聽,但又不想錯過,或者總被營銷電話騷擾不勝其煩,遇到這種情況,“小愛通話”就可以幫助我們很好完成“接聽”工作。
對于MIUI用戶來說,大家對小愛同學(xué)并不陌生,但應(yīng)該很少有人知道它還有這種用途。簡單來說,這就是一個基于AI技術(shù)的自動通話功能,接聽后,小愛會識別對方所說的內(nèi)容,用AI語音進行回復(fù),在通話結(jié)束后,還會把對話過程通過文本形式記錄下來,方便我們后期查看。
當(dāng)大家追劇時,如果看到自己很喜歡的英劇美劇,卻發(fā)現(xiàn)沒有翻譯字幕,肯定就要遺憾錯過了。
同樣在小米手機中,用戶可以開啟“小愛翻譯”,找到“實時字幕”功能,這樣在觀看視頻就會實時生成雙語字幕。
實時翻譯
從實際體驗來看,它的翻譯速度和準(zhǔn)確性都很高,基本不影響理解。而且不僅僅追劇,在線直播、視頻會議等場景都有不錯的表現(xiàn),可以說是AI在實際用機過程中頗具代表性的一個應(yīng)用場景。
其實AI在手機中的使用場景還有很多,比如AI輔助信號增強,通過AI偵測用戶手部使用習(xí)慣,可以更準(zhǔn)確地偵測使用場景,從而實現(xiàn)更低的通話掉線率、更快的數(shù)據(jù)傳輸速率、更廣的網(wǎng)絡(luò)覆蓋和更長電池續(xù)航;還有智能語音助手、照片分類整理、AI視頻剪輯、面部解鎖等等,滿足了用戶用機過程中的各種需求。
手機上AI的來自哪?
不過,AI這么強大實用,但它也不是憑空而來的。我們前面談到的一系列AI用例都來自小米13,那么小米13的AI能力又來自哪里呢?
這就要說到它所搭載的第二代驍龍8移動平臺了,第二代驍龍8移動平臺搭載了一顆專門面向AI計算的Hexagon處理器,和以往不同,這次高通不但為Hexagon處理器設(shè)計了獨立的供電系統(tǒng),它的架構(gòu)也有所變化,使其能夠更好支持Transformer網(wǎng)絡(luò)在終端側(cè)的推理能力。
大家還記得小米13上的實時字幕功能嗎,它之所以能夠在本地呈現(xiàn)出快速準(zhǔn)確的翻譯效果。也正是憑借Hexagon處理器硬件性能的提升,使得第二代驍龍8移動平臺成為了業(yè)內(nèi)最先達到INT4精度的移動平臺,與INT8精度相比,INT4帶來的是90%的AI推理性能提升以及60%的能效提升,這使得第二代驍龍8,在自然語言處理用例下,能夠?qū)崿F(xiàn)4.35倍的AI性能提升。
除了Hexagon處理器外,在第二代驍龍8移動平臺中,傳感器中樞能力同樣得到加強,實現(xiàn)AI性能的翻倍。一般來說,傳感器中樞主要承擔(dān)一些低功耗輕負(fù)載的任務(wù),如大家熟悉的語音助手、視覺喚醒和圖片分類之類的。
而在第二代驍龍8中,廠商能夠圍繞傳感器中樞打造更為豐富的應(yīng)用場景,比如息屏狀態(tài)下也能快速
在影像方面,第二代驍龍8移動平臺在Hexagon處理器和ISP之間,增加了一個名為“Hexagon直連”的物理連接,打造了移動行業(yè)首創(chuàng)的“認(rèn)知ISP”,并帶來了“實時語義分割”技術(shù)。
“語義分割”可以對畫面中不同區(qū)域、不同元素進行單獨的渲染處理,比如區(qū)分拍攝主體和不同的背景,或者在人像拍攝中,對被拍攝者的皮膚和五官進行單獨修飾,它的處理過程是實時的,而且速度非常快,用戶按下快門后,就能立馬得到想要的照片,不用等待。
最后:
AI作為近年來最火熱的一個領(lǐng)域,吸引了包括高通在內(nèi)的許許多多科技公司的
值得一提的是,高通在6月16日正式發(fā)布了《混合AI是AI的未來》白皮書,明確表示在云端和終端進行分布式處理的混合AI才是AI的未來。另外,高通也談到隨著強大的生成式AI模型不斷縮小,以及終端側(cè)處理能力的持續(xù)提升,混合AI的潛力將會進一步增長,前景可以說是十分光明。
總的來說,無論從實際體驗上,還是白皮書中所闡述的,高通在終端側(cè)AI方面確實有很大優(yōu)勢,而且要知道,全世界搭載驍龍和高通平臺的已上市用戶終端有幾十億臺,每年還有數(shù)億終端產(chǎn)品涌入。也正是得益于高通AI技術(shù)的支持,今天的手機、汽車、XR等等智能設(shè)備已經(jīng)表現(xiàn)得非比尋常,假以時日,隨著終端AI能力不斷提升,打造一個觸手可及的AI世界,似乎也沒那么遙遠。
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。