首頁 > AI資訊 > 最新資訊 > 僅用53秒,商湯辦公小浣熊就能助你化身高級打工人

僅用53秒,商湯辦公小浣熊就能助你化身高級打工人

新火種    2024-03-05

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

作者丨郭思

編輯丨陳彩嫻

繼推出ChatGPT后,龍年伊始,OpenAI公司又推出了最新人工智能文生視頻大模型Sora,其火爆效果被譽為即將重塑視頻內容創(chuàng)作的未來。而無論是ChatGPT還是Sora,眾多身處職場的「男工女工」都在一邊期待一邊害怕,工作方式被徹底顛覆。

這一切都是因為AI可以通過現(xiàn)有的網(wǎng)絡、數(shù)據(jù)、資料、知識,展示出超出一般人類的記憶、邏輯、分析、綜合能力,如果它能夠突破與人交互的界面(語言也是一種界面),那這種能力不僅會超過人類,而且超過幾萬倍,能較大限度地提高生產(chǎn)效率,也可能會取代部分傳統(tǒng)工種。

很多人在思考,擁有什么樣「可遷移通用能力」,才能不在這次人機之戰(zhàn)中處于失勢地位,而另一個值得思考的問題則是,究竟怎么樣的應用和工具能最大限度的發(fā)揮大模型的價值,使每一個人的生產(chǎn)效率都倍增?

對于第二個問題,AI科技評論近期發(fā)現(xiàn)了一款大模型原生數(shù)據(jù)分析產(chǎn)品——辦公小浣熊。

這款產(chǎn)品由商湯科技推出,可以通過用戶的自然語言輸入,結合商湯大模型的能力,自動將數(shù)據(jù)轉化為有意義的分析和可視化結果。

在得知辦公小浣熊已經(jīng)開發(fā)公測后,AI科技評論也上手體驗了一把,親身感受了這款加載了商湯大模型能力的數(shù)據(jù)分析產(chǎn)品,驗證其是否能真正意義上提高生產(chǎn)力。

1、當AI變成數(shù)據(jù)預言家

衡量一個大模型原生數(shù)據(jù)分析產(chǎn)品的能力,首先我們從最基礎的做起,根據(jù)文字生成表格。

日常生活中,數(shù)據(jù)文件常見的數(shù)據(jù)格式類型包括txt、csv、xls、xlsx等常規(guī)格式,txt的數(shù)據(jù)基本都是文字。

對于普羅大眾而言,剛剛過去的2023年,疫情剛放開,出行欲望大大增強。筆者首先便用一段國務院春節(jié)出行數(shù)據(jù)放在txt中,讓商湯辦公小浣熊在大段繁雜且未經(jīng)嚴格分類的文字信息中生成表格。辦公小浣熊提供了還不錯的答案。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

另一方面,大模型賦能的數(shù)據(jù)處理產(chǎn)品備受矚目的主要原因在于其能像人一樣思考并且有媲美人類的邏輯推理能力。

在筆者與多位報告制作人員以及采購人員溝通中得知,大多數(shù)從業(yè)者對于表格工具的需求是希望其能一鍵生成多個類型的圖表或者能夠進行一些公式運算,如果能根據(jù)已有數(shù)據(jù)進行分析研判,對打工人來說就更為省心了。

基于這些需求,我們從基本的數(shù)據(jù)整合能力開始測試,輸入一個復雜含多種物品種類的庫存數(shù)據(jù),要求辦公小浣熊進行含有開關一項的數(shù)據(jù)進行整合并輸出總價、辦公小浣熊完美完成了這一任務,并給出了貼心提示,指出有些項目單價或采購數(shù)量沒有提供,導致無法計算其總價。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

此前,依托商湯大語言模型的代碼解釋器能力,辦公小浣熊在數(shù)據(jù)分析場景中的數(shù)據(jù)測試集(1000+題目)中以85.71%的正確率超過GPT-4。

這足以顯示,依托強大的大語言模型能力,辦公小浣熊在理論上有超強的數(shù)據(jù)分析處理能力。當然是騾子是馬,我們還是得拉出來遛遛。在進行多項測試之后,我們發(fā)現(xiàn)不管是簡單還是十分復雜的數(shù)據(jù)表格,他都先會進行解讀,會針對未來趨勢進行研判,并且還會條理清晰的羅列了一些科學建議。

第一個測試實例是輸入近年來全球手機銷量數(shù)據(jù),簡單地讓辦公小浣熊進行分析,預測接下來一年全球手機的銷售情況。

辦公小浣熊首先是基于已有數(shù)據(jù),進行了數(shù)據(jù)分析和總結,分別就全球銷量趨勢、增長率變化以及全球手機總銷量和市場份額進行了要點提煉。

當進一步要求他預測下一年的銷售趨勢時,他也能進行很好的預判。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

這對于從事銷售崗位的朋友來說,無疑是巨大的好消息。而為了進一步測試辦公小浣熊的預測能力,筆者采用了一份較為復雜的技術文檔。

值得一提的是,為了考驗小浣熊,這次我們特意采用了CSV格式的數(shù)據(jù)。

上傳數(shù)據(jù)后,讓辦公小浣熊進行數(shù)據(jù)分析,并輸出五點要點總結。辦公小浣熊則從產(chǎn)品型號、生產(chǎn)技術、價格、核心和線程數(shù)、架構等各個方面進行了總結預測,其分析也基本符合邏輯,并未出現(xiàn)明顯的事理性錯誤。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

體驗了眾多基礎功能后,如果僅僅滿足于這些簡單的功能,也許就稱不上一個高級打工人了。俗話說,打工人打工魂,開工姿態(tài)要端正,如果一個數(shù)據(jù)分析產(chǎn)品能夠按照簡單的指令,上傳之后就能進行全流程數(shù)據(jù)分析,對于生產(chǎn)力的提高,無疑是一個重大利好消息。

為了進一步測試辦公小浣熊的數(shù)據(jù)分析能力,我們繼續(xù)選取了一個數(shù)字資產(chǎn)數(shù)據(jù)表格,并要求辦公小浣熊根據(jù)數(shù)據(jù)對投資組合進行分析,包括評估風險、預測收益等。

辦公小浣熊在進行30秒的思考后,給出了十分詳盡的分析結果,并指出歷史表現(xiàn)并不總是未來表現(xiàn)的準確指標,實際收益可能會受到多種因素的影響。因此,這些預測應該謹慎對待,并結合其他信息和分析方法進行綜合評估。看來辦公小浣熊也充分get到了股市有風險,入市需謹慎的炒股精髓。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

而在另一個更為復雜卻更為常見的互聯(lián)網(wǎng)APP數(shù)據(jù)分析場景中,我們首先用一個包含1000行數(shù)據(jù)的表格進行測試,要求辦公小浣熊總結哪家母公司的下載量最高,且提供三點行業(yè)趨勢分析。

這一次,辦公小浣熊的思考時間變長了,需要53秒的響應時間,但是出來的結果卻十分的優(yōu)秀,他首先點出了下載量最高的母公司是ByteDance,并計算了其總下載量為85487432次。視頻編輯和娛樂應用的流行、電商應用的增長、用戶參與度的重要性三點給出了詳盡的行業(yè)分析。

通過實際的測試,我們也驗證了辦公小浣熊的數(shù)據(jù)分析和推理能力。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

2、實打實的數(shù)據(jù)清洗 大模型幫你打工干活

在日常工作過程中,進行數(shù)據(jù)分析工作時,很多人會經(jīng)常遇到這種困擾:拿到一份復雜的客戶名單或者人員信息表,分類整理出一份Excel表格的時候,卻發(fā)現(xiàn)里面有很多空數(shù)據(jù)或者說出現(xiàn)了很多錯誤數(shù)據(jù)。

而這個看似細微不起眼的問題,卻是數(shù)據(jù)分析工作中非常普遍的場景—數(shù)據(jù)清洗,也就是需要處理“臟數(shù)據(jù)”。

舉例而言,在從大型數(shù)據(jù)倉庫中抽取用于分析的數(shù)據(jù)時,由于數(shù)據(jù)倉庫通常匯聚了圍繞特定主題而整合自不同業(yè)務系統(tǒng)的數(shù)據(jù),故難免充斥著各種不完整性。重復且錯誤的數(shù)據(jù)記錄便是典型的“臟數(shù)據(jù)”實例。為了確保后續(xù)分析結論的精確性和可靠性,我們必須運用專門的工具和技術,依據(jù)一套嚴謹?shù)囊?guī)定來清理這些“污點”,這個至關重要的步驟就是數(shù)據(jù)清洗的過程。

根據(jù)Anaconda和Figure Eight進行的調查,數(shù)據(jù)清理可能需要數(shù)據(jù)科學家四分之一的時間。這也側面反映了數(shù)據(jù)清洗在整個數(shù)據(jù)分析流程中發(fā)揮著至關重要的作用。

一般來說數(shù)據(jù)清洗涉及一致性檢查和缺失數(shù)據(jù)整理。辦公小浣熊是專業(yè)的數(shù)據(jù)分析產(chǎn)品,因此我們便測試了一下它在數(shù)據(jù)清洗方面的種種表現(xiàn)。

首先我們特意將一個有部分字段缺失的表格上傳至辦公小浣熊,要求檢查出缺失數(shù)據(jù)。只花了5秒,辦公小浣熊便檢查出了里面總共缺失的數(shù)據(jù)。(為便于展示,下圖已標出缺失字段)

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

檢查缺失字段或許還比較簡單,為了刁難一下辦公小浣熊,我們特意將一個有計算公式的表格中部分計算數(shù)據(jù)改錯,測試一下辦公小浣熊是否能精準識別出哪些數(shù)據(jù)出現(xiàn)了錯誤。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

在收到指令后,辦公小浣熊展示了他的推理計算過程,在指出錯誤數(shù)據(jù)之后,給出了正確答案。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

可以得見,在數(shù)據(jù)清洗方面,辦公小浣熊也絕不含糊。而另一方面,對于眾多的普通打工者而言,在日常工作中,表格美化的需求也十分旺盛。

最近在網(wǎng)絡十分熱絡的梗叫—PPT/表格男工女工便可以反映這個現(xiàn)象。更有甚者,早年間還出現(xiàn)過一個離譜新聞,一男子乘火車從上海前往連云港開會,去了趟廁所回來后,電腦不翼而飛。

偷走電腦的嫌犯的盜竊理由竟然是:自己做PPT一直困擾,而看到電腦里的PPT覺得特別漂亮,所以一時貪念順走電腦。

所以辦公小浣熊究竟能否最高效率的讓表格或者PPT變得美觀且高大上?

以一個房地產(chǎn)常見的住宅價格指數(shù)表格為例,原始表格很樸實,基本是處于能打開excel的人都能制作出的水平。

借助辦公小浣熊,可以生成美觀的條形圖,更令人驚訝的是,辦公小浣熊還可以生成平時很少見的箱線圖。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

除此之外,辦公小浣熊生成餅狀圖、折線圖等都不在話下。

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

辦公小浣熊生成的餅狀圖

僅用 53 秒,商湯辦公小浣熊就能助你化身高級打工人

辦公小浣熊生成的折線圖

當然以上測試示例只占據(jù)了「辦公小浣熊」功能的一小部分,大家可以前去官網(wǎng),體驗更多內容。

經(jīng)過初步測試評估,辦公小浣熊被證實為一款卓越的輔助工具,無需依賴專業(yè)的編程技能或復雜的操作流程即可有效利用。可支持多元數(shù)據(jù)分析,txt、csv、tsv、xls、xlsx等格式數(shù)據(jù),處理起來都得心應手。它在確保信息準確性、展現(xiàn)邏輯判斷力、理解和適應上下文情境以及執(zhí)行數(shù)據(jù)分析與推理任務等方面均表現(xiàn)出色。

通過接納自然語言指令,結合商湯大模型體系的核心功能,如意圖識別技術、深度邏輯解析能力及代碼自動生成功能,辦公小浣熊能夠將原始數(shù)據(jù)自動轉化為富含洞見的分析結論,并進一步生成直觀易懂的可視化圖表。特別值得注意的是,由于其背后商湯大模型體系對中文語境的強大適應和理解能力,該產(chǎn)品尤其適合滿足中國本土的數(shù)據(jù)分析需求。

在大模型戰(zhàn)爭中,各家使出渾身解數(shù),但幸運的是,技術內卷之下,大模型產(chǎn)品不斷問世、迭代,AGI(通用人工智能)也隨之洪波涌起。

每個人都能夠成為技術的受益者,生產(chǎn)效率也能不斷提高,商湯大模型的使命得以彰顯——技術發(fā)展的意義從來都不僅僅是技術本身,而是技術潮流帶動的社會經(jīng)濟變革,在這一點上,商湯辦公小浣熊交出了一份完美的答卷。

本文作者長期關注一大模型領域產(chǎn)品動態(tài)與故事,歡迎添加作者微信互通有無。

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章