ManusvsChatGPT!比拼任務(wù)執(zhí)行能力,誰更勝一籌?
《科創(chuàng)板日報》5月13日訊(編輯 朱凌)隨著AI技術(shù)的發(fā)展,AI Agent(智能體)概念愈發(fā)火熱。曾經(jīng)“一碼難求”的AI Agent平臺Manus于近日全面開放注冊。根據(jù)官方公告,新注冊用戶每天可免費獲得300積分,并額外一次性獲得1000積分。
為了驗證其實用性和任務(wù)完成能力,小K以一名普通用戶的身份,親自注冊了Manus,獲得了1300積分,并對其與生成式AI聊天機器人的代表產(chǎn)品ChatGPT分別進行了兩個真實任務(wù)的測試。
第一個測試任務(wù)是:下載Manus產(chǎn)品負責(zé)人張濤在Manus推出前發(fā)布的一段名叫“為什么以前我不愛和人聊Agent”的演講視頻,提取MP3音頻,轉(zhuǎn)寫成文字,并進一步生成PDF和PPT文件。
Manus接收到指令后,開始了一場漫長且曲折的“系統(tǒng)工程之旅”。它不斷在Linux沙箱的終端中嘗試安裝如BBDown、you-get、FFmpeg、Whisper等工具。
其過程中不斷回顯各種技術(shù)日志,看起來更像是一位在調(diào)試腳本的工程師。一旦遇到環(huán)境異常就重置沙箱,從頭開始全部流程。
不過,Manus多次重試安裝語音識別模塊Whisper,但均未安裝成功,由于耗時過長,小K主動要求Manus跳過轉(zhuǎn)寫和生成PDF和PPT文件任務(wù),直接輸出MP3音頻。
最終,Manus輸出了MP3音頻,并將這份MP3嵌入到一個自動生成的網(wǎng)頁中并部署上線。整個任務(wù)耗時約一小時,在未完成文字轉(zhuǎn)寫、PDF、PPT的情況下積分一次性消耗了1000點。
令人感到落差的是,明明可以通過一次簡單的API調(diào)用快速完成的任務(wù),Manus卻將流程人為拆解成多個步驟,從而制造出“AI很忙”的錯覺。這種“任務(wù)復(fù)雜化”的做法雖然體現(xiàn)出平臺對自動化流程的執(zhí)著,但也大大拉長了執(zhí)行時間,耗費了更多資源。
而面對相同請求,ChatGPT明確表示無法進行視頻下載和轉(zhuǎn)換,但可以提供內(nèi)容摘要與演示文稿提綱。在小K確認后,ChatGPT在1分鐘內(nèi)就基于視頻生成了400字摘要,包括張濤的轉(zhuǎn)變邏輯、技術(shù)演進、Agent行業(yè)趨勢的詳盡大綱,并建議了PPT結(jié)構(gòu)設(shè)計。
在小K進一步提出生成PDF和PPT后,它迅速完成并提供了可直接下載的文件。
雖然ChatGPT不能原始下載視頻,未能輸出MP3音頻,但完成了有組織的、高質(zhì)量的文字總結(jié)和PPT、PDF生成,對資源不可達的場景有自適應(yīng)應(yīng)對機制,任務(wù)完成度相對Manus更高,用戶體驗更高效、有邏輯,其內(nèi)容提煉能力極強,適合需要快速摘要的場景,節(jié)省了等待與調(diào)試的時間。
第二個測試任務(wù)是:幫我制定3天東京自由行:①生成行程表(含地址/營業(yè)時間),②查公共交通路線并計算預(yù)估費用,③訂3家拉面店午餐位,如需驗證碼或付款請停止并提示我。
Manus整整用了20多分鐘“逐項采集數(shù)據(jù)”,包括通過調(diào)用網(wǎng)絡(luò)數(shù)據(jù)源采集景點,查詢每個景點的地址與開放時間;計算每日交通路線和預(yù)計費用;篩選東京著名拉面店,并嘗試預(yù)約。
然而Manus給出的最終結(jié)果是,大部分熱門拉面店(如“饗 くろ喜”、“銀座 篝”、“一蘭拉面”等)均不接受線上預(yù)訂,通常需要現(xiàn)場排隊等候,部分店鋪或可嘗試電話咨詢,但不能保證預(yù)訂成功。建議在午餐時間前提早前往或做好排隊準(zhǔn)備。
Manus輸出了一份包含3日詳細行程、景點地址和營業(yè)時間、交通費用估算的markdown文檔,所有內(nèi)容自動整理為文件輸出,任務(wù)完成度高。不過,內(nèi)容結(jié)構(gòu)偏“流水賬”式,且等待時間冗長。
令人沮喪的是,Manus的積分消耗速度也十分驚人。完成第一個任務(wù)后,小K僅剩300積分。雖然評分回贈了100分,也僅稍稍緩解損耗。第二個自由行任務(wù)提交后,Manus扣除了351積分。短短兩次任務(wù),小K賬戶中的積分便已耗盡,未留下任何可持續(xù)使用的余量。
由此看來,Manus每日免費贈送的300積分可能還不夠一次完整任務(wù),結(jié)合任務(wù)實際執(zhí)行情況來看,Manus性價比并不高。
與之相比,ChatGPT快速識別旅行任務(wù)并立即生成以下內(nèi)容:含順序、景點、營業(yè)時間的3天行程建議;每天午餐推薦拉面店,并說明預(yù)約方式;公共交通推薦(如Suica卡、一日券);費用估算(2400–3000日元)。
最終行程排版美觀,內(nèi)容結(jié)構(gòu)自然、可讀性強,整個過程高效、連貫、無需等待中間步驟。
ChatGPT雖然沒有直接嘗試在線預(yù)訂拉面店,但清楚地列出各拉面店的預(yù)約平臺和鏈接。
綜上所述,從這兩個任務(wù)的實踐來看,Manus的定位更接近一個“自動執(zhí)行型AI”,它試圖串聯(lián)真實世界中的工具鏈,實現(xiàn)從網(wǎng)頁抓取到工具調(diào)用、文件部署的完整流程。它最大的優(yōu)勢在于“能干活”,尤其是面對結(jié)構(gòu)明確、步驟清晰的任務(wù)鏈時,能主動完成流程性、跨步驟的任務(wù)(如下載、轉(zhuǎn)換、部署、查詢)。然而,它執(zhí)行過程冗長、穩(wěn)定性不足、智能應(yīng)變能力較弱,并且算力資源消耗偏高。
而以ChatGPT為代表的生成式AI聊天機器人使用類人對話的形式,擅長理解模糊需求,快速提供結(jié)構(gòu)清晰、表達得體、可直接使用的內(nèi)容方案,算力資源消耗較少。
當(dāng)然,隨著AI Agent技術(shù)的逐步成熟,Manus這類平臺仍有其價值。它讓我們看到未來AI不僅僅是“說話”,而是可以主動執(zhí)行任務(wù)、部署網(wǎng)頁、與工具鏈互動。只是這一切尚未穩(wěn)定,也未必高效。
如今的AI Agent,更像是一位尚在成長中的熱情滿滿、略顯笨拙的技術(shù)實習(xí)生,如果未來其能和生成式AI聊天機器人更好地結(jié)合——生成式AI聊天機器人提供智能交互,AI Agent負責(zé)流程執(zhí)行,或許才是用戶真正需要的“全能AI”。
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。