Manus的出現(xiàn),激起了科技與資本市場(chǎng)的雙重震蕩,一時(shí)間AI Agent相關(guān)概念股集體大漲,阿里、谷歌、微軟等科技巨頭密集發(fā)布智能體研發(fā)計(jì)劃......
而在這場(chǎng)熱潮的背后,是AI技術(shù)從“被動(dòng)應(yīng)答”向“主動(dòng)執(zhí)行”的范式躍遷。
盡管市場(chǎng)的評(píng)價(jià)褒貶不一,但不能否認(rèn),Manus的突破性在于,它首次驗(yàn)證了通用型AI Agent在復(fù)雜場(chǎng)景下的商業(yè)化可行性。
傳統(tǒng)的大語(yǔ)言模型雖能生成文本,卻難以閉環(huán)執(zhí)行任務(wù),而Manus通過(guò)“規(guī)劃-驗(yàn)證-執(zhí)行”的架構(gòu),將AI大模型的認(rèn)知能力轉(zhuǎn)化為生產(chǎn)力工具。
根據(jù)麥肯錫等多份權(quán)威報(bào)告,在多元化需求驅(qū)動(dòng)下,AI Agent市場(chǎng)呈爆發(fā)式增長(zhǎng)態(tài)勢(shì),2024年全球AI Agent市場(chǎng)規(guī)模約為51億美元,預(yù)計(jì)2030年將飆升至471億美元,復(fù)合年增長(zhǎng)率高達(dá)44.8%。
然而,這場(chǎng)“智能體浪潮”并非坦途。技術(shù)瓶頸與商業(yè)野心的碰撞,讓AI Agent的競(jìng)爭(zhēng)既充滿想象力,又暗藏風(fēng)險(xiǎn)。
破壁之戰(zhàn)
本質(zhì)上,AI Agent的是具備人類思維范式的數(shù)字勞動(dòng)力。
如果說(shuō)聊天機(jī)器人還停留在“對(duì)話”階段,那么Agent則已經(jīng)開始“行動(dòng)”。簡(jiǎn)單來(lái)說(shuō),可以理解為一種更智能、更自主的AI應(yīng)用,它不僅能回答問(wèn)題,還能執(zhí)行任務(wù)、完成交易。
它們可以被應(yīng)用于各種場(chǎng)景,如客戶服務(wù)、金融分析、軟件開發(fā)等,極大地提高了生產(chǎn)力和效率。
以大語(yǔ)言模型為“大腦”,AI Agent不僅能理解指令表層語(yǔ)義,更能捕捉隱含需求。例如用戶說(shuō)“找性價(jià)比高的酒店”,Manus會(huì)結(jié)合季節(jié)、當(dāng)?shù)鼗顒?dòng)等上下文推理出“預(yù)算敏感型”或“體驗(yàn)優(yōu)先型”需求。
而可以期待的是,隨著大模型在多模態(tài)能力上的持續(xù)突破,特別是多模態(tài)融合技術(shù)的迭代升級(jí),AI Agent將能夠更精準(zhǔn)地解析并反饋用戶需求,逐步實(shí)現(xiàn)類人類的視聽感知與交互能力。
這將使得AI Agent可以應(yīng)用于更廣泛的領(lǐng)域,如醫(yī)療診斷、自動(dòng)駕駛、智能安防等。
在單體智能持續(xù)優(yōu)化的同時(shí),還可以想象的是,未來(lái)的AI Agent或許也能夠突破單機(jī)運(yùn)作模式,通過(guò)協(xié)同機(jī)制重構(gòu)復(fù)雜任務(wù)處理與決策鏈條。
這種多智能體系統(tǒng)(MAS)通過(guò)角色定位機(jī)制,能夠使每個(gè)智能體如同專業(yè)化分工的人類團(tuán)隊(duì)。
舉例來(lái)說(shuō),在軟件開發(fā)的場(chǎng)景下,每個(gè)AI Agent都有自己的特長(zhǎng),有的擅長(zhǎng)編程,有的擅長(zhǎng)設(shè)計(jì),還有的專門檢查質(zhì)量,只要它們能很好的協(xié)作,就能一起完成一個(gè)高質(zhì)量的軟件項(xiàng)目。
此外,MAS系統(tǒng)還能模擬人類的決策過(guò)程,就像人遇到問(wèn)題時(shí)會(huì)找人商量一樣,多智能體也可以模擬集體決策的行為,這樣就能為用戶提供更好的信息支持,特別是在一些復(fù)雜的情況下。
比如遇到緊急情況,這些AI智能體就能幫用戶模擬所有可能的情形,及時(shí)提供有用的信息,讓用戶能更快更好的作出決定。
可以說(shuō),這種“類人”的智能范式,正在重構(gòu)生活、工作的成本結(jié)構(gòu)。而從Manus開始,似乎AI Agent已從概念驗(yàn)證階段,邁入規(guī)?;涞氐呐R界點(diǎn)。
巨頭競(jìng)速
AI Agent的熱潮并非偶然,而是技術(shù)演進(jìn)的必然產(chǎn)物。
早在2024年紅杉AI峰會(huì)上,吳恩達(dá)教授便預(yù)言“AI Agent是AI發(fā)展的下一個(gè)關(guān)鍵階段”。事實(shí)上,2024年期間,便有不少科技巨頭布局AI Agent。
如谷歌在2024年12月發(fā)布了其最新版大模型Gemini2.0系列,并介紹了多個(gè)智能體應(yīng)用,如ProjectAstra。微軟也在2024年10月和11月分別發(fā)布了多個(gè)面向銷售、運(yùn)營(yíng)等場(chǎng)景的AI智能體,并推出CopilotStudio平臺(tái)支持用戶構(gòu)建自主智能體。
進(jìn)入2025年,Manus的火熱,徹底帶動(dòng)了市場(chǎng)的情緒。
海外,OpenAI近期公布的商業(yè)化計(jì)劃進(jìn)一步印證AI Agent的B端潛力。其“博士水平”Agent針對(duì)科研與軟件開發(fā)場(chǎng)景,每月服務(wù)費(fèi)高達(dá)2萬(wàn)美元,覆蓋從基礎(chǔ)分析到復(fù)雜任務(wù)的全鏈條需求。
國(guó)內(nèi)方面,阿里千問(wèn)QwQ-32B模型中也集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過(guò)程。
另一方面,開源社區(qū)已出現(xiàn)OpenManus、OWL等新產(chǎn)品,基于Manus進(jìn)行復(fù)刻和創(chuàng)新,有望推動(dòng)Agent產(chǎn)品百花齊放。
資本市場(chǎng)的狂熱更加印證了這一趨勢(shì)。
Manus發(fā)布當(dāng)天,A股超150只AI智能體概念股漲停,立方控股、酷特智能等漲幅超20%。
來(lái)源:東方財(cái)富
此外,Manus發(fā)布后,券商PPT、分析師路演火速上線,不完全統(tǒng)計(jì)顯示,中金、華泰、招商、中泰等數(shù)十家券商研究所進(jìn)行了路演,其中有分析師上線了多場(chǎng)路演,路演內(nèi)容從技術(shù)原理、AI應(yīng)用、受益方向到落地場(chǎng)景、產(chǎn)業(yè)圈推演,內(nèi)容豐富。
當(dāng)然,在熱潮的背后,也有不同的聲音。不少業(yè)內(nèi)人士認(rèn)為,Manus屬于AI Agent初級(jí)的應(yīng)用,市場(chǎng)的反應(yīng)過(guò)大了。
事實(shí)也的確如此,AI會(huì)進(jìn)一步拉平信息差,大量收集信息、整理資料的工作可以交給AI,但真正距離生成投資決策,無(wú)疑還有很長(zhǎng)的路要走。
其中,最大的挑戰(zhàn)在于:AI幻覺(jué)的幽靈始終縈繞不去。
技術(shù)瓶頸
AI Agent的競(jìng)爭(zhēng),入口為王。
當(dāng)掌握更多用戶流量的廠商,有望實(shí)現(xiàn)“流量-數(shù)據(jù)-使用體驗(yàn)”的正向循環(huán),且隨著開源模型能力升級(jí)彌補(bǔ)大廠及中小廠技術(shù)代差,AI產(chǎn)品工程化能力,或拉開產(chǎn)品使用體驗(yàn)差距。
可盡管展現(xiàn)出巨大的潛力,但AI Agent的爆發(fā)仍面臨多重障礙。從商業(yè)模式到技術(shù)瓶頸,從法規(guī)缺失到用戶認(rèn)知,每個(gè)環(huán)節(jié)都在考驗(yàn)著行業(yè)的耐心。
首當(dāng)其沖的原因就在于,現(xiàn)有技術(shù)還無(wú)法有效地解決AI幻覺(jué)的問(wèn)題。
以當(dāng)紅的Manus來(lái)說(shuō),雖然在GAIA基準(zhǔn)測(cè)試中取得了優(yōu)異成績(jī),但在實(shí)際應(yīng)用中,仍存在一些不穩(wěn)定的情況。
GAIA基準(zhǔn)測(cè)試排名來(lái)源:ManusAIX平臺(tái)
有實(shí)測(cè)用戶反饋,在處理復(fù)雜任務(wù)時(shí),Manus偶爾會(huì)出現(xiàn)任務(wù)執(zhí)行失敗或結(jié)果不準(zhǔn)確的問(wèn)題。在進(jìn)行股*數(shù)據(jù)分析時(shí),Manus可能會(huì)因?yàn)閿?shù)據(jù)接口的臨時(shí)故障或數(shù)據(jù)格式的細(xì)微變化,導(dǎo)致分析結(jié)果出現(xiàn)偏差。
再以O(shè)penAI的GPT4.5來(lái)說(shuō),毫無(wú)疑問(wèn),這是目前最強(qiáng)的大語(yǔ)言模型。但在SimpleQA基準(zhǔn)測(cè)試中,GPT-4.5的準(zhǔn)確率為62.5%,幻覺(jué)率為7.1%,盡管這一成績(jī)要遠(yuǎn)優(yōu)于GPT-4o、OpenAIo1和o3-mini等模型,但是依然存在著相當(dāng)高的幻覺(jué)率。
而這種幻覺(jué),在金融、醫(yī)療等高風(fēng)險(xiǎn)領(lǐng)域,任何一點(diǎn)誤差,都可能引發(fā)系統(tǒng)性風(fēng)險(xiǎn)。
假設(shè)某醫(yī)療診斷Agent,其誤判罕見病案例的概率為3%,客若應(yīng)用于千萬(wàn)級(jí)用戶群體,那么潛在誤診人數(shù)將高達(dá)30萬(wàn)。
除了幻覺(jué),緊接著的是數(shù)據(jù)孤島與通用能力的矛盾。
AI Agent的效能高度依賴場(chǎng)景數(shù)據(jù),例如金融風(fēng)控需要實(shí)時(shí)交易數(shù)據(jù),而醫(yī)療診斷依賴患者病史庫(kù),數(shù)據(jù)割裂會(huì)導(dǎo)致通用型Agent難以跨領(lǐng)域遷移。
最后是倫理與監(jiān)管的滯后性。AI Agent的自主決策涉及隱私泄露、責(zé)任歸屬等倫理問(wèn)題,比如調(diào)用用戶健康數(shù)據(jù)、自動(dòng)駕駛事故等等,而全球監(jiān)管框架尚未成熟。
由此可見,AI Agent的破局路徑需從技術(shù)、生態(tài)與監(jiān)管三端協(xié)同推進(jìn)。而未來(lái),誰(shuí)能率先突破技術(shù)瓶頸并構(gòu)建合規(guī)生態(tài),毫無(wú)疑問(wèn),誰(shuí)就將主導(dǎo)這場(chǎng)智能體時(shí)代的“諾曼底登陸”。