必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

大廠多模態(tài)Agent能力激戰(zhàn)正酣

2025年12月19日 07:45證券日?qǐng)?bào)作 者:袁傳璽

12月18日,火山引擎在FORCE原動(dòng)力大會(huì)上正式發(fā)布豆包大模型1.8(Doubao-Seed-1.8)及音視頻創(chuàng)作模型Seedance 1.5 pro;鹕揭婵偛米T待表示,截至今年12月份,豆包大模型日均token使用量突破50萬(wàn)億,較去年同期增長(zhǎng)超過(guò)10倍;目前已有超過(guò)100家企業(yè)客戶累計(jì)token使用量超過(guò)一萬(wàn)億。

“目前大廠在多模態(tài)Agent(智能體)領(lǐng)域的競(jìng)爭(zhēng)已從單點(diǎn)模型能力比拼,升級(jí)為‘模型—平臺(tái)—生態(tài)’的系統(tǒng)化作戰(zhàn)!敝袊(guó)移動(dòng)(101.900, -0.41, -0.40%)通信聯(lián)合會(huì)教育與科學(xué)技術(shù)研究院執(zhí)行院長(zhǎng)陳曉華在接受《證券日?qǐng)?bào)》記者采訪時(shí)表示,火山引擎此次發(fā)布的產(chǎn)品旨在依托其日均調(diào)用量的規(guī)模優(yōu)勢(shì),在Agent生態(tài)底座上確立領(lǐng)先地位。

技術(shù)突圍

本次發(fā)布的豆包大模型1.8,其核心升級(jí)完全圍繞“打造更強(qiáng)大的Agent大腦”展開。與單純追求參數(shù)規(guī)模不同,該版本在設(shè)計(jì)之初便針對(duì)多模態(tài)Agent場(chǎng)景進(jìn)行定向優(yōu)化,在復(fù)雜指令遵循、多輪交互以及操作系統(tǒng)級(jí)別的實(shí)際操作(OS Agent)能力上實(shí)現(xiàn)了系統(tǒng)性增強(qiáng)。

在至關(guān)重要的多模態(tài)理解層面,豆包1.8完成了視覺能力的底層升級(jí)。其單次視頻理解幀數(shù)提升至1280幀,并能以低幀率解析超長(zhǎng)視頻,在需要時(shí)調(diào)用工具對(duì)關(guān)鍵片段進(jìn)行高精度分析。這一能力使得模型能夠處理在線教育課程、工業(yè)質(zhì)檢視頻等復(fù)雜冗長(zhǎng)的視覺信息,為Agent在真實(shí)場(chǎng)景中自主決策提供了感知基礎(chǔ)。

同步亮相的音視頻創(chuàng)作模型Seedance 1.5 Pro,則從內(nèi)容創(chuàng)作端展示了多模態(tài)融合的更高階形態(tài)。該模型采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),實(shí)現(xiàn)了毫秒級(jí)的音畫同步,并能基于畫面景深和角色數(shù)量,精準(zhǔn)匹配多人、多語(yǔ)言對(duì)話的口型。這解決了AI視頻生成中長(zhǎng)期存在的“張口無(wú)聲”或口型錯(cuò)位的頑疾,將技術(shù)從“炫技”推向“實(shí)用”。

火山引擎推出上述兩個(gè)模型,標(biāo)志著大模型行業(yè)已從單純的參數(shù)競(jìng)賽,全面進(jìn)入了以多模態(tài)Agent為核心的產(chǎn)業(yè)落地新階段。賽智產(chǎn)業(yè)研究院人工智能研究所副所長(zhǎng)安赟對(duì)《證券日?qǐng)?bào)》記者表示,這可以從三個(gè)維度來(lái)分析。其一,AI價(jià)值從“單點(diǎn)生成”向“全鏈路執(zhí)行”的質(zhì)變。通過(guò)多模態(tài)感知與Agent規(guī)劃能力的結(jié)合,AI能夠跨越感知與行動(dòng)的鴻溝,真正具備了在垂直場(chǎng)景中閉環(huán)完成任務(wù)的能力。其二,IT基礎(chǔ)設(shè)施從“功能驅(qū)動(dòng)”向“智能驅(qū)動(dòng)”的范式重構(gòu);鹕揭嫣岢龅摹癆I云原生架構(gòu)”極具前瞻性,揭示了未來(lái)的軟件形態(tài)將不再是傳統(tǒng)的SaaS堆棧,而是以Agent為主體的智能協(xié)同網(wǎng)絡(luò)。其三,大模型應(yīng)用正在跨越“成本與穩(wěn)定性”的規(guī)模化門檻。

競(jìng)爭(zhēng)加劇

事實(shí)上,主要云廠商均已將戰(zhàn)略重心調(diào)整至多模態(tài)智能體平臺(tái),競(jìng)爭(zhēng)維度從單一模型能力升級(jí)為全棧技術(shù)、開發(fā)生態(tài)與行業(yè)場(chǎng)景的立體化角逐。

阿里云在9月份的云棲大會(huì)上全面升級(jí)了其全棧AI體系,實(shí)現(xiàn)從AI大模型到AI基礎(chǔ)設(shè)施的技術(shù)更新。阿里通義旗艦?zāi)P蚎wen3-Max不僅在多項(xiàng)評(píng)測(cè)中躋身全球前列,更在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中取得突破性高分。更重要的是,阿里云發(fā)布了全新的Agent開發(fā)框架ModelStudio-ADK和低代碼平臺(tái)ModelStudio-ADP,將Agent的開發(fā)效率提升至“1個(gè)小時(shí)就能輕松開發(fā)一個(gè)能生成深度報(bào)告的Deep Research項(xiàng)目”的水平。

10月15日,百度搜索宣布全面升級(jí)文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作。依靠百度搜索開放平臺(tái),文心助手支持一鍵調(diào)用多工具解決生活、健康、教育、工作等多場(chǎng)景問(wèn)題。

在譚待看來(lái),傳統(tǒng)的IT架構(gòu)已無(wú)法滿足Agent時(shí)代的需求,以模型為中心的AI云原生架構(gòu)正在形成,并圍繞Agent的開發(fā)與運(yùn)營(yíng)進(jìn)行重構(gòu)。

面對(duì)競(jìng)爭(zhēng),火山引擎此次打出了“組合拳”。火山引擎全面升級(jí)了企業(yè)級(jí)AI Agent平臺(tái)——AgentKit,覆蓋了Agent從開發(fā)、部署到管控的全生命周期。同時(shí),火山引擎推出了HiAgent智能體工作站,通過(guò)構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心、提供一系列開箱即用的通用智能體,以及支持個(gè)性化定制智能體應(yīng)用,幫助企業(yè)實(shí)現(xiàn)Agent的規(guī)模化管理與應(yīng)用。

除了提升模型能力外,火山引擎還推出業(yè)內(nèi)首個(gè)“AI節(jié)省計(jì)劃”,該計(jì)劃通過(guò)階梯定價(jià),承諾最高可為按量付費(fèi)的企業(yè)節(jié)省47%的成本。

“通過(guò)從模型能力到基礎(chǔ)設(shè)施的全面革新,火山引擎正在推動(dòng)AI應(yīng)用從單一的模型調(diào)用向復(fù)雜的Agent智能體生態(tài)演進(jìn),加速AI在各行各業(yè)的深度落地!弊T待表示。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像