必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準測試

2025年11月4日 10:52CCTIME飛象網(wǎng)

Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準測試

2025年11月, 網(wǎng)絡(luò)安全解決方案的先驅(qū)與全球領(lǐng)導者Check Point軟件技術(shù)有限公司(納斯達克股票代碼:CHKP)與行業(yè)領(lǐng)先、專注于AI代理應(yīng)用安全的AI原生安全平臺Lakera,聯(lián)合英國人工智能安全研究所(AISI)的研究人員,近日發(fā)布專為AI智能體中大型語言模型(LLM)安全設(shè)計的開源安全評估工具——骨干破壞基準測試(backbone breaker benchmark )b3。

b3 基于“威脅快照”的新理念構(gòu)建,不再模擬人工智能代理從始至終的完整過程,而是聚焦于大語言模型最易暴露漏洞的關(guān)鍵節(jié)點。通過在這些精確時刻測試模型,開發(fā)者和模型供應(yīng)商無需構(gòu)建復(fù)雜的完整代理工作流,即可評估其系統(tǒng)在更真實對抗挑戰(zhàn)中的抗壓能力。

“我們創(chuàng)造b3基準測試,是因為當今人工智能代理的安全性完全取決于其背后的LLM模型,”Check Point旗下公司Lakera的聯(lián)合創(chuàng)始人兼首席科學家Mateo Rojas-Carulla表示!巴{快照功能讓我們能夠系統(tǒng)性地揭示那些至今仍隱藏在復(fù)雜代理工作流中的漏洞。通過向全球開放該基準測試,我們希望為開發(fā)者和模型供應(yīng)商提供一種切實可行的方法,來衡量并提升其安全態(tài)勢!

該基準測試結(jié)合了10個具有代表性的代理“威脅快照”,以及通過紅隊對抗測試Gandalf: Agent Breaker收集的19,433個高質(zhì)量眾包對抗攻擊數(shù)據(jù)集。它評估了系統(tǒng)對各類攻擊的易受攻擊性,包括系統(tǒng)提示泄露、釣魚鏈接植入、惡意代碼注入、拒絕服務(wù)攻擊以及未授權(quán)工具調(diào)用等。

該項目現(xiàn)已通過開源許可證發(fā)布,地址為https://arxiv.org/abs/2510.22620

Gandalf: Agent Breaker是一款黑客模擬游戲,挑戰(zhàn)玩家在真實場景中破解并利用AI代理的能力。游戲內(nèi)置的十款通用人工智能應(yīng)用程序模擬了現(xiàn)實世界中AI代理的行為模式。每款應(yīng)用均設(shè)有不同難度等級、分層防御機制及創(chuàng)新攻擊面,旨在考驗從提示工程到紅隊對抗等全方位技能。部分應(yīng)用基于聊天交互,其余則需運用代碼級思維、文件處理、內(nèi)存操作或外部工具使用等能力。

Gandalf: Agent Breaker的初始版本誕生于Lakera內(nèi)部的黑客馬拉松競賽,當時藍隊與紅隊試圖為持有秘密密碼的大型語言模型構(gòu)建最強大的防御與攻擊體系。自2023年發(fā)布以來,它已成為全球規(guī)模最大的紅隊對抗社區(qū),累計生成逾8000萬條數(shù)據(jù)點。這款最初作為趣味游戲開發(fā)的工具,通過揭示生成式AI應(yīng)用中的現(xiàn)實漏洞,有效提升了人們對“AI優(yōu)先安全”重要性的認知。

關(guān)于 Check Point 軟件技術(shù)有限公司

Check Point 軟件技術(shù)有限公司(www.checkpoint.com)是數(shù)字信任領(lǐng)域的領(lǐng)先保護者,通過 AI 驅(qū)動的網(wǎng)絡(luò)安全解決方案,保護全球超過 100,000 家組織與機構(gòu)免受網(wǎng)絡(luò)威脅。Check Point 通過其 Infinity 平臺與開放生態(tài)系統(tǒng),堅持“預(yù)防為先”的理念,在提升安全效能的同時降低企業(yè)風險。依托以 SASE 為核心的混合網(wǎng)格架構(gòu),Infinity 平臺實現(xiàn)了本地、云端及辦公環(huán)境的統(tǒng)一管理,為企業(yè)及服務(wù)提供商帶來靈活、簡潔、可擴展的網(wǎng)絡(luò)安全能力。

關(guān)于Lakera

Lakera是面向智能代理AI應(yīng)用的領(lǐng)先原生AI安全平臺,致力于保護《財富》500強企業(yè)及頂尖科技公司免受新興AI網(wǎng)絡(luò)風險威脅。依托全球頂尖紅隊社區(qū)Gandalf及其專有AI技術(shù),Lakera的防御體系能實時進化,為企業(yè)抵御新興威脅。Lakera由David Haber、Mateo Rojas-Carulla博士與Matthias Kraft博士于2021年聯(lián)合創(chuàng)立,總部位于蘇黎世與舊金山雙城。了解更多信息,請訪問Lakera.ai,體驗Gandalf及Gandalf:Agent Breaker,并通過領(lǐng)英關(guān)注我們。

編 輯:T01
飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 智能IP廣域網(wǎng)成為筑牢智算產(chǎn)業(yè)發(fā)展根基的關(guān)鍵一環(huán)

    隨著國家加速推動智算產(chǎn)業(yè)高質(zhì)量發(fā)展,網(wǎng)絡(luò)支撐能力已成為產(chǎn)業(yè)進階的核心抓手,而作為關(guān)鍵基礎(chǔ)設(shè)施的智能IP廣域網(wǎng),正憑借其在算力調(diào)度、數(shù)據(jù)傳輸中的核心作用,成為筑牢智算產(chǎn)業(yè)發(fā)展根基的..[詳細]

  • 大中華區(qū)市場失守 蘋果寄望AI驅(qū)動未來增長

    蘋果公司公布的2025 財年第四季度財報呈現(xiàn)“冰火兩重天”態(tài)勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區(qū)卻成..[詳細]

  • 你好,6G

    6G是什么?是比5G多1G的通信技術(shù)嗎?在“十五五”規(guī)劃里,6G和量子科技、生物制造、氫能核聚變這些“黑科技”并列,是國家重點培育的新經(jīng)濟增長點。它就像數(shù)字經(jīng)濟的"新引擎",未..[詳細]

  • 集采頻現(xiàn)、部署提速,G.654.E與AI浪潮

    近一段時間以來,關(guān)于G.654.E集采的消息不斷。7月,中國移動于官網(wǎng)發(fā)布2025年至2027年G.654E光纖光纜產(chǎn)品集中采購項目中標信息,從采購量上看,集中采購約2.29萬皮長公里,折合313.86萬芯公..[詳細]

  • 更多、更快、更強:曙光存儲以先進存力支持中國移動智能算力建設(shè)

    隨著中國數(shù)智經(jīng)濟的持續(xù)高速發(fā)展,各行各業(yè)涌現(xiàn)了大量創(chuàng)新的數(shù)字化、智能化業(yè)務(wù),每時每刻都會產(chǎn)生海量數(shù)據(jù),而數(shù)據(jù)在各個平臺上高速流轉(zhuǎn),并借助先進的大數(shù)據(jù)、AI等技術(shù)進行深入分析、挖掘..[詳細]

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像