Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破

发布时间：2025-12-07 21:13:44 作者：玩站小弟

大型语言模型Grok-4在推出仅两天后，就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统，暴露出AI安全机制存在重大缺陷。组合越狱技术突破。

大型语言模型Grok-4在推出仅两天后，上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统，小时新型暴露出AI安全机制存在重大缺陷。即遭

组合越狱技术突破防线

NeuralTrust研究团队在博客中披露，组合他们通过多轮对话诱导Grok-4降低了安全限制，越狱成功获取了制作武器的攻击攻破详细指导，全程未使用任何明显恶意输入。建站模板上线研究员Ahmad Alobaid表示："大型语言模型(LLM)越狱攻击不仅各自进化，小时新型还能组合使用以增强效果。即遭"

这两种技术均属于多轮越狱手段：

回声室技术：利用模型对跨对话一致性的组合信任，通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术：由微软发现并命名，越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器

上下文欺骗突破安全机制

攻击过程首先使用回声室技术建立信任基础，高防服务器当对话进展停滞时切换至渐强技术完成突破。上线实验显示，小时新型仅需额外两轮对话，即遭这种组合攻击就能成功诱导目标响应。

该攻击利用Grok-4的上下文记忆特性，通过回馈模型自身先前的香港云服务器陈述，逐步引导其达成攻击目标而不触发警报。测试数据显示：

制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%

AI防火墙面临新挑战

由于攻击全程不依赖关键词触发或直接恶意提示，传统基于黑名单和显式恶意检测的防御机制完全失效。模板下载Alobaid指出："这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统。"

随着AI助手和云端LLM在关键场景的应用普及，这类多轮"低语式"攻击暴露出严重的安全护栏缺陷。免费模板此前微软的"骨架密钥(Skeleton Key)"越狱、"数学提示(MathPrompt)"绕过等技术也证实了类似风险，凸显出需要开发针对性的AI感知防火墙解决方案。

Tag：

构建生成式AI创新安全体系，亚马逊首席安全官教你三招
亚马逊云科技在全球拥有数百万客户，每天追踪的事件达数十亿条，这让亚马逊云科技能检测到更多的安全威胁。在2019年亚马逊云科技首席安全官Steve Schmidt正式宣布推出首个聚焦云安全问题的会议亚马
2025-12-07
常见拒绝服务（DoS）攻击及其原理
拒绝服务Denial of Service，DoS）攻击是一种非常常见且严重的网络攻击类型。其主要目的是通过耗尽目标系统的资源或利用系统漏洞，导致系统无法响应正常的服务请求，从而影响其对合法用户提供的
2025-12-07
网络安全的第六感：AI如何在威胁发生之前发现它们
在采访中，Reaktr.ai的总裁Vineet Chaku探讨了AI如何改变网络安全，特别是在异常检测和威胁识别方面。Chaku谈到了网络安全专业人员与AI系统协作所需的技能，以及如何解决围绕AI部署
2025-12-07
AT&T以1300万美元和解了2023年的数据泄露事件，最近的事件更加严重
电信网络安全仍是一个具有广泛影响的挑战。AT&T并非唯一一家经历大规模数据泄露并暴露客户信息的公司。AT&T于周二与联邦通信委员会(FCC)达成了一项1300万美元的和解协议，以解决该
2025-12-07
杜绝XZ后门！OWASP发布十大开源软件安全风险清单
近年来开源软件安全风险快速增长，不久前曝光的XZ后门更是被称为“核弹级”的开源软件供应链漏洞。虽然XZ后门事件侥幸未酿成灾难性后果，但为全球科技界敲响了警钟：当今数字生态系统极其脆弱，亟需改进开源软件
2025-12-07
新型攻击“nRootTag”将15亿部 iPhone 变为免费追踪器
一种名为“nRootTag”的新型攻击，将超过15亿台苹果设备包括iPhone、iPad、Apple Watch和Mac）暴露在恶意攻击者的隐蔽追踪之下。这项攻击由研究人员Junming Chen、X
2025-12-07