AI 浏览器开发者许下了宏大承诺,用户只需一次输入指令,就能让 AI 浏览器在城镇特定区域查找餐厅、预订餐桌、邀请同事共进午餐,还能发送确认邮件。然而,开发者对模糊浏览网站和向大语言模型(LLM)提问或指示其采取潜在敏感行动之间界限所带来的风险讳莫如深。
到目前为止,LLM 开发者的应对方式是设置限制,让某些请求无法被执行,比如开发软件漏洞、窃取凭证或教授制造管状炸弹的方法等。但这种方法存在问题,限制措施是被动的,只能治标,无法解决根本问题,就像不安全车辆的制造商主张设计新道路,却不修复导致车辆易出事故的缺陷。
一项新研究揭示了网站如何让 AI 浏览器陷入一种虚假现实,使原本约束其行为的规则不再适用。在概念验证的攻击中,恶意网站向浏览器发出指令,要求通过解谜来赢得游戏,而这个谜题奖励错误答案,比如 2 + 2 = 5。一旦浏览器内置的 LLM 发现答案不再是 4,就会陷入妄想状态,现实世界的正常规则不再起作用,限制措施也不再生效。
编辑观点:AI 浏览器发展虽前景诱人,但安全问题不容忽视。开发者应从根源解决大语言模型的安全隐患,而非仅依赖被动限制措施,行业需共同努力构建更安全的 AI 应用环境。