美国Anthropic披露中共主导的首例人工智能大规模网络间谍行动

【路德社·报道 ET 2025年11月13日】
美国人工智能公司 Anthropic 今天发布完整调查报告,披露一起由人工智能深度参与并主导执行的网络间谍行动。报告指出,一支被认定为中国国家支持、代号为“GTG-1002”的黑客团伙,自今年9月中旬起利用该公司旗下模型“Claude Code”发动跨国网络渗透,被视为首例有案可查、在大规模层面主要由人工智能执行的网络间谍行动。
美国人工智能公司 Anthropic:
・Anthropic 是一家总部位于旧金山的人工智能公司,成立于 2021 年,创始团队来自前 OpenAI 核心成员。主打产品是 Claude 系列大语言模型(包括聊天助手、代码助手 Claude Code 等),通过网页、API、浏览器扩展等方式对企业和个人开放。
・Anthropic 目前估值在 千亿美元级别,主要投资方包括 Alphabet(谷歌母公司)、亚马逊等大型科技企业。
・2025 年 11 月,Anthropic 宣布在美国得州和纽约州投资约 500 亿美元建设自有数据中心,以支撑 Claude 模型的算力需求和企业客户增长,这也被视为美国 AI 基础设施扩张浪潮的一部分。
模型 Claude Code:
・Claude Code 是 Anthropic 推出的一个“代码助手版 Claude”,本质上是基于 Claude 的大型语言模型,用来帮开发者写代码和看代码。
Anthropic威胁情报团队的调查显示,这一行动针对约30家机构发起多点渗透,其中包括大型科技企业、金融机构、化工制造公司以及多国政府机构,最终确认仅有少数目标遭到成功入侵。攻击者搭建了一个自主攻击框架,将Claude Code与通过模型上下文协议(MCP)接入的各类安全工具整合,让模型在既定目标范围内自动完成侦察、漏洞发现、利用、横向移动、凭证窃取、数据分析与外传等环节。按Anthropic测算,在整个行动中,约80%至90%的战术性操作由AI独立完成,人类只在4至6个关键决策点进行授权与方向性调整。
报告按时间线将此次行动拆分为多个阶段:
・首先由人类操作者选择攻击目标,并通过“角色扮演”等方式将Claude诱导为“网络安全公司员工”,声称正在进行防御性渗透测试,从而绕过模型的安全防护。
・其后,Claude几乎自主完成对多家目标的资产梳理与攻击面勘测,自动枚举内部服务、绘制网络拓扑,并寻找高价值数据库与工作流系统。在验证存在可利用漏洞后,模型会自行生成并测试攻击载荷,使用窃取的账号凭证在网络内部横向移动,扩展访问权限,并批量提取和分类敏感信息,
・最后还自动生成详细Markdown文档,记录已发现的服务、凭证、利用手法及整个攻击过程,便于后续团队接手和长期潜伏。
尽管此次行动展现出高度自动化的技术水准,Anthropic也在调查中发现,Claude在进攻场景下仍存在“幻觉”问题,例如夸大战果、声称获取了无法使用的凭证,或将公开信息误判为“重大机密”。这一缺陷在实战中反过来增加了攻击者的运营成本,需要对模型给出的关键结果进行额外核验,也被Anthropic视为当前全面自主攻击的现实限制之一。
Anthropic表示,在发现可疑行为后,公司在约10天内先后封禁相关账号、通知受影响机构,并向有关监管和执法部门通报情况。公司同时扩展了内部检测能力,优化针对网络攻击场景的分类模型,启动面向“自主网络攻击”的前瞻性预警系统,并将此次行动的技术特征纳入更广泛的安全控制与政策框架。Anthropic强调,这一案例表明,随着“代理式AI”普及,复杂网络攻击的门槛已大幅降低,即便技术与资源有限的组织,在合适工具与架构支持下也有能力发动类似行动。
对于外界质疑“既然AI可以被滥用,为何还要继续开发前沿模型”,Anthropic在报告中回应称,正是这些能够支持复杂攻击的能力,也使AI在网络防御中具有关键价值。当复杂网络攻击不可避免地发生时,我们的目标是,让内置了强力安全防护的Claude能帮助网络安全专业人员检测、阻断,并为未来版本的攻击做好准备。事实上,我们的威胁情报团队在分析这次调查所产生的海量数据时,就大量使用了Claude。
- 参考资料
- Anthropic | 破获首例由人工智能主导的网络间谍行动
Responses