美国Anthropic披露中共主导的首例人工智能大规模网络间谍行动

【路德社·报道 ET 2025年11月13日】

美国人工智能公司 Anthropic 今天发布完整调查报告，披露一起由人工智能深度参与并主导执行的网络间谍行动。报告指出，一支被认定为中国国家支持、代号为“GTG-1002”的黑客团伙，自今年9月中旬起利用该公司旗下模型“Claude Code”发动跨国网络渗透，被视为首例有案可查、在大规模层面主要由人工智能执行的网络间谍行动。

美国人工智能公司 Anthropic：
・Anthropic 是一家总部位于旧金山的人工智能公司，成立于 2021 年，创始团队来自前 OpenAI 核心成员。主打产品是 Claude 系列大语言模型（包括聊天助手、代码助手 Claude Code 等），通过网页、API、浏览器扩展等方式对企业和个人开放。
・Anthropic 目前估值在 千亿美元级别，主要投资方包括 Alphabet（谷歌母公司）、亚马逊等大型科技企业。
・2025 年 11 月，Anthropic 宣布在美国得州和纽约州投资约 500 亿美元建设自有数据中心，以支撑 Claude 模型的算力需求和企业客户增长，这也被视为美国 AI 基础设施扩张浪潮的一部分。

模型 Claude Code：
・Claude Code 是 Anthropic 推出的一个“代码助手版 Claude”，本质上是基于 Claude 的大型语言模型，用来帮开发者写代码和看代码。

Anthropic威胁情报团队的调查显示，这一行动针对约30家机构发起多点渗透，其中包括大型科技企业、金融机构、化工制造公司以及多国政府机构，最终确认仅有少数目标遭到成功入侵。攻击者搭建了一个自主攻击框架，将Claude Code与通过模型上下文协议（MCP）接入的各类安全工具整合，让模型在既定目标范围内自动完成侦察、漏洞发现、利用、横向移动、凭证窃取、数据分析与外传等环节。按Anthropic测算，在整个行动中，约80％至90％的战术性操作由AI独立完成，人类只在4至6个关键决策点进行授权与方向性调整。

报告按时间线将此次行动拆分为多个阶段：
・首先由人类操作者选择攻击目标，并通过“角色扮演”等方式将Claude诱导为“网络安全公司员工”，声称正在进行防御性渗透测试，从而绕过模型的安全防护。
・其后，Claude几乎自主完成对多家目标的资产梳理与攻击面勘测，自动枚举内部服务、绘制网络拓扑，并寻找高价值数据库与工作流系统。在验证存在可利用漏洞后，模型会自行生成并测试攻击载荷，使用窃取的账号凭证在网络内部横向移动，扩展访问权限，并批量提取和分类敏感信息，
・最后还自动生成详细Markdown文档，记录已发现的服务、凭证、利用手法及整个攻击过程，便于后续团队接手和长期潜伏。

尽管此次行动展现出高度自动化的技术水准，Anthropic也在调查中发现，Claude在进攻场景下仍存在“幻觉”问题，例如夸大战果、声称获取了无法使用的凭证，或将公开信息误判为“重大机密”。这一缺陷在实战中反过来增加了攻击者的运营成本，需要对模型给出的关键结果进行额外核验，也被Anthropic视为当前全面自主攻击的现实限制之一。

Anthropic表示，在发现可疑行为后，公司在约10天内先后封禁相关账号、通知受影响机构，并向有关监管和执法部门通报情况。公司同时扩展了内部检测能力，优化针对网络攻击场景的分类模型，启动面向“自主网络攻击”的前瞻性预警系统，并将此次行动的技术特征纳入更广泛的安全控制与政策框架。Anthropic强调，这一案例表明，随着“代理式AI”普及，复杂网络攻击的门槛已大幅降低，即便技术与资源有限的组织，在合适工具与架构支持下也有能力发动类似行动。

对于外界质疑“既然AI可以被滥用，为何还要继续开发前沿模型”，Anthropic在报告中回应称，正是这些能够支持复杂攻击的能力，也使AI在网络防御中具有关键价值。当复杂网络攻击不可避免地发生时，我们的目标是，让内置了强力安全防护的Claude能帮助网络安全专业人员检测、阻断，并为未来版本的攻击做好准备。事实上，我们的威胁情报团队在分析这次调查所产生的海量数据时，就大量使用了Claude。

参考资料
- Anthropic | 破获首例由人工智能主导的网络间谍行动

【路德社·报道 ET 2025年11月13日】

Related Articles

Responses