美国能源部宣布部署“Discovery”与“Lux”两台主权级人工智能超级计算机 以公私协作加速算力与科研

【路德社·报道 ET 2025年10月27日】

美国能源部在2025年10月27日宣布将在橡树岭国家实验室(Oak Ridge National Laboratory,简称 ORNL)部署两台新一代人工智能超级计算机系统,代号分别为“Discovery”(意为“发现”)与“Lux”(拉丁语含义为“光”)。能源部将这两台系统定位为美国下一阶段的主权级人工智能基础设施,目标是扩大美国在人工智能(以下简称人工智能或 AI)和高性能计算(以下简称高性能计算或 HPC)上的领导地位,巩固国家安全,并推动官方称为“金标准科学”的科研模式进入下一阶段。美国能源部长克里斯·赖特表示:“想要在人工智能竞赛中取胜,必须建立全新的、具有创造性的合作伙伴关系,把美国科技界与科学界里最优秀的人才与产业力量整合到一起。”赖特称,川普政府把这称作一种“常识型算力合作模式”,并把“Lux”定义为这一模式的首个落地案例,同时把“Discovery”列为能源部竞争性采购流程的一部分。赖特说,这一模式的目标是“以前所未有的速度把全新算力上线,把共享创新直接转化为国家实力,并证明当公私部门协同建设时,美国就会保持领先”。

“Discovery”与“Lux”都由超威半导体公司(Advanced Micro Devices,简称 AMD,中文常称超威半导体)和惠普企业公司(Hewlett Packard Enterprise,简称 HPE,中文常称惠普企业)参与打造。能源部的公开描述将两台系统界定为“高性能人工智能计算平台”,任务是用人工智能直接驱动新的科研突破,包括能源体系、制造业、医疗健康与网络安全等优先方向,同时服务国家安全、产业竞争力与民生改善。官方强调,两套系统要在美国本土交付与运行,被视为“美国主权级人工智能基础设施”的核心组成部分,目的是确保关键科研计算和关键安全相关计算“不被他国算力卡脖子”。赖特在现场表态,这一轮投入的逻辑是“把共享创新直接转化为国家实力”。

“Lux”被设定为率先落地的集群系统,官方名称为“Lux 人工智能集群”。按计划,“Lux”将在2026年初部署于橡树岭国家实验室。“Lux”的任务,是在非常短的时间尺度内,扩大能源部的人工智能算力,并把算力优先投向被列为“国家关键优先事项”的问题。能源部将这些问题逐条点名为聚变能、裂变能、新型材料、量子技术、先进制造业与电网。这一表述的含义是,“Lux”并非一台单纯用于商业训练的机器,而是一个专门面向国家任务清单的人工智能工厂。苏姿丰,超威半导体董事长兼首席执行官,明确将“Lux”描述为“加速美国在关键科研优先事项上的进展”的平台。她说:“我们很自豪能与美国能源部和橡树岭国家实验室合作,扩展美国的人工智能基础设施。‘Lux’将加速美国在关键科研优先事项上的进展……这是公私合作在最佳状态下的一个典型范例。”现场表述还指出,这种模式被视为“把企业的资金、技术和建设速度,同联邦实验室的土地、许可与长期运维能力捆在一起”的范式,用意是把交付周期从传统的多年级别压缩到“几个月量级”。

“Lux”在技术实现上,将采用超威半导体最新一代的加速和互连组件。能源部介绍,“Lux”将使用 AMD Instinct MI355X 系列图形处理加速器(Instinct 为超威半导体的数据中心人工智能与高性能计算加速器产品线)、第五代 AMD EPYC 系列中央处理器(EPYC 为超威面向数据中心的高端服务器处理器系列,中文业内常称“霄龙”)、以及 AMD Pensando 高级网络互连技术(Pensando 是超威的可编程数据处理与网络加速架构)。这些元件将部署在惠普企业的 ProLiant Compute XD685 节点平台(ProLiant 为惠普企业的高端服务器品牌),并配套直接液冷散热与高带宽互连,以在高功率密度下保持能效。“Lux”同时会同甲骨文云基础设施(Oracle Cloud Infrastructure,简称 OCI,甲骨文公司的云计算与算力托管平台)进行一体化集成。能源部将这一整合描述为“为美国科研界交付一套安全、开放、高效的人工智能软件栈,支持大规模训练与分布式推理”。实验室方面补充称,这种设计意在让科研人员可以在实验室本地算力与云端环境之间进行无缝切换。

“Discovery”则被设定为橡树岭国家实验室的下一代旗舰超级计算机系统,属于长期主干平台。能源部公布的时间表显示,“Discovery”计划在2028年交付。官方说法是,“Discovery”在系统各个层面都将实现“显著高于现役的‘Frontier’系统”的性能。现役的“Frontier”(“Frontier”系统中文可意译为“前沿”)是橡树岭国家实验室当前的旗舰超级计算机,也是全球首台突破“百亿亿次级”运算门槛的超级计算机。所谓“百亿亿次级”,即所谓“Exascale 级”,指的是每秒执行约10 的 18 次方数量级计算的能力。橡树岭科研团队用过一个对比来说明这一级别的算力︰如果假设一个人类以“每秒做1次计算”的速度不停计算,那么“Frontier”在1秒内完成的计算量,已经超过这个人类即使把整个可观测宇宙的寿命全部拿来计算所能完成的总量。橡树岭的表述是,这样的速度“仍然不够”,美国“必须继续把前沿往前推”。

“Discovery”将基于惠普企业新一代的 HPE Cray Supercomputing GX5000 平台。Cray 是惠普企业旗下的高端超级计算机品牌。“GX5000”被描述为“面向人工智能时代打造的新一代超级计算架构”。能源部介绍,这一平台将由下一代 AMD EPYC 处理器(代号“Venice”)和 AMD Instinct MI430X 系列加速器协同驱动。这套系统还将配备 HPE Cray Supercomputing Storage Systems K3000 存储子系统。K3000 以分布式异步对象存储架构为核心,即所谓“DAOS”,中文解释为“分布式异步对象存储”。官方强调,K3000 被定位为“业内首个在工厂阶段就内置开源 DAOS 软件的标准化成品存储系统”。惠普企业首席执行官安东尼奥·内里表示:“当我们为橡树岭国家实验室建成‘Frontier’并把计算带入百亿亿次级,我们在超级计算历史上达到了一个顶点,那是美国的一个里程碑。我们现在要在这一领导力、这一公私合作的基础上,和美国能源部、橡树岭以及超威半导体一道,打造‘Discovery’与‘Lux’,把下一代科学发现与人工智能创新进一步加速。”他同时说:“这些新系统将推动科研生产力达到新的水平,使复杂模拟成为现实,并为主权级人工智能树立新的标准。”

苏姿丰称,“Discovery”代表的是“人工智能与高性能计算的又一次重大飞跃”,并将“推动新的突破,从而巩固美国在科学与能源领域的领导地位”。她把“Discovery”与“Lux”描述成“美国人工智能行动计划”的具体算力载体,强调这些机器的任务是在美国本土交付“安全的、主权级的人工智能基础设施”,并以此“加强美国的国家竞争力”。橡树岭国家实验室主任斯蒂芬·斯特里弗表示,国家实验室体系之所以适合扮演这个角色,有三点原因。第一,国家实验室可以围绕国家优先事项,集中并托管带有联邦战略属性的数据资源。第二,国家实验室在把人工智能应用到大规模科学与工程问题上的技术深度,已经在实战环境下被证明。第三,国家实验室已经展示了在关键任务环境中,以国家级规模交付软硬件系统的能力。斯特里弗说:“‘Discovery’和‘Lux’将以前所未有的速度和广度推动科学创新。橡树岭国家实验室在超级计算方面的领导地位,已经显著缩短了科研人员从‘发现问题’到‘拿到解决方案’所需的时间。随着‘Discovery’和‘Lux’的加入,高性能计算同人工智能的深度融合,将以加速的速度与规模催生突破。这对美国在全球竞争日益激烈的环境下保持领先,是必要条件。”

在科学用途层面,橡树岭方面列出多项具体目标。首先是核能许可与反应堆设计提速。橡树岭表示,美国核管理委员会(Nuclear Regulatory Commission,简称 NRC)目前在仅仅“确认一份核反应堆许可申请材料是否完整”这个受理环节,往往就需要大约12到18个月。实验室的设想是,把监管规则、许可条款等要素转化为可解释的人工智能模型,用以“显著加速连最初‘受理并确认材料完整’的环节”,并继续加速后续的技术审查流程。其次是下一代能源,也就是受控核聚变。实验室方面的表述是,人类已经知道如何点燃等离子体,但“我们还不知道如何让它维持持续燃烧的等离子体”。他们强调,维持燃烧本质上是一个控制问题,而这正是人工智能可以直接介入求解的场景。“Lux”被视为先行平台,“Discovery”被视为后续放大平台,两者通过大规模建模与仿真来求解这一控制问题。第三是生物医学尺度的全系统模拟。实验室表示,现有的“Frontier”已经可以在分子层级模拟出“一整个细菌体内的每一个原子”,下一步目标是把尺度放大到整个人体,进而“真正理解疾病的起源、体内化学过程的运作方式,以及这些过程如何决定人类的新陈代谢和生存状态”。橡树岭方面把这一方向描述为“21世纪将成为健康科学的世纪,而能源部将在这一领域扮演角色”。第四是新材料设计。任务之一,是为聚变堆与裂变堆等高能环境开发全新材料体系。任务之二,是为信息处理本身寻找新材料,推动计算架构的下一次跃迁,包括开发抗误差能力更强的量子计算路径,从而突破当前量子计算在部署时的误差限制。实验室方面总结称:“我们今天在建的计算机,将帮助我们设计出下一代计算机。”

能源与供电能力被视为这组平台能否快速落地的关键约束。橡树岭方面将“Discovery”和“Lux”都描述为“百兆瓦级别的系统”。同时,实验室强调能效本身已经成为推动这类系统落地的决定性因素,直接液冷散热、高带宽互连、以及在架构层面压低能耗密度,都是被写进设计约束的必选项。橡树岭国家实验室表示,正在与田纳西河谷管理局(Tennessee Valley Authority,简称 TVA)合作解决供电保障。实验室给出的判断是:“算力问题与能源问题现在已经是同一个问题,我们必须把它们一起解决。”实验室还提出一个连锁目标,即“新一代反应堆反过来会为美国国内的人工智能革命提供电力”,这意味着核能设计验证与人工智能算力建设被当作同一闭环来处理。

能源部也强调,这一轮模式的最大变化不只是技术本身,而是交付机制本身的提速。赖特在发布会上复述了传统流程︰先走国会,要拨款,形成预算,再启动一轮冗长的采购招标,最后在多年周期里建设和交付。他表示这种老流程“太慢”。他描述了这次的新做法︰能源部直接联系企业高层,要求“把有创造力的方案直接拿来”。企业承诺先行出资和建设设备,并在数个月时间尺度内交付一台可运行的高端人工智能系统。政府方面则提供部署地点、运维保障与合规环境,同时约定按科研用途与商业用途划分算力使用权。赖特说,他告诉企业,“我们要开始动,我们要现在就动”,而企业的回应是“我们现在就造一台机器……我们会在几个月内把它建好”。赖特把这种做法称为“以商业速度建设国家关键基础设施”,并强调其目标是防止美国在人工智能发展上“被旧式政府节奏拖慢”。

赖特同时披露,能源部已把这一合作框架向整个国家实验室体系推广。他说,能源部系统内共有17个国家实验室。能源部向业界征询了哪些企业愿意在国家实验室园区和土地上部署高性能算力中心、能源配套与数据中心基础设施,收到大约500份回应,来自几乎所有在人工智能、数据中心、计算基础设施领域具有重量级地位的公司。赖特把这类回应称为“第一批中的第一例”,并表示后续还会有“更多类似项目”在其它实验室落地。他的说法是,这是一种“多赢”的安排。

橡树岭国家实验室强调,该实验室的高性能计算平台一直面向全国科研界开放,而并非只服务单一机构。实验室把这种开放渠道称为“用户设施”,即由能源部科学办公室出资建设、对全国科研人员开放申请的共享算力平台。橡树岭方面表示,“Lux”将首先为美国科研界的人工智能需求“填缺口”,因为现役旗舰机“Frontier”早已被预约满负荷运行,“我们现在实际上可以同时再用三台到四台这样的机器”。官方的定位是,“Lux”就是为了把缺口在近期填上,把人工智能算力“直接交到科学家手里”。而“Discovery”则是中长期的主干平台,负责把高性能数值模拟、人工智能训练与推理深度整合,并继续向量子计算验证与集成方向延伸,目标是在同一基础设施里实现融合架构,从而把科研、工程设计、许可审查、产业适配压缩到最短路径。

在治理层面,橡树岭国家实验室由 UT-巴特尔联合体(UT-Battelle)代表能源部科学办公室负责运营。能源部科学办公室被描述为“美国境内物理科学基础研究的最大单一资助方”。橡树岭也强调其“橡树岭领导级计算设施”在过去20年形成的记录。自2004年以来,该设施先后部署了7台旗舰超级计算机。在最近的4台主力机型中,“Jaguar”“Titan”“Summit”“Frontier”都曾在各自时代被公认为全球最快的系统。官方叙述称,“Discovery”是“Frontier”的直接继任者,而“Lux”则把人工智能直接前置到能源部的优先科研清单中,并以“公共科研+商业共建+快速交付”的模式快速上线。

从资金体量来看,能源部与多家企业围绕“Lux”和“Discovery”的投入合计预计超过10亿美元。多家行业媒体将这一笔合作称为“美国政府迄今在人工智能基础设施上最大规模的押注之一”,并指出这同时也是超威半导体在同英伟达竞争高端人工智能算力市场时,拿到的一笔关键政府级合同。部分行业媒体把“Lux”称为“美国首个专门用于科学与国家安全研究的人工智能工厂”,并强调该项目被业内解读为“直接对中共国人工智能能力发出的信号”,其意图是确保华盛顿持续在人工智能,尤其是与国家安全直接相关的人工智能能力上保持技术优势。


Related Articles

[Lude Press | Dr. Yan Talks ] New Jersey 200,000 SIM Card Case: The CCP’s Plot to Paralyze New York Communications Fails; Israeli Ironclad Evidence Exposes — Hamas and the Palestinian Ruling Authorities Are Two Faces of the Same System. 9/30/2025

Video link: https://www.youtube.com/live/pUcuu42B8Y0 01|Middle East Situation — Israeli Ironclad Evidence Exposed: Hamas and the Palestinian Ruling Authorities Are Two Masks of the Same System.(https://ludepress.com/featured/38514/)After President Trump…

谷歌公布量子计算机“量子回声”算法 速度超越超级计算机1.3万倍

谷歌宣布,其“Willow”超导量子芯片在《自然》发表的新研究中以新算法“Quantum Echoes(量子回声)”完成一次可验证的量子优势演示:在同一物理任务上,相比当前最强经典超算“Frontier”,量子机用时缩短约1.3万倍。该结果被同行评审收录,标志量子计算从“难以核验的炫技”迈向“可复现实证”的新阶段。

在轨人工智能散热成新战场 从韦布望远镜制冷技术到太空数据中心竞赛

随着人工智能算力和能耗快速攀升,“把数据中心送上太空”正在从概念走向真实项目。美国科技作者布赖恩·罗梅勒近期在社交平台提出设想,认为可以借鉴詹姆斯·韦布空间望远镜的低温制冷技术,为近地轨道的人工智能服务器降温,引发业界讨论。围绕这一设想,现实中的太空数据中心实验与技术路线分化也逐渐清晰。

Responses

Your email address will not be published. Required fields are marked *