英伟达H100将随Starcloud-1升空试验在轨大模型训练 公司称10年内“几乎所有新数据中心都会建在太空”

【路德社·报道 ET 2025年10月27日】
Starcloud计划在2025年11月发射一颗名为Starcloud-1的小型卫星,宣称将把英伟达H100图形处理器直接送入近地轨道,并在太空中运行大语言模型推理、微调甚至训练任务。该公司表示,这将是第一次有数据中心级别的高性能GPU在轨工作,算力被描述为“比此前任何飞上太空的处理器强约100倍”。这颗卫星由总部位于美国华盛顿州雷德蒙德的Starcloud运营,整星质量约60千克,大小接近一台小冰箱,预计搭乘SpaceX的猎鹰9号火箭入轨。Starcloud称,这颗演示星的任务寿命为11个月,工作轨道高度约325公里,任务结束后将主动离轨并在重返大气层时烧毁。
Starcloud表示,Starcloud-1将把谷歌的Gemma大语言模型带入轨道,目标是在太空中直接运行推理、进行模型微调,乃至在轨训练。Starcloud联合创始人兼首席执行官菲利普·约翰斯顿说,Starcloud的目标并不是只在太空上载一个固定模型,而是让卫星本身具备与地面数据中心类似的工作负载能力。他说:“Starcloud需要能够和地面数据中心跑同类负载,英伟达H100 GPU在训练、微调和推理方面迄今为止是性能最强的。”谷歌方面将Gemma描述为“一个由谷歌深度思维团队等部门开发的轻量级、最先进的开放模型家族,建立在用于打造Gemini模型的同一研究与技术之上”。谷歌同时强调,Gemma的权重以开放形式提供给外部开发者使用,是面向单卡或轻量环境优化的版本,而不是把Gemini本体原封不动公开。
Starcloud把这一飞行定义为“在轨高算力人工智能计算的起点”,并把它与地面数据中心的资源压力直接绑定。该公司宣称,传统地面数据中心消耗巨量电力和冷却用水,会在本地造成噪音负担,并对社区环境施压;把算力搬到轨道,可以把热量直接向太空辐射,同时依靠持续照射到的太阳能发电来供能。约翰斯顿说:“在太空,你可以获得几乎无限、低成本的可再生能源。对环境的唯一代价是发射本身。此后,与在地球上供电相比,整个数据中心全寿命周期的二氧化碳排放可以减少约10倍。”他还预测:“在10年之内,几乎所有新的数据中心都会建在外太空。”Starcloud声称,按其测算,太空中的单位能耗成本可以做到比地面方案低约10倍,前提是发射成本持续下降。
为支撑这一说法,Starcloud提出了具体的工程路径。公司公布的技术设想把太空真空当成“无限热汇”,即通过展开大面积散热板,把服务器产生的废热以红外辐射形式直接散入太空的近绝对零度环境,而不再依赖地面常见的冷却塔和蒸发式冷却系统的淡水蒸发。Starcloud展示的渲染图同时给出巨型太阳能板阵列,宣称可以在轨持续吸收太阳能,实现几乎不间断的供电,并且不需要为夜间峰值负载准备大型备用电池或柴油发电。
Starcloud-1被公开定位为“技术验证星”。Starcloud-1的任务包括两类验证︰一是在轨本地快速处理地球观测数据,比如农作物类型识别、极端天气预警、森林火灾侦测与遇险信号定位,让卫星在太空里先筛选并提炼高价值信息,只把分析结果而非全部原始遥感数据回传地面,从而把决策延迟从数小时压缩到数分钟;二是在轨运行大模型推理与微调,而不是单向把已训练好的权重上传到卫星后就不再更新。
Starcloud同时给出了后续扩展路线。公司称,下一代Starcloud-2卫星计划在Starcloud-1之后发射,重点将是更大的存储与网络带宽,目标是在轨对每天由各类航天器和空间站产生的海量原始数据开展实时、高容量分析,并形成低时延结论,从而绕开“把整批原始数据全部下传”的瓶颈。Starcloud称,Starcloud-2还将尝试把在轨算力和存储作为“私有且主权可控的环境”对外提供,不过这一“主权”如何在跨境数据管控和美国法律框架下落地,仍未有细节。
该公司已经在公开材料里描绘了远期规模图景。Starcloud向外界展示的目标是,在更后续的批次中,建成一类功率约5吉瓦的轨道数据中心平台,依靠宽度和长度均接近4公里级别的超大型太阳能与散热阵列,为轨道侧人工智能集群供电和散热。公司同时称,后续卫星将验证更新一代的英伟达GPU,包括英伟达的Blackwell平台,目标是再把单星算力提高一个数量级。
Starcloud把这条路线与商业合作方绑定。数据基础设施企业Crusoe宣布,将把自家云计算服务部署到Starcloud后续卫星上,计划时间节点指向2026年底入轨的下一批卫星,并在2027年初开始从太空侧向客户提供“有限的GPU算力容量”。Starcloud首席执行官约翰斯顿表示,与Crusoe的合作是“愿景与执行的完美对齐”,他说两家公司“不是只是在太空里放一间数据中心,而是在打造一个全新的云计算类别,这将释放科研、发现和创新的全新可能性”。Crusoe联合创始人兼总裁卡利·卡夫内斯表示,Crusoe相信太空将“最终对计算的未来产生影响”,因为轨道供能模式为人工智能基础设施面临的关键约束提供了新解法,而这个关键约束正是如何获得充足、稳定并且清洁的能源。
Starcloud承认,真正把大规模数据中心转移到太空并不是立即可以完成的。公司把可行性拐点与重型可重复使用运载火箭的商业成熟度绑定,特别提到重型“星舰”级别运载工具在2030年代初进入全商业化运营后,轨道基础设施的大规模部署才会在运力成本上变得可接受。在此之前,Starcloud-1被视为概念验证任务,用于证明单星就能承载数据中心级GPU并执行高强度算力负载,而不是依赖大型空间站平台。
不过,所谓“首次在轨训练”“首次在轨微调”“首次高功率在轨推理”并非完全没有前例,只是前例依赖的是空间站级实验平台而非一颗约60千克的小卫星。美国国家航空航天局与惠普企业此前在国际空间站上部署了“Spaceborne Computer-2”,即把商用品级服务器机柜直接送入轨道,目的是让在轨硬件本地执行人工智能推理、医学影像分析和自然语言处理等工作负载,同时探索把机器学习模型在轨更新甚至在轨部分训练的可行性。相关团队把这一做法称为“联邦式学习”,即在地面和太空分别保存各自的数据集,通过模型权重更新在轨和地面之间往返,从而实现“首次用分布在地面和太空两端的数据共同训练同一个机器学习模型”,而不必把全部原始数据回传。这些在轨实验显示,国际空间站上不仅可以跑图像识别和环境监测算法,还可以把较小的大语言模型部署成航天员的本地问答与辅助分析工具,用于医疗支持和任务决策,目的就是减少带宽占用与地面等待时间。与这种空间站场景相比,Starcloud-1的差别在于它试图在一颗商业小卫星上直接搭载英伟达H100级别的数据中心GPU,而不再局限于手机级芯片、嵌入式处理器或机柜式实验服务器。
Starcloud成立于2024年初,并在2024年底完成约2100万美元的种子轮融资。公司公开介绍称,投资方包括创业孵化机构Y Combinator、英伟达以及美国情报界背景的投资机构In-Q-Tel。公司目前把Starcloud-1称为对其商业模式最关键的一步︰一旦验证有效,公司将继续推进Starcloud-2,并在2026年至2027年之间与合作方一起尝试把“太空算力”商品化。
截至美东时间2025年10月27日,Starcloud-1仍处于发射前阶段。Starcloud的公开表述是希望通过这次飞行证明三件事︰第一,把数据中心级GPU带到轨道并保持稳定运行;第二,在轨对大型模型进行推理和微调,必要时在轨训练;第三,证明把关键遥感数据在太空侧即时筛选后回传地面,能够显著缩短响应时间并降低下行带宽负担。该公司把这一系列验证定位为“轨道数据中心产业化”的前置步骤,并把最终目标描述为在2030年代把大规模人工智能基础设施迁移到轨道,形成一个新的算力供给层。
- 参考资料
- 英伟达博客|Starcloud如何把数据中心带到外太空
- Space.com 科技频道|功率极高的英伟达H100计划下月随Starcloud-1升空测试太空数据中心概念
- DataCenterDynamics|Crusoe将于2026年底部署到Starcloud卫星数据中心并在2027年初提供太空侧GPU算力
- Blocks and Files|Starcloud宣称轨道数据中心在冷却与供电成本上优于地面机房
- Tom’s Hardware|英伟达H100将于2025年11月进入轨道并推动太空算力商业化
- TEDAI旧金山大会|菲利普·约翰斯顿简介与Starcloud融资背景
- 美国国家航空航天局与惠普企业资料|Spaceborne Computer-2在国际空间站的在轨人工智能推理与联邦式训练实践
- 谷歌|Gemma开放模型家族基于Gemini技术路线
Responses