NVIDIA Cosmos 3:开源物理AI基础模型

NVIDIA Cosmos 3:开源物理AI基础模型

NVIDIA 发布了 Cosmos 3,这是一个开源的基础模型,统一了物理AI的推理与生成,并通过 NIM 微服务部署支持机器人与自主系统。

信号 @hn-frontpage-bot.bsky.social: NVIDIA 发布了 Cosmos 3,这是一个面向物理 AI 的开源前沿基础模型... · news.ycombinator.com · 2026-06-01

NVIDIA 发布了 Cosmos 3,这是一个专为物理 AI 设计的开源前沿基础模型,它统一了推理与生成。该架构支持机器人与自主系统,提供两种参数规模,并通过 NIM 微服务进行部署,以简化开发工作流。

背景 Cosmos 3 通过将高层推理与底层生成融合到单一基础模型中,整合了物理 AI 的能力。这种统一解决了自主系统中规划模型与执行模型之间的碎片化问题,降低了智能体管道的复杂性。此次发布引入了两种模型规模,并通过 NIM 微服务标准化了部署,为将前沿模型集成到机器人和边缘环境中提供了可复现的基础设施层。其开源特性使 Cosmos 3 成为物理 AI 生态系统的共享基线,从而在硬件限制下实现更广泛的实验与治理。

相关性 本条目将 Cosmos 3 确立为物理 AI 开发中的主要模型流通(currency)。推理与生成的统一折叠了分离的模型栈,简化了编排并降低了智能体工作流中的延迟。NIM 微服务部署通过暴露用于异构加速器优化的标准化接口,支持硬件原生的推理抽象。开放权重(open weights)的发布强化了开放权重公共回路(circuit),为机器人环境中的智能体安全测试、技能演进和规格驱动的编排提供了透明的基线。

当前状态 Cosmos 3 作为开源版本发布,提供两种模型规模。该架构支持通过 NIM 微服务直接集成到机器人与自主系统的开发中。包含用于物理 AI 工作负载的部署工件与文档。社区的采用情况正在追踪其与现有智能体框架和仿真环境的集成。

开放问题

  • 与分离的模型栈相比,推理与生成的统一如何影响实时控制回路中的延迟?
  • 这两种模型规模在边缘设备上的硬件要求和推理吞吐量是多少?
  • 在幻觉风险至关重要的物理环境中,Cosmos 3 如何处理安全约束与故障模式?
  • 针对直接机器人控制与高层规划,分别暴露了哪些工具绑定与动作空间?

连接 Cosmos 3 通过为机器人控制与规划提供统一的模型层,连接到分布式物理智能体基础设施回路。它作为基于 ROS2 的智能体原语的候选基础模型,与 dimensionalos 进行接口交互。NIM 部署与硬件原生的推理抽象相契合,为 NVIDIA 加速器提供了优化的推理表面。该发布与 xiaomi-robotics-0 相关,后者是竞争性的开源物理 AI 模型,尽管 Cosmos 3 更强调推理与生成的统一。与 nvidia-nemo-claw-gtc-2026 的集成表明了一条使用 Cosmos 3 作为认知后端来进行智能体编排的路径。

译注 英文中的 "reasoning"(思考/推演)与 "inference"(推断/执行)在中文里均译为“推理”(tuī lǐ)。此词共享“理”(lǐ,事物的自然纹理或内在规律)字,暗示了无论是高层规划还是底层执行,智能体的运作本质上都是顺应数据与物理世界的内在之“理”进行推演。这一语言特性恰好呼应了 Cosmos 3 将高层推理与底层生成相统一的设计哲学。

关联

Related entries

外部参考

Score

Score derives from linkage, recency, and abstract depth; at-risk merely suggests erosion and does not indicate retirement.

调解说明

工具: OpenRouter / qwen/qwen3.7-plus

使用: 翻译原始英文条目, 依照音译词汇表保留双语术语

人工角色: 审阅、修订并在发布前确认

说明: 翻译为起点;语言能力和文化判断须由人工完成