选择你喜欢的标签
我们会为你匹配适合你的网址导航

    确认 跳过

    跳过将删除所有初始化信息

    您的位置:0XUCN > 资讯 > 智能
    新闻分类

    Cosmos 3 – 英伟达开源的全模态物理 AI 基础大模型

    智能 PRO 作者:黑魔仙 2026-06-01 21:45

    Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型,采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。模型可原生理解并生成文本、图像、视频、音效及动作内容,物理仿真精度业界领先。英伟达同步发起 Cosmos Coalition 联盟,成员包括 Runway、Black Forest Labs 等,共同推动下一代世界模型发展。Cosmos 3 Super 与 Nano 版本现已上线,Edge 版即将推出。

    Cosmos 3的主要功能

    • 全模态原生理解与生成:统一处理文本、图像、视频、环境音效及动作轨迹,无需独立模块拼接。
    • 物理世界仿真:作为世界模型模拟物理环境,预测场景未来状态,支撑模型训练与评估。
    • 动作策略生成:辅助训练机器人及自动驾驶系统完成特定任务的动作轨迹规划。
    • 多模态视觉推理:跨模态理解物体交互、运动规律及时空关联关系。
    • 合成数据生成:基于物理精度生成高质量训练数据,降低真实数据采集成本。

    Cosmos 3的技术原理

    • 混合 Transformer 架构(Mixture-of-Transformers):Cosmos 3 将推理 Transformer 与专精生成 Transformer 相结合。模型首先解析物体交互、运动规律及时空关联关系,理解物理世界的底层逻辑,再基于此完成视频生成与动作轨迹预测。这种架构设计使得模型在推理与生成之间形成闭环,确保输出内容符合物理规律。
    • 海量多模态物理 AI 数据集训练:模型基于数十亿条涵盖文本、图像、视频、音效及动作轨迹的样本进行训练,构建起对物理世界的深度理解,使开发者能用更少数据和更低成本搭建物理 AI 系统。

    如何使用Cosmos 3

    • 访问平台:访问 https://www.nvidia.com/en-us/ai/cosmos/,体验 Cosmos 3 功能。
    • 获取模型:从 Hugging Face 下载开源模型权重。
    • 定制开发:用 Hugging Face Diffusers 及 GitHub 资源定制模型、生成合成数据。
    • 部署推理:通过 NVIDIA NIM 微服务部署模型,或选择 Baseten、CoreWeave、Microsoft Azure 等云合作伙伴加速推理。

    Cosmos 3的核心优势

    • 全开源:模型权重与架构完全开放,可自由定制与二次训练。
    • 物理精度领先:在 Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench 等世界生成基准中开源模型排名第一。
    • 训练效率提升:将物理 AI 训练与评估周期从数月压缩至数日。
    • 三合一能力:同时具备视觉语言模型、世界模型、世界动作模型主干网络三重角色。
    • 产业联盟支持:Cosmos Coalition 汇聚全球顶尖 AI 实验室与机器人企业共建生态。

    Cosmos 3的项目地址

    • 项目官网:https://www.nvidia.com/en-us/ai/cosmos/
    • HuggingFace模型库:https://huggingface.co/collections/nvidia/cosmos3

    Cosmos 3的同类竞品对比

    维度Cosmos 3Google Gemini 2.5 Pro
    开源性全开源(模型权重+架构)闭源 API
    模态覆盖文本/图像/视频/音效/动作文本/图像/音频/视频
    物理 AI 专注专为物理世界仿真与动作生成设计通用多模态大模型
    动作生成原生支持机器人/自动驾驶动作轨迹不支持原生动作输出
    物理精度基准Physics-IQ、PAI-Bench 开源第一未专门针对物理 AI 评测
    训练数据数十亿条物理 AI 多模态数据通用互联网数据为主
    部署方式NIM 微服务/云合作伙伴/本地Vertex AI API
    生态联盟Cosmos Coalition(Runway、BFL 等)Google 自有生态

    Cosmos 3的应用场景

    • 机器人训练:为工业机器人、人形机器人提供世界模型仿真与动作策略预训练。
    • 自动驾驶开发:模拟复杂交通场景,生成 corner case 训练数据,加速 AV 模型迭代。
    • 视觉 AI 智能体:赋能工业检测、智能安防、仓储管理等场景的感知-推理-决策闭环。
    • 合成数据工厂:替代昂贵的真实世界数据采集,批量生成带物理一致性的训练样本。
    • 物理世界研究:为学术机构提供开放基础模型,推动具身智能与世界模型理论研究。

    超好看的资讯你懂得 >>> 点击进入

    0XU.CN

    [超站]友情链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

    图库
    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接
    热门AI排行
    排名 热点 热门指数