NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展
NVIDIA 近日宣布对其开放模型系列进行了扩展,以支持代理式 AI、物理 AI 以及医疗 AI 的下一阶段发展。此次推出的模型包括 NVIDIA Nemotron 3 全模态理解模型、NVIDIA Isaac GR00T N1.7、NVIDIA Alpamayo 1.5 和 NVIDIA Cosmos 3,覆盖了从智能体交互到机器人推理,再到生物医学研究的多个领域。
多模态理解模型赋能 AI 智能体
NVIDIA Nemotron 3 是一款全模态理解模型,可为 AI 智能体提供自然对话、复杂推理和高级视觉能力。该模型系列还包括 Nemotron 3 Ultra、Nemotron 3 Omni 以及 Nemotron 3 VoiceChat。
- Nemotron 3 Ultra:基于 NVIDIA Blackwell 平台,采用 NVFP4 格式,可提高吞吐效率达 5 倍,支持编码助手、搜索和复杂工作流自动化。
- Nemotron 3 Omni:融合音频、视觉和语言处理能力,使 AI 能够从视频和文档中提取深度洞察。
- Nemotron 3 VoiceChat:支持实时语音交互,整合了自动语音识别、语言处理和语音合成功能。
- Nemotron Safety 模型和代理式检索管道:增强了多模态系统的安全性和输出质量。
LangChain 已将 Nemotron 模型集成至其 AI 智能体平台中,助力企业构建并部署大规模任务自动化解决方案。多家企业如 Automation Anywhere、CrowdStrike 和 ServiceNow 已开始使用 Nemotron 系列模型。Edison Scientific 也将其作为 Kosmos 系统的核心,实现科研自动化。
此外,NVIDIA 还发布了 Nemotron-Personas,这是一个基于人口统计的全合成数据集,由 NVIDIA 与 Pleias 共同开发。目前已有法国、美国、日本、印度、巴西和新加坡等版本。
物理 AI 推理模型加速自主系统开发
NVIDIA 通过推出新的基础模型和仿真工具,加速了机器人和自动驾驶系统的开发。
- NVIDIA Cosmos 3:作为统一的合成世界生成与物理 AI 推理模型,可支持复杂环境下的自主行为。
- NVIDIA Isaac GR00T N1.7:专为类人机器人打造的 VLA 模型,已具备商业化部署能力。
- NVIDIA Alpamayo 1.5:增强自动驾驶车辆的感知和导航能力,支持多摄像头系统与灵活的提示词输入。
在 GTC 主题演讲中,NVIDIA 联合创始人黄仁勋还介绍了下一代机器人基础模型 GR00T N2,该模型采用了全新的世界动作模型架构,相比现有 VLA 模型,其在新场景中执行新任务的成功率可提高两倍。预计该模型将于今年年底发布。
生物医学模型推动药物研发与生命科学
NVIDIA BioNeMo 正在扩展成为面向生命科学与医疗领域的开放 AI 平台。Proteina-Complexa 作为该平台的一部分,能够加速蛋白质结合剂的设计,从而加快结构导向的药物研发。
在与 DeepMind、EMBL 和首尔大学的合作下,NVIDIA 扩展了 AlphaFold 蛋白质结构数据库,新增约 3,000 万个蛋白质复合物结构预测,其中 170 万条为高置信度预测,有助于新药物靶点的发现。
NVIDIA 还推出了 nvQSP——一款 GPU 加速的临床模拟引擎。在基准测试中,其性能相比传统 CPU 模拟方式最高提升 77 倍,允许科学家在虚拟环境中测试多种剂量和患者亚组。
开放获取与部署渠道
NVIDIA 开源的模型、数据和框架已可通过 GitHub、Hugging Face、主流云平台以及 NVIDIA 官方渠道获取。部分模型还以 NVIDIA NIM™ 形式提供,可在任意 NVIDIA 加速基础设施上实现边缘到云端的安全部署。
开发者和研究人员可通过 NVIDIA 平台访问这些资源,并将其用于构建覆盖全球的 AI 应用。
观看 GTC 主题演讲 以了解更多相关内容。
关于 NVIDIA
NVIDIA(纳斯达克代码:NVDA)是全球 AI 与加速计算领域的领先企业,致力于推动智能技术在各个行业中的应用与创新。