英伟达发布多模态“全能模型” 智能体效率跃升至竞品9倍

英伟达周二在官网发布了开放式多模态模型“Nemotron 3 Nano Omni”。英伟达称,新模型可以将多种功能整合到一个系统中,使智能体能够利用视频、音频、图像和文本的高级推理能力,提供更快、更智能的响应。英伟达声称, Nemotron 3 Nano Omni 以领先的准确性和低成本,为开放式多模态模型树立了新的效率标杆,在复杂文档智能、视频和音频理解方面,荣登六大排行榜榜首。根据新闻稿的说道,Nemotron 3 Nano Omni采用30B-A3B混合专家架构,将视觉和音频编码器集成于其中,无需单独的感知模型,从而显著提升了大规模推理效率。

—— 财联社
❤️ 26 👍 11 🥰 2 🤡 2 🤔 1
Top