用心打造
VPS知识分享网站

Nvidia希望利用GeForce RTX 50 GPU加速AI PC开发

Nvidia 发布了备受期待的台式机和笔记本电脑专用 GeForce RTX 50 GPU,其新 AI 数据中心芯片以相同的Blackwell 架构为核心,带来 PC 在图形、内容创作和生产力方面的进步。

在周一的 CES 2025 主题演讲中,Nvidia 将 GeForce RTX 50 系列称为“有史以来最强大”的消费级 GPU,并将其定位为游戏玩家的重大升级,并声称在使用新的 AI 驱动的 DLSS 4 图像升级功能时,它们的图形性能将比上一代快两倍。

Nvidia希望利用GeForce RTX 50 GPU加速AI PC开发

但这家人工智能计算巨头还希望通过一系列新的硬件和软件功能来吸引人工智能开发者和内容创作者。例如,据 Nvidia 称,GPU 系列的全新第五代 Tensor Cores 拥有“巨大的人工智能处理能力”,利用新支持的 4 位浮点 (FP4) 格式,以更少的图形内存以两倍的速度运行人工智能模型。

在台式机方面,旗舰 GPU 32 GB GeForce RTX 5090 将于 1 月 30 日上市,售价 1,999 美元,16 GB GeForce RTX 5080 售价 999 美元。16 GB GeForce RTX 5070 Ti 售价 749 美元,12 GB GeForce RTX 5070 售价 549 美元,将于 2 月上市。这些 GPU 可从 Nvidia 和附加板合作伙伴处购买,也可从 Falcon Northwest 和 Maingear 等系统制造商的台式机购买。

搭载 RTX 5090、RTX 5080 和 RTX 5070 Ti GPU 的笔记本电脑将于 3 月首次亮相,而搭载 RTX 5070 的笔记本电脑将于下个月由多家 OEM 推出,包括宏碁、华硕、戴尔科技、惠普公司、联想和 MSI。

Nvidia 承诺为 AI PC 开发提供“微服务流水线”

为了促进在新的 RTX 50 系列和其他最近几代 GeForce GPU 上开发 AI PC 应用程序,Nvidia 表示计划发布 Nvidia NIM 微服务和 Nvidia AI 蓝图的“管道”,这些管道使用第一方和第三方模型来实现从 PDF 提取、计算机视觉和语音到图像生成、大型语言模型和用于检索增强生成的嵌入式模型等用例。

这些模型包括 Nvidia 最新发布的 Llama Nemotron 系列模型,它们是 Meta 的 Llama 模型的版本,经过优化,可帮助开发代理 AI 用例,包括从指令遵循和聊天到编码和数学。

为了展示如何使用 NIM 构建 AI 代理和助手,Nvidia 计划发布一款支持视觉的 PC 化身,名为 Project R2X,它可以阅读和总结文档、获取信息并“协助桌面应用程序和视频会议通话”。它还可以连接到云 AI 服务,例如 OpenAI 的 GPT4o。

Nvidia 重点介绍内容创作增强功能

在内容创作方面,Nvidia 表示,新的 RTX 50 GPU 配备了新的硬件功能,可以在图像生成以及语音和视频通信的新软件功能的基础上增强视频编辑和 3-D 渲染工作负载。

对于视频编辑,Nvidia 表示 RTX 50 系列配备了新的视频编码器和解码器,实现了功能的“代际飞跃”,支持 4:2:2 专业级色彩格式、用于 3-D 和虚拟现实视频的 HEVC(高效视频编码)的多视图扩展以及新的 AV1 超高质量模式。

对于 3D 渲染,Nvidia 表示 GPU 配备了第四代 RT 核心,可使应用程序运行速度提高 40%。芯片加速 3D 渲染的一种方式是通过其第四代基于 AI 的图像升级技术 DLSS 4,该技术引入了多帧生成来提高帧速率。

对于图像生成,Nvidia 强调了 RTX 50 GPU 中新的 FP4 支持如何使用于此类目的的模型占用的 VRAM 比默认的 16 位浮点 (FP16) 格式少得多。

例如,该公司表示,Black Forest Labs 的 FLUX.1 [dev] 模型在 FP4 下仅需要不到 10 GB 的内存,这意味着它可以在四款新的 RTX 50 GPU 上运行,因为它们的 VRAM 范围为 32-12 GB。相比之下,使用 FP16 运行的 FLUX.1 [dev] 模型需要超过 23 GB 的内存,这将其限制在 RTX 4090 和上一代专业 GPU 上。

Nvidia 表示,它计划提供基于 FLUX.1 [dev] 的 NIM 微服务,该微服务将于下个月在 Nvidia AI Blueprint 中提供,用于 3-D 引导图像生成。

对于语音和视频通信,Nvidia 表示计划在 Nvidia Broadcast 应用程序中增加两个新功能,以实现 AI 增强的视频和语音效果。第一个功能是 Studio Voice,它将使用户的麦克风听起来像高品质麦克风,而第二个功能是 Virtual Key Light,它可以重新照亮“拍摄对象的脸部以提供均匀的覆盖”。这些功能将于 2 月上市,最初需要 RTX 4080 或更高版本。

RTX 50 系列与 40 系列的比较

RTX 50 系列的旗舰 GPU RTX 5090 由 920 亿个晶体管组成,比其前代产品 RTX 4090 的 760 亿个晶体管增加了 21%,RTX 4090 于 2022 年首次亮相,采用 Nvidia 上一代 Ada Lovelace 架构。

在整个 RTX 50 系列中,GPU 配备了新的第四代 RT 核心和第五代 Tensor 核心以及流式多处理器,据 Nvidia 称,“该处理器已更新,具有更高的处理吞吐量并与 Tensor 核心更紧密地集成,以优化神经着色器的性能”。

RTX 5090 配备 32 GB GDDR7 内存和 21,760 个 CUDA 核心,高于 RTX 4090 的 24 GB GDDR6X 内存和 16,385 个 CUDA 核心。GPU 的加速和基本时钟频率分别为 2.41GHz 和 2.01GHz,低于 RTX 4090 的 2.52GHz 和 2.23GHz 时钟速度。

性能方面,RTX 5090 的 Tensor Core 能够达到每秒 3,352 万亿次运算 (TOPS) 的 AI 计算性能,而 RT Core 可以达到每秒 318 万亿次浮点运算 (TFLOPS)。这些数字分别比 RTX 4090 的 Tensor Core 实现的 1,321 AI TOPS 和 GPU 的 RT Core 实现的 191 TFLOPS 快 2.5 倍和 60%。

在提供了上一代产品的 Shader Core 性能数据后,Nvidia 便再未公布 RTX 50 系列的 Shader Core 性能数据。

RTX 5090 所需的总图形功率为 575 瓦,比 RTX 4090 所需的 450 瓦高出 27%。最低端 GPU RTX 5070 需要 250 瓦,比 RTX 4070 所需的 200 瓦高出 25%。

赞(0)
未经允许不得转载;国外VPS测评网 » Nvidia希望利用GeForce RTX 50 GPU加速AI PC开发
分享到