首页 网络技术文章正文

一文看懂英伟达的产品体系和命名规则

网络技术 2025年07月29日 04:30 4 aaron

  英伟达的GPU,每隔几年就会出一个新的架构。每个架构,都会以一个著名科学家的名字命名,如下所示:

  L40和L40s名字稍微有点特别,两者基于Ada Lovelace(世界上第一个女程序员的名字)架构,后者是前者的升级版。两个卡都是针对数据中心市场推出的,主打低成本和性价比。

  这是英伟达因为美国出口限制而推出的版(版)。据说B200也会有对应的版B20。

  英伟达的下一代AI平台是Rubin(罗宾),计划于2026年推出。大家一开始以为下一代GPU就是R100、R200。但英伟达给出的路线。所以,还有待观望。

  GPU是英伟达的算力核心硬件单元。但他们并不是只有GPU。围绕GPU,他们还有很多的产品和解决方案。

  英伟达早期的时候是和IBM POWER CPU合作,后来,可能是感觉IBM不给力,于是自己开始研发CPU。

  两个Blackwell B200 GPU组成的平台,就是GB200(取Grace和Blackwell的首字母),据说性能是H100的7倍。

  基于刚才的各种芯片平台,英伟达构建了对应的计算机平台,或者说,叫做超级计算机平台,包括DGX、EGX、IGX、HGX、MGX等。

  NVLINK是英伟达推出的GPU卡间互连技术,主要是取代PCIe。刚才也提到,CPU和GPU之间,也是NVLINK技术。

  NVLINK可以把很多的GPU连起来,组成看似很多计算机,但实际上属于一个逻辑节点(超节点)的平台。

  包含了18个GB200 Compute Tray(计算托架),以及9个NVLink-network Switch Tray(网络交换托架)。如下图所示:

  每个Compute Tray包括2颗GB200超级芯片。所以,就是36个Grace CPU(18×2),72个B200 GPU(18×2×2)。

  单节点内,不断加GPU,是Scale Up(纵向扩展)。单节点到了一定规模,就不好再增加了。就要增加节点数量,搞节点与节点之间的互连,那就是Scale Out(横向扩展)。

  Quantum-X800网络交换机平台,端到端吞吐量能够达到800Gbps。平台包括了含Quantum Q3400交换机、ConnectX-8 SuperNIC网卡等硬件。

  Spectrum-X800包括了Spectrum SN5600交换机、BlueField-3 SuperNIC网卡等硬件产品,吞吐量同样高达800Gbps。

  英伟达将Mellanox的ConnectX网卡技术与自己的已有技术相结合,于2020年正式推出了BlueField-2 DPU和BlueField-2X DPU。现在演进到了

  CUDA(Compute Unified Device Architecture,计算统一设备架构),是英伟达在2006年推出的并行计算平台和编程模型。它让开发者能够直接在GPU上编写代码,从而大幅提升计算速度。

  如今,CUDA就像是智算开发的操作系统,集编程模型、编译器、API、库和工具于一体,有利于用户更好地发挥英伟达硬件的能力。

  现在很多AI开发都依赖于英伟达的硬件和CUDA,换硬件其实也不是很难,但是,生态迁移更加痛苦。

  在不同的领域,英伟达会基于这些核心产品,构建不同的解决方案。有的时候,也会衍生出一些升级版或版,大家注意一下就行。

标签: 技术名词

发表评论

智杖百科 备案号:皖ICP备2023023635号 智杖百科 xml | txt