专业编程教程与实战项目分享平台

网站首页 > 技术文章 正文

Oracle公司已全面投入使用 65000+ GPU超级集群

ins518 2025-07-09 12:59:17 技术文章 2 ℃ 0 评论

据DCD 11月21日报道,配备英伟达 H200 图形处理器(GPU)的Oracle云基础设施(OCI)超级集群现已全面可用。

超级集群可扩展至多达65536个Nvidia H200 GPU,并提供高达260 exaflops 的峰值 FP8 性能。Oracle声称它是云中最大的 AI 超级计算机。

据Oracle介绍,超级集群内的每个Compute实例的高带宽内存比 H100 实例多76%,内存带宽多40%,因此其 LLM 推理性能提高了1.9倍。

超级集群拥有一个定制设计的集群网络,它基于Nvidia ConnectX - 7 网络接口卡(NIC),采用融合以太网版本2之上的远程直接内存访问(RDMA over Converged Ethernet Version 2,即 RoCE v2)技术,能够实现高达400 Gbps 的 GPU 到GPU 互联。

它还配备了一个升级后的 200 Gbps前端网络,以便能更高效地在存储设备和 GPU 之间传输大型数据集。

(编译:萧尧)

链接:

https://www.datacenterdynamics.com/en/news/oracles-65000-gpu-supercluster-now-generally-available/

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表