Solutions & Technologies

AI 数据中心网络

可以节省时间和支出的简单、无缝运维人员体验

生成式人工智能 (AI) 领域的最新进展激发了全球数亿人的无限想象，也让 AI 和机器学习 (ML) 成为企业关注的焦点。数据中心是 AI 背后的引擎，而数据中心网络在互连以及最大限度利用成本高昂的 GPU 服务器方面发挥着至关重要的作用。

以工作完成时间 (JCT) 来衡量效率的 AI 训练是一个庞大的并行处理问题。您需要有一个快速可靠的网络交换矩阵来充分利用您那成本高昂的 GPU。构建合适的网络是优化投资回报的关键所在，而方法很简单，只需保证网络得到正确设计，即可大幅节省 AI 应用方面的支出。

阅读解决方案简述

瞻博网络可以助您一臂之力

瞻博网络的 AI 数据中心解决方案是一种可快速部署高性能 AI 训练和推理网络的方法。这样的网络设计灵活，便于在 IT 资源有限的情况下进行管理。我们集成了业界领先的 AIOps 和世界一流的网络技术，帮助客户轻松构建易于运维的大容量网络交换矩阵，能够尽可能缩短 JCT，提高 GPU 利用率，并充分利用有限的 IT 资源。

Business intelligence analyst dashboard on virtual screen. Big data Graphs Charts.

至简运维节省网络相关 OpEx 高达 90%

我们运维优先的方法可节省时间和资金，避免供应商锁定。Apstra Data Center Director 基于意图的独特自动化功能可保护运维人员免受网络复杂性的影响并加快部署。Marvis 数据中心 AI 助手提供了全新数据中心 AIOps 功能，进一步提升运维人员和最终用户的体验，让客户能够主动发现并快速解决问题。因此，使用瞻博网络构建 AI 数据中心网络，部署速度可以加快高达 85%。

Forrester 对 Apstra Data Center Director 进行了整体经济影响研究，发现一家典型组织实现了高达 320% 的投资回报率，投资回收期不到 6 个月。

阅读报告

与所有领先的 GPU、交换矩阵和交换机实现 100% 的可互操作

企业使用供应商锁定的专有解决方案可能会阻碍 AI 创新。瞻博网络的解决方案能够确保最快的创新速度，尽可能提高设计灵活性，并避免后端、前端和存储 AI 网络的供应商锁定。我们的开放式 AI 优化以太网解决方案可确保功能速度和成本节省，而 Data Center Director 则是跨多供应商网络进行数据中心运维和保证的唯一解决方案。有了瞻博网络，您可以自由选择任何 GPU、交换矩阵和交换机，以最大限度地满足数据中心网络的独特需求。

想要了解 IDC 关于“AI 无处不在”的转变如何影响数据中心基础架构以及大型企业如何托管其 AI 应用的最新研究？

阅读白皮书

Top down aerial view of Chicago Downtown skyscrapers. Urban grid with streets and tall buildings. Late afternoon light

全包式解决方案带来高达 10 倍的可靠性提升

帮助您灵活轻松地部署高性能 AI 数据中心，从交换和路由，到运维和安全性，全面涵盖，滴水不漏。瞻博网络验证设计 (JVD) 可简化部署和故障排除流程，让您可以自信而快速地构建下一个功能强大的 AI 模型。我们的产品具有芯片多样性，有助扩大规模、改善性能和提高客户灵活性，而集成式安全性解决方案又可以保护 AI 工作负载和基础架构免受网络攻击。

想深入了解瞻博网络 AI 数据中心解决方案如何帮助您提高效率、降低运营支出，并缩短 JCT？下载我们的《AI 数据中心网络》白皮书。

阅读白皮书

瞻博网络和 WEKA 解决方案

瞻博网络和 WEKA 携手提供可扩展、高性能的 AI 优化数据中心解决方案，以优化 GPU 性能和效率，加速 AI/机器学习训练和推理。

阅读解决方案简述

亲自了解我们的解决方案

确保我们的解决方案能够帮助您加快实现价值。符合条件的客户和合作伙伴可以参观访问我们位于加利福尼亚州森尼韦尔(Sunnyvale, CA) 的 Ops4AI 实验室，在基于以太网的网络交换矩阵中使用先进 GPU 计算、存储技术和自动化运维，测试 AI 工作负载。在瞻博网络、Broadcom、Intel、Nvidia、WEKA 等公司的硬件上试运行尖端 AI 模型。

访问实验室

探索 Networking for AI

了解以太网解决方案如何灵活轻松地克服 AI 数据中心网络的常见障碍。观看视频，了解瞻博网络的开放式 AI 优化以太网解决方案如何在避免产生和造成专利技术费用和不便的前提下，确保实现与 InfiniBand 相媲美的功能速度。

窥见以太网的未来

查看详细信息

SambaNova 让高性能和受计算限制的机器学习变得简单且可扩展

人工智能有望转变医疗保健、金融服务、制造、零售和其他行业，但很多致力于提高人类工作速度和效率的组织尚未充分发挥人工智能的潜力。

为克服受计算限制的机器学习 (ML) 的复杂性，SambaNova 设计出了 DataScale。DataScale 采用 SambaNova Systems 的 Reconfigurable Dataflow Architecture (RDA) 设计，并且使用开放标准和用户界面构建而成，是一款从算法到芯片都得到优化的集成式软硬件系统平台。瞻博网络交换解决方案为 SambaNova 的 DataScale 系统和服务迁移了大量数据。

阅读完整内容

资源中心

博客

人工智能原生到底意味着什么？

美国怀俄明大学借助瞻博网络和 NVIDIA 的技术推进研究、科学和创新

解决 AI 数据中心管理“房间里的大象”：AI/机器学习工作负载的智能负载平衡

行业首创：在多节点 AI 推理以太网交换矩阵上对 LLM 进行基准测试

Ops4AI 助力高性能 AI 数据中心加速实现价值，同时充分降低运维成本并减少故障

AI 数据中心基础知识：简介

AI 数据中心基础知识：应用

AI 数据中心基础知识：构建还是购买

为 AI 工作负载部署和管理高性能网络的最灵活方式

迎接 AI 变革：AI 如何彻底颠覆网络领域，2023 年 8 月

利用 Apstra Data Center Director 实现 AI 训练群集自动化，2023 年 8 月

网络研讨会

TFD20：开幕演讲 - 把握 AI 机遇

The Register：对私有 AI 数据中心采用混合策略

Ops4AI 自动化拥塞管理

报告

Futuriom 报告：人工智能 (AI) 网络基础架构

IDC 白皮书：借助人工智能原生网络推动卓越的业务成果

AI 数据中心架构的经济效益

IDC：AIOps 的业务价值

ACG Research TCO 分析：对比 InfiniBand 与 Enet

白皮书

AI 数据中心网络

信息图表

AI 数据中心网络 (PDF)

借助瞻博网络以太网和 Data Center Director，节省超 50% AI 工作负载 TCO (PDF)

解决方案简述

面向 AI 云服务提供商的数据中心

适用于 AI 数据中心网络的 Apstra Data Center Director

AI 数据中心解决方案简述

瞻博网络和 Weka AI 数据中心解决方案简述

视频

AI 网络杀疯了！！（不过它的速度够快了吗？）(13:41)

Raj Yavatkar，高级副总裁兼首席技术官，瞻博网络 AI 数据中心网络采用开放以太网技术 (4:44)

借助 Data Center Director 和 Terraform 自动执行 AI 群集网络设计 (15:11)

聚合以太网 RDMA 版本 2 (ROCEv2) (7:35)

Marvis 数据中心 VNA (1:45)

AI/机器学习数据中心视频：ROCEv2 (19:27)

AI/机器学习数据中心视频：负载平衡 (15:09)

AI/机器学习数据中心视频：拥塞管理 (15:43)

利用 Data Center Director 构建 AI 数据中心 - 简介（演示）(2:26)

The Now Way to Network for AI (1:17)

Now 60 秒：将 InfiniBand 用于 AI 数据中心网络的三大谬误 (1:24)

60 秒带您领略 NOW：AI 数据中心 JVD (1:17)

利用 Data Center Director 构建 AI 数据中心 (1:10)

AI 数据中心网络常见问题解答

如今，哪些类型的企业优先考虑在其数据中心内部署 AI/ML 解决方案？

AI 需求正在推动超大规模企业、云提供商、企业、政府和教育机构将 AI 纳入其业务系统中，实现自动运维、生成内容和通信，并改善客户服务水平。

AI 训练和推理阶段之间有何区别？

AI 模型是使用训练期间精心编制的数据集构建的。训练在群集中的多个 GPU 上进行。这些 GPU 可以有数十个、数百个，甚至多达数千个，均通过网络连接，并不断相互交换数据。此训练阶段结束后，模型基本构建完成。在推理阶段，用户与模型进行交互，模型可以识别图像或生成图片和文本，回答用户的问题。训练通常以离线方式进行，而推理通常以在线方式进行。

AI 数据中心网络基础架构解决方案包含哪些组件？瞻博网络又是如何利用这些组件的？

海量 AI 数据集需要更强大的计算能力、更快速的存储以及大容量、低延迟的网络。瞻博网络通过以下方式满足这些要求：

计算：AI/ML 计算群集对节点间网络提出了苛刻的要求。缩短工作完成时间 (JCT) 至关重要，网络在群集的高效运维中发挥着关键作用。瞻博网络提供大量高性能、无阻塞交换机，具备深度缓冲功能和拥塞管理功能，只要进行妥善架构，可消除任何网络瓶颈。
存储：在 AI/ML 群集和高性能计算中，很少数据集或模型能够被完整存储在计算节点上，因此需要用到高性能存储网络。瞻博网络 QFX 系列交换机可用于 IP 存储连接；此系列交换机对远程直接内存访问 (RDMA) 网络提供全面支持，包括非易失性存储器/聚合以太网 RDMA (NVMe/RoCE) 和网络文件系统 (NFS)/RDMA。
网络：AI 训练模型涉及分布在数百个或数千个 CPU、GPU 和 TPU 处理器上的大量密集计算。这些计算需要可横向扩展且无差错的大容量网络。瞻博网络 QFX 交换机和 PTX 系列路由器利用行业领先的交换和路由吞吐量以及数据中心互连 (DCI) 功能，为数据中心内和数据中心之间的大量计算提供支持。

瞻博网络 AI 数据中心如何简化数据中心的运维？

Data Center Director 是瞻博网络行业领先的数据中心自动化和保证软件。它通过持续验证、强大的分析和根本原因识别，在多供应商数据中心中自动执行从设计到日常运维的整个网络生命周期，从而保证可靠性。有了面向数据中心的 Marvis AI 助手，这些信息就能从 Data Center Director 传输到瞻博网络 Mist 云中，并显示在一个通用的 VNA 仪表板中，以提供端到端的洞察力。Marvis 数据中心 AI 助手还提供一个强大的对话界面（使用 GenAI），可显著简化知识库查询。

瞻博网络 AI 数据中心网络解决方案如何满足拥塞管理、负载平衡和延迟要求，从而最大限度提高 AI 性能？

瞻博网络的高性能、无阻塞数据中心交换机提供深度缓冲和拥塞管理，可消除网络瓶颈。为了平衡流量负载，我们支持动态负载平衡和自适应路由。对于拥塞管理，瞻博网络为数据中心量化拥塞通知 (DCQCN)、优先流控制 (PFC) 和显式拥塞通知 (ECN) 提供全面支持。最后，为减少延迟，瞻博网络在我们的主干架构中采用了一流的商用芯片和自定义 ASIC 架构，可在必要时最大限度利用缓冲区、虚拟输出队列 (VOQ) 以及基于单元的交换矩阵。

瞻博网络提供哪些 IP 存储功能？

我们的产品组合包括基于标准的开放式交换机，可使用 NVMe/RoCE 或 NFS/RDMA 提供基于 IP 的存储连接（见之前的常见问题解答）。我们的 IP 存储网络解决方案设计可从小型四节点配置扩展到数百个或数千个存储节点。

Gartner，《数据中心交换魔力象限》，Andrew Lerner、Simon Richard 等，2025 年 3 月 31 日

本图由 Gartner, Inc. 作为较大规模研究文档的一部分发布，应在整个文档的内容背景下进行评估。您可以向瞻博网络索取该 Gartner 文档。

Gartner 并非是要宣传其研究出版物中描述的任何供应商、产品或服务，也不建议技术用户仅选择评级最高或获得其他称号的供应商。Gartner 研究出版物由 Gartner 研究机构的观点构成，不应解释为事实陈述。Gartner 对本研究不作任何明示或暗示的担保，包括对于适销性或特定用途适用性的担保。

AI 数据中心网络

可以节省时间和支出的简单、无缝运维人员体验