面向 AI 云服务提供商的数据中心

简单便捷,缩短上市时间

作为新云服务提供商或者其他 AI 云提供商,要抓住快速增长的企业 AI 云服务需求,就要明白如何充分利用高度分布式物理资产来为您带来巨大优势。您正处于独特的有利地位,可以提供符合法规和数据主权治理要求的个性化且灵敏的 AI 服务。

但是,上市时间压力、GPU 成本、高效利用 GPU 的挑战以及多租户 GPU 安全性都有可能让本已极具难度的 AI 部署变得更加复杂。您需要以自动化技术驱动的速度和内置安全性,来简化部署和缩短创收时间。

futuristic, background, technology, abstract, network, line, light, connection, communication, future. hi-end image background abstract wave colourful light for technology banner generate via AI.

AI 无极限:您的数据中心,您做主

详细了解推动 AI 多供应商生态系统增长的网络技术和数据中心解决方案。届时 AMD、瞻博网络、Broadcom 等公司的领导者将参加会议。

 

立即观看

瞻博网络可以助您一臂之力

瞻博网络面向 AI 云服务提供商的数据中心解决方案是快速部署高度优化、经济高效、基于云的多租户 AI 服务的最强大、最安全的方式。瞻博网络利用预定义 400G 和 800G AI 蓝图、AIOps零信任安全性以及 Apstra Data Center Director 自动化与 OpenShift 集成,为强大、灵活的自动化 AI 云服务数据中心简化部署和运维。

Diverse team of engineers looking at parameters in data center on tablet

快速部署,操作简单

将部署时间缩短高达 10 倍,并大幅缩短平均解决时间 (MTTR)。Apstra Data Center Director 唯一一个采用业界领先基于意图的网络和 AIOps 技术的多供应商数据中心自动化平台,可简化从第 0 天到第 2 天的运维。Data Center Director 与 Red Hat® OpenShift® 的全新集成,能够实现 Kubernetes 环境的 AI 网络配置自动化。

凭借交换矩阵到 GPU 可见性、监控和分析功能,Apstra Data Center Director 可轻松识别并解决影响服务的异常问题(包括 RoCE v2 问题),从而保证 AI 服务质量,提高 GPU 经济效益。

Confident Female Data Scientist Works on Personal Computer in Big Infrastructure Control and Monitoring Room with Neural Network. Woman Engineer in an Office Room with Colleagues.

获得安全的零信任多租户服务

瞻博网络零信任数据中心安全产品组合结合 Junos 中的 EVPN VXLAN 功能,提供多租户服务,保护您的 AI 基础架构、模型和机密数据免受内外部威胁。瞻博网络 SRX 4700 新一代防火墙可以隔离 AI 服务,保护每位客户的安全。瞻博网络 SRX 4700 新一代防火墙可以隔离 AI 服务,保护每位客户的安全,还能以业界领先的吞吐量和 400 Gbps 高速连接,提供无与伦比的性能。

QFX 系列交换机的 EVPN VXLAN 功能可确保共享环境中工作负载的安全隔离和分段,保持客户数据完整性,防止未经授权的访问。

Deploy validated solutions with confidence

满怀自信,部署经过验证的解决方案

我们的多供应商 AI 蓝图(包括 NVIDIA 和 AMD 加速计算、WEKA 和 VAST Data 存储)已通过瞻博网络 Ops4AI 实验室验证,让您安心无忧,加速部署。实验室为最常见的加速计算和存储方案提供客户模型和 AI 应用优质服务和无风险验证。瞻博网络验证设计 (JVD) 可确保数据中心解决方案做到全面、完善,包括交换、安全性和自动化。

152401886

最大限度地提高设计灵活性

开放灵活的以太网解决方案可以帮助客户利用久经考验的技术和产品,避免供应商锁定,而 Data Center Director 是目前唯一一款多供应商数据中心交换矩阵管理和自动化解决方案。瞻博网络提供 1.6 Tbps/端口交换机,并为不受 GPU 限制的系统提供多供应商支持,帮助您降低成本,加快创新速度并避免供应链挑战。

客户成功案例

SambaNova 让高性能和受计算限制的机器学习变得简单且可扩展

人工智能有望转变医疗保健、金融服务、制造、零售和其他行业,但很多致力于提高人类工作速度和效率的组织尚未充分发挥人工智能的潜力。

为克服受计算限制的机器学习 (ML) 的复杂性,SambaNova 设计出了 DataScale。DataScale 采用 SambaNova Systems 的 Reconfigurable Dataflow Architecture (RDA) 设计,并且使用开放标准和用户界面构建而成,是一款从算法到芯片都得到优化的集成式软硬件系统平台。瞻博网络交换解决方案为 SambaNova 的 DataScale 系统和服务迁移了大量数据。  

SambaNova 图片

利用瞻博网络交换机和可持续能源构建模块化 AI 数据中心

Soluna 选择在可再生能源生产基地构建 AI 数据中心,成就“天作之合”。聆听 Soluna 首席技术官 Dipul Patel 探讨能源、AI 训练,以及瞻博网络硬件为何能够成为 Soluna 创新设计的绝佳选择。

了解更多

相关解决方案

数据中心网络

通过现代化的自动化数据中心,简化运维并确保可靠性。瞻博网络可以帮助您实现整个网络生命周期的自动化,并持续验证,以简化设计、部署和运维。

深入探讨

数据中心互连

瞻博网络的 DCI 解决方案实现无缝互连,突破了传统的可扩展性限制、供应商锁定和互操作性挑战。

了解更多

数据中心服务

使用经过验证的参考设计、经过时间考验的方法以及自动化流程和软件,简化并加速现代数据中心的部署和迁移。

See The NOW Way to Network for AI in action

In-depth demos from our AI networking experts help you learn how to design, deploy, and operate high-performance networks for your AI data center.

Get hands-on in our Ops4AI Lab in Sunnyvale

Try the solution in person. Validate the performance and functionality of your AI models in our exclusive lab in Juniper’s Sunnyvale, CA, headquarters.

面向 AI 云服务提供商的数据中心常见问题解答

目前,哪些类型的企业正在优先开展数据中心的 AI/机器学习云解决方案部署?

各大服务提供商 (SP) 和新云提供商正在部署专用 AI 数据中心,来为企业、政府和教育机构提供经济实惠、可快速投入市场的定制 AI 服务。云托管 AI 服务为最终用户提供虚拟化安全计算、存储和网络,同时通过提高效率和降低总体拥有成本,开拓新的收入来源。  

什么是新云?

新云是 AI 云计算提供商的一个新分支,指专注于提供虚拟化 GPU 计算并支持存储和安全网络的一类服务提供商。这些专用 GPU 云为客户提供尖端性能和灵活性,能够在庞大的客户群中分摊 AI 云基础架构成本。通过使用云工具和自动化,新云提供商可以敏捷地进行纵向和横向扩展,从而提高底层 AI 基础架构的效率,满足客户需求。

AI 训练和推理阶段之间有何区别?

AI 模型使用训练阶段精心制作的数据集构建而成。训练在群集中的多个 GPU 上进行。这些 GPU 可以有数十个、数百个,甚至多达数千个,均通过网络连接,并不断相互交换数据。训练阶段结束后,模型也基本构建完成。在推理阶段,用户与模型进行交互,模型可以识别图像或生成图片和文本,回答用户的问题。训练通常以离线方式进行,而推理则通常在线上完成。

AI 数据中心网络基础架构解决方案包含哪些组件?瞻博网络又是如何利用这些组件的?

海量 AI 数据集需要更强大的计算能力、更快速的存储以及大容量、低延迟的网络。瞻博网络通过以下方式满足这些要求:

  • 计算:AI/机器学习计算群集对节点间网络提出了苛刻的要求。缩短工作完成时间 (JCT) 是其中一个必要需求,而网络在群集的高效运维中发挥着关键作用。瞻博网络提供一系列高性能、无阻塞交换机,具备深度缓冲和拥塞管理功能,只需进行妥善架构,就能够消除一切网络瓶颈。
  • 存储:在 AI/机器学习群集和高性能计算中,很少数据集或模型能够被完整存储在计算节点上,因此需要用到高性能存储网络。瞻博网络 QFX 系列交换机可用于 IP 存储连接。该系列交换机对远程直接内存访问 (RDMA) 网络提供全面支持,包括非易失性存储器接口规范/聚合以太网 RDMA (NVMe/RoCE) 和网络文件系统 (NFS)/RDMA。
  • 网络:AI 训练模型涉及分布在数百个或数千个 CPU、GPU 和 TPU 处理器上的大量密集计算。这些计算需要可横向扩展的无错大容量网络。瞻博网络 QFX 交换机PTX 系列路由器利用行业领先的交换和路由吞吐量以及数据中心互连 (DCI) 功能,为数据中心内和数据中心之间的大量计算提供支持。

瞻博网络 AI 数据中心如何简化数据中心的运维?

Apstra Data Center Director 是瞻博网络的数据中心自动化和保证领先平台。它通过持续验证、强大的分析和根本原因识别,实现从设计到日常运维的多供应商数据中心全网络生命周期自动化,从而保证可靠性。通过 Marvis 数据中心 AI 助手,这些信息从 Data Center Director 被传输到瞻博网络 Mist 云,并显示在一个通用 VNA 仪表板中,以提供端到端洞察力。Marvis 数据中心 AI 助手还提供一个使用 GenAI 的强大对话式界面,可显著简化知识库查询。

瞻博网络 AI 数据中心网络解决方案如何满足拥塞管理、负载平衡和延迟要求,从而最大限度提高 AI 性能?

瞻博网络的高性能、无阻塞数据中心交换机提供深度缓冲和拥塞管理功能,以消除网络瓶颈。我们支持动态负载平衡和自适应路由,对流量负载进行平衡。对于拥塞管理,瞻博网络全面支持数据中心量化拥塞通知 (DCQCN)、优先流控制 (PFC) 和显式拥塞通知 (ECN)。最后,为减少延迟,瞻博网络在主干架构中采用同类最佳的商用芯片、可在必要时最大限度利用缓冲区的自定义 ASIC 架构、虚拟输出队列 (VOQ) 以及基于单元的交换矩阵。

瞻博网络提供哪些 IP 存储功能?

我们的产品组合包括基于标准的开放式交换机,使用 NVMe/RoCE 或 NFS/RDMA 提供基于 IP 的存储连接(请参见先前的常见问题解答)。我们的 IP 存储网络解决方案设计可从小型四节点配置扩展到数百个或数千个存储节点。