戴尔与NVIDIA携手革新企业AI

戴尔AI工厂与NVIDIA:全面的AI创新生态系统

戴尔科技与NVIDIA合作,推出了突破性的企业AI解决方案,有望在全球范围内彻底改变人工智能的采用和部署。 这一战略联盟标志着赋能组织利用AI的变革潜力向前迈出重要一步,从而推动各个行业的创新和效率。

这项合作的核心是戴尔AI工厂与NVIDIA,这是一个全面的生态系统,旨在为组织提供有效扩展其AI运营所需的基础设施、解决方案和托管服务。 该集成平台将戴尔的尖端硬件与NVIDIA的先进AI软件无缝结合,为AI创新创建了一个强大而通用的基础。

PowerEdge服务器:释放前所未有的AI性能

戴尔新AI解决方案的核心在于其下一代PowerEdge服务器,该服务器经过精心设计,可为AI工作负载提供无与伦比的性能。 这些服务器代表了对其前身的重大进步,提供了增强的处理能力、内存容量和存储功能。

  • 风冷戴尔PowerEdge XE9780和XE9785服务器: 这些型号旨在无缝集成到现有的企业数据中心中,从而为组织提供了一种采用AI的直接途径,而无需进行重大的基础设施改造。
  • 液冷戴尔PowerEdge XE9780L和XE9785L型号: 这些液冷服务器经过专门设计,可加速机架规模的部署,提供卓越的散热管理,从而为要求严苛的AI应用实现更高的密度和更高的性能。

新服务器系列拥有令人印象深刻的规格,支持多达192个NVIDIA Blackwell Ultra GPU,并采用直接芯片液冷技术。 为了获得更大的计算能力,服务器可以定制,每个戴尔IR7000机架最多可配置256个NVIDIA Blackwell Ultra GPU。

与戴尔的PowerEdge XE9680相比,这些下一代服务器在使用8路NVIDIA HGX B300时,大型语言模型的训练速度最多可提高四倍。 戴尔PowerEdge XE9712具有NVIDIA GB300 NVL72,因其在训练中的机架规模效率而引人注目,可提供高达五十倍的AI推理输出和五倍的吞吐量提升。

戴尔还采用了创新的PowerCool技术,以进一步提高这些平台的电源效率。 该技术优化了冷却性能,降低了能耗并降低了运营成本。

扩展服务器组合:满足各种AI用例

戴尔致力于提供全面的AI解决方案,这体现在其不断扩展的服务器产品组合中,该产品组合可满足各种AI用例。

  • 戴尔PowerEdge XE7745: 该平台计划于2025年7月发布,将提供NVIDIA RTX Pro 6000 Blackwell Server Edition GPU。 PowerEdge XE7745在NVIDIA Enterprise AI Factory验证设计中受支持,在4U机箱中最多支持8个GPU,使其成为物理和代理AI应用(比如机器人技术、数字孪生和多模式AI)的理想选择。

戴尔对NVIDIA Vera CPU和NVIDIA Vera Rubin平台的支持进一步强调了其致力于采用尖端AI技术的决心。 一种新的PowerEdge XE服务器,旨在用于戴尔集成机架可伸缩系统内,计划支持这些平台。

连接性和网络:确保无缝数据流

为了满足AI应用不断增长的需求,戴尔通过PowerSwitch SN5600和SN2201以太网交换机(均为NVIDIA Spectrum-X以太网网络平台的一部分)扩展了其连接性和网络解决方案。 该公司还推出了NVIDIA Quantum-X800 InfiniBand交换机。

这些高性能交换机可提供高达每秒800吉比特的吞吐量,并由戴尔的ProSupport和部署服务提供支持,从而确保无缝集成和可靠运行。

NVIDIA Enterprise AI Factory 验证设计:AI部署的整体方法

戴尔AI工厂与NVIDIA解决方案旨在支持NVIDIA Enterprise AI Factory验证设计,该设计结合了戴尔和NVIDIA计算、网络、存储以及NVIDIA AI Enterprise软件。 这种整体方法为企业提供了一个完全集成的AI解决方案,该解决方案简化了部署并确保了最佳性能。

戴尔AI数据平台:为数据驱动型AI应用提供支持

戴尔认识到数据在AI计划中的关键作用,因此增强了其AI数据平台,以为应用提供对高质量数据的始终在线访问。 戴尔ObjectScale现在支持大规模AI部署,旨在通过更密集、软件定义的系统来降低成本和数据中心占用空间。

与NVIDIA BlueField-3和Spectrum-4网络组件的集成进一步提高了性能和可扩展性。 这些集成优化了数据流,最大限度地减少了延迟并最大限度地提高了AI工作负载的吞吐量。

用于大规模推理工作负载的高性能解决方案

戴尔推出了一种新的高性能解决方案,该解决方案利用了戴尔PowerScale、戴尔Project Lightning和PowerEdge XE服务器。 此解决方案利用KV缓存和NVIDIA的NIXL Libraries来支持大规模分布式推理工作负载。

此外,戴尔ObjectScale将支持S3 over RDMA,该公司声称与传统S3相比,这可以带来高达230%的吞吐量提升、高达80%的延迟降低以及98%的CPU负载降低,从而提高GPU利用率。 这种创新显着提高了AI推理的效率,使组织能够更快更有效地从其数据中获得洞察力。

与NVIDIA AI数据平台集成:加速精心挑选的洞察力

戴尔宣布了一项集成产品,其中集成了NVIDIA AI数据平台,旨在加速从数据和代理AI应用及工具中精心挑选的洞察力。 此产品简化了数据准备和分析的过程,使组织能够充分释放其数据资产的潜力。

NVIDIA AI Enterprise平台:简化AI开发和部署

NVIDIA AI Enterprise平台可直接从戴尔获得,包括NVIDIA NIM、NVIDIA NeMo微服务、NVIDIA蓝图、用于RAG的NVIDIA NeMo Retriever和NVIDIA Llama Nemotron推理模型。 这些工具使组织能够开发代理工作流程并缩短实现AI成果的时间。

简化的部署和管理:Red Hat OpenShift支持和托管服务

为了简化部署和管理,戴尔将在戴尔AI工厂与NVIDIA上提供Red Hat OpenShift支持。 该公司还推出了用于AI工厂的戴尔托管服务,从而可以跨整个NVIDIA AI解决方案堆栈进行管理,其中包括持续的监控、报告、版本升级和修补。 这一整套服务可确保组织可以专注于利用AI来推动业务价值,而不会因基础设施管理的复杂性而负担过重。

高管观点:对AI未来的愿景

戴尔科技董事长兼首席执行官迈克尔·戴尔强调了公司对AI民主化的承诺,他说:“我们的使命是将AI带给全球数百万客户。 我们的工作是使AI更易于访问。 借助戴尔AI工厂与NVIDIA,企业可以在任何规模下管理跨用例的整个AI生命周期,从训练到部署。”

NVIDIA创始人兼首席执行官黄仁勋也表达了同样的观点,强调了AI工厂的变革性潜力:“AI工厂是现代工业的基础设施,产生了智能,从而为医疗保健、金融和制造业的工作提供动力。 借助戴尔科技,我们正在提供最广泛的Blackwell AI系统系列,以在云、企业和边缘为AI工厂提供服务。”

可用性:拥抱AI的未来

新的解决方案和托管服务将在2025年推出,与服务器平台的推出和未来的NVIDIA集成支持相一致。 这种分阶段的方法可确保组织可以将这些尖端技术无缝集成到其现有基础设施中。

戴尔与NVIDIA的战略联盟代表了企业AI领域的一次范式转变。 通过结合各自的优势,戴尔和NVIDIA正在赋能组织拥抱AI的变革潜力,从而推动各个行业的创新和效率。 凭借其全面的生态系统、尖端的硬件和强大的软件,戴尔AI工厂与NVIDIA有望彻底改变企业利用AI来实现其战略目标的方式。 这是朝着AI对各种规模的企业都可访问、可管理且具有影响力的未来迈出的重要一步。 这种合作关系的影响深远,有望塑造众多行业的未来。