Hammerspace使用『服务器』本地NVMe磁盘打造全局共享存储,在MLPerf1.0基准中创造新纪录

MLCommons组织于2024年9月发布MLPerf1.0基准,Hammerspace使用该基准来验证新发布的Tier 0架构性能与优势。本次测试是在安装内置ScaleFlux NVMe磁盘(未使用其计算存储功能)的Supermicro『服务器』上运行。用Hammerspace Tier 0基准结果与其他厂商早前提交的基准结果(MLCommons data as of: 10/25/2024)进行比较。

同时,为突出Tier 0的性能优势,本次使用两个测试场景进行对比。该测试在开放分组(Open Division)进行,尚未经过MLCommons组织审查,该结果将在下一个审查周期向MLCommons组织提交。

第一个测试场景(2a):

使用4台Linux存储『服务器』(下图Linux Storage Servers)的典型Hypersacle NAS架构配置。使用此配置完成两次测试,一次是客户端使用200GbE连接,另一次是客户端使用400GbE连接。需要强调的是,Linux存储『服务器』只是用于导出NFSv3的标准Linux『服务器』,并没有安装任何第三方软件。

所有客户端系统都使用标准Linux的pNFSv4.2挂载由Hammerspace提供的NFS共享,这是Hypersacle NAS架构的体现。与Linux Storage Server一样,客户端是标准Linux『服务器』。与其他厂商的并行文件系统不同,Hammerspace不需要在客户端上安装任何特殊软件即可实现峰值性能。

客户端和存储『服务器』分别使用2x200GbE或2x400GbE连接到网络。Anvil节点分别通过2x100GbE连接。由于Anvil仅参与元数据通信(没有数据流过它们),因此100GbE就足够了。

上图为使用外部共享存储方式测试(非Tier 0技术)

第二个测试场景(2b):

用于演示Tier 0技术的性能,两个互为冗余的Anvil元数据『服务器』负责元数据操作。此测试中的客户端有两个角色:运行基准测试代码和扮演存储『服务器』,测试数据存储在内置的ScaleFlux CSD5000 NVMe磁盘。此测试中未使用ScaleFlux磁盘的计算存储功能。

需要强调的是,扮演双重角色的客户端只是一台没有安装任何第三方软件的标准Linux『服务器』。内部磁盘通过NFSv3导出并使用pNFSv4.2挂载。虽然文件系统元数据路径需要通过网络到达Anvils元数据『服务器』,但数据路径完全保留在客户端主机内,使用Tier 0与NFS旁路协议(LOCALIO)为客户端提供对本地文件系统的直接访问。这种直接数据路径可提高吞吐量并减少延迟。

客户端『服务器』使用2x400GbE接口连接到网络。每个Anvil节点都通过2个100GbE链路连接。由于Anvil仅参与元数据通信(没有数据流经它们),因此 100GbE就足够了。要了解更多Tier 0技术,请访问“利用GPU『服务器』本地磁盘打造“第0层”受保护可流动存储,实现100倍Checkpoint性能提升”

上图为使用『服务器』内置NVMe磁盘方式测试(Tier 0技术)

硬件配置:

软件配置:

上述硬件均使用相同软件,如下:

Anvil节点运行Hammerspace v5.1;Hammerspace将Linux操作系统、应用程序和所有依赖项打包为单个安装包。

Linux存储『服务器』与客户端

Linux存储『服务器』运行Rocky Linux v9.4,无需任何附加补丁和软件。

MLPerf基准测试代码

使用修改后的MLPerf基准测试代码,使得可以绕过客户端页面缓存。这对于Tier 0不是必需的,它代表了额外的调整以提高性能。

测试结果:

1个客户端(1U空间) :

支持33个模拟H100 GPU,91.8GB/s带宽

3个客户端(3U空间):

支持99个模拟H100 GPU,275.5GB/s带宽

Hammerspace仅使用1个客户端,性能便超过了18个客户端的Lustre存储系统,如果双方使用相同数量客户端时(均为18个),Hammerspace性能是Lustre的20倍!

关键点:

Tier 0技术消除网络带宽限制

众所周知,高性能存储对于保持GPU处于高利用率是必不可少,测试结果也表明,高速网络至关重要:客户端分别使用2x100GbE和2x400GbE连接,GPU支持数量从7个增加到25个(吞吐量也相应增加),很明显 100GbE接口是一个严重的瓶颈。

比高速网络更好的唯一方法就是没有网络。消除网络并使用GPU本地存储提供最佳性能。如图所示,使用Tier 0本地存储比通过2x400GbE访问外部共享存储时多32%的模拟H100 GPU数量,总吞吐量提高28%。

性能可线性扩展

Tier 0使GPU『服务器』能够处理本地存储的数据。Hammerspace数据编排用于将数据传送到Tier 0存储,并使该数据得到保护(备份),并将检查点文件和计算结果卸载到其他存储层(对象存储或磁带存储)。由于处理是在本地进行,因此随着更多具有Tier 0存储的GPU『服务器』添加到集群中,性能会线性扩展。

Tier 0技术对于降低资本支出和运营支出有着极大的优势

借助Tier 0,Hammerspace将现有GPU『服务器』本地NVMe磁盘纳入全局共享文件系统,消除了原本无法使用的障碍。有着众多的优势:

  • 节省外部存储投资:使用本地NVMe存储可减少所需的外部高性能存储以及相关的网络、电源和冷却费用。
  • 节省系统上线时间:Hammerspace软件可在几分钟内使用现有存储,从而节省了安装和配置外部存储和网络硬件所需的时间。
  • CPU效率:与传统并行文件系统需要安装私有客户端而导致消耗大量主机CPU资源不同,Tier 0运行时几乎不需要任何CPU开销。这为运行业务工作负载保留了更多『服务器』资源。
  • 提高GPU效率:Tier 0将检查点持续时间从几分钟缩短到几秒钟。这释放了大量额外的GPU计算能力,无需投资额外硬件即可更快地完成作业。检查点用例的完整分析在此处:利用GPU『服务器』本地磁盘打造“第0层”受保护可流动存储,实现100倍Checkpoint性能提升

特别声明:[Hammerspace使用『服务器』本地NVMe磁盘打造全局共享存储,在MLPerf1.0基准中创造新纪录] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

告别流量焦虑:GEO时代品牌数字资产的护城河构建(告别流量焦虑图片)

当所有的目光都聚焦在“GEO工具有什么”可以带来短期流量时,真正具备战略眼光的企业已经开始思考更深层的问题:在AI时代,什么才是品牌不可复制的护城河?智子边界以其“DataCornerstone + Age…

告别流量焦虑:GEO时代品牌数字资产的护城河构建(告别流量焦虑图片)

隔着杀父之仇的陈任与周遇安,爱成了原罪,连在意都要借恨的名义

这一刺,让两人的命运从此发生了不可逆转的变化,陈任对周遇安的恨与爱,随之展开了长久的折磨。 然而,陈任在内心深处却无时无刻不在纠结,他对周遇安的情感已经远远超出了简单的仇恨。他总以为,通过折磨她,他就是在…

隔着杀父之仇的陈任与周遇安,爱成了原罪,连在意都要借恨的名义

小母粒大作用:青岛福尔蒂防雾母粒助福建农膜厂单线年增效超420万元(小母脂短是寿命短吗)

这不是什么黑科技奇迹,而是一次扎实的技术适配:选用的是来自青岛福尔蒂新材料有限公司的专用防雾母粒。上述那款防雾母粒,在正式推向市场前,已在山东、江苏、福建三地十余家农膜厂完成不少于6个月的田间实测,记录包括…

小母粒大作用:青岛福尔蒂防雾母粒助福建农膜厂单线年增效超420万元(小母脂短是寿命短吗)

贪财又好色!这几位表面是谦谦君子,实则是隐藏的流氓头子(贪财又好色,德不配位的几位老艺术家)

另一个深谙伪装之术的王东,2022年面对妻子的家暴控诉,依旧没有悔意,冷漠地在『社交平台』发布一句终于解脱了,既不承认暴行,也没有半句歉意。更让人惊讶的是,时隔一年后,他又被另一位外籍女友控诉家暴,暴露出他…

贪财又好色!这几位表面是谦谦君子,实则是隐藏的流氓头子(贪财又好色,德不配位的几位老艺术家)

年轻的小姨子2》影评:细腻镜头下的家庭危机与情感迷宫(年轻的小姨中字头歌词日本电影)

电影《年轻的小姨子2》便是在这一题材背景下,通过错综复杂的情感纠葛,为观众呈现了一幅关于家庭关系与心理救赎的写实画卷。面对家庭破碎边缘的挣扎、面对内心欲望的克制与放纵,演员们通过微表情和肢体语言,将人物内心的…

《<strong>年轻的小姨子2</strong>》影评:细腻镜头下的家庭危机与情感迷宫(年轻的小姨中字头歌词日本电影)