Amd epyc(小龙)处理器提供卓越的pci-e和内存带宽,有助于加速大型强子对撞机中亚原子粒子的研究

合作伙伴:欧洲核子研究中心

工业:粒子物理研究

挑战:从大型强子对撞机的探测器收集大量数据

解决方案:在探测器数据采集服务器中部署amd epyc 7742处理器

结果:一个更紧凑的系统可以节省成本,并在科学研究上花费更多的钱

amd技术概述:64核amd epyc 7742处理器

合作伙伴:千兆字节

科学是根据实验数据检验理论的过程。但如果测试设备包括cern的大型强子对撞机(lhc)的粒子探测器,那么原始碰撞数据将高达每秒40tb。很多碰撞数据都是不相关的,所以首先要做的就是在信息到达的时候进行过滤,提取最有可能提供关键洞察数据的相关结果。这是一项繁重的高性能计算任务,需要尽可能强大的服务器硬件。

Cern为2021年大型强子对撞机重启做了很长时间的准备,一直在寻找一个能够满足海量数据吞吐处理要求的硬件平台。欧洲核子研究中心(cern lhcb)在线计算项目负责人尼科·纽菲尔德(Niko neufeld)解释说:我们需要将每台服务器的数据保存到每台服务器上。就像拼图一样。拼写完图片后,必须对所有输入数据执行此操作。这给I/O带来了严峻的挑战,因此,neufeld选择了第二代amd epyc处理器,因为它能够提供实验所需的处理性能、内存速度和带宽。

[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

完成漂亮的拼图游戏

纽菲尔德进行的实验被称为lhcb。纽菲尔德解释说,字母b代表美丽。这是自然界六种夸克之一,也是我们研究的主要目标之一。夸克是基本粒子,是物质的基本成分。夸克结合形成称为强子的复合粒子,其中质子和中子是最稳定的元素。

lhcb实验旨在研究大爆炸后发生的事情,以便物质能够生存并形成我们今天所知的宇宙。观察美国夸克的衰变行为有助于解释为什么宇宙主要由物质组成而不是反物质。纽菲尔德补充道:在美国夸克中,这种差异比其他夸克更明显。

美国夸克是强子与lhcb探测器碰撞产生的,但寿命很短,必须快速收集数据才能探测到它们的行为。原始数据流首先由定制的fpga卡进行处理,以便进行初始解释。纽菲尔德说:每台服务器都被映射到不同地理位置的探测器上。检测器被分成不同的部分,然后每个服务器以点对点的方式连接到检测器的这个部分。但是,接下来,我们需要把所有的数据片段放在同一个地方,因为只有这样,我们才能有意义地计算这些内容。

[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

纽菲尔德继续说:单个服务器无法完成数据处理任务,所以你需要完全交换数据。这项活动需要快速的数据处理、对大量内存的高带宽访问,以及与负责将服务器相互连接的i/o设备的快速连接。在后一种情况下,lhcb的每台服务器使用四个mellanox 200gbit infiniband适配器,这些适配器需要尽快互连,以实现全容量运行。纽菲尔德说:数据来自不同的方向,这些数据由不同的服务器处理,然后这些数据必须聚合在一起。

[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

借助amd epyc cpu,我们可以在几天内每秒从服务器显示1 tb以上的数据。在服务器上而不是像过去那样在超级计算机上实现这个过程是一个很大的进步。

niko neufeld,cern lhcb在线计算项目负责人

amd epyc处理器提供超高速i/o和内存

Lhcb过去使用amd opteron处理器,neufeld在工作流程的最后阶段测试了基于第一代amd epyc处理器的服务器,其中来自收集器的数据被打包,供与lhcb实验相关的各级研究机构使用。这一尝试提供了积极的经验,第二代amd epyc cpu改进了产品规格,使其成为更密集数据采集阶段的一个有吸引力的解决方案。

amd epyc cpu的高内核数非常有利于数据处理,128个pci express 4.0通道的支持是一个极好的功能,使每台服务器中的4个mellanox网卡运行没有瓶颈。Neufeld说:有了amd epyc cpu,我们可以在几天内每秒从服务器上显示1 tb以上的数据。在服务器上而不是像过去那样在超级计算机上实现这个过程是一个很大的进步。

纽菲尔德说:系统的总内存池也很重要。传入的数据量非常大。数据不能直接从fpga卡传输到网卡,必须进入主存再返回。另外,我们需要大量的内存。lhcb的每台服务器都使用512gb内存。Neufeld继续说:罗马平台满足了这一要求,因为它提供了多个内存通道,并支持极快的带宽。这是一个高度平衡的平台。8tb 3200mhz ddr4,第二代amd epyc cpu完全可以满足ram要求,相当于pci express总线。

[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

amd epyc cpu扩展空房

2019年5月至9月,cern认证了第二代amd epyc cpu平台,之后选择其作为lhcb实验的解决方案。纽菲尔德解释说,这种解决方案使我们能够将服务器数量减少三分之一。这不仅节省了成本,而且在构建高速低延迟网络时减少了服务器的数量。更大的网络会遇到更多的冲突。系统越紧凑越好。

amd epyc cpu将为lhcb提供进一步测试的升级途径。我们没有谷歌或脸书的计算能力,但amd epyc cpu使我们能够在一个相对较小和紧凑的系统中完成所需的处理工作。这在10-15年前是不可能的。现在,我们有一个扩展的空房间。使用同样的epyc技术,我们可以将同一个房间的容量增加一倍。未来几年,我们的计划是增加探测器和传感器的数量。这将为我们提供一个很大的扩展空间。Epyc让我们可以做更多的事情。

[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

【/s2/】目前还没有可与amd epyc设计相媲美的商用替代设备,也没有其他平台能提供这么多具有gen4能力和这么强大的运营能力的插槽。所以第二代amd epyc cpu平台有架构优势。

niko neufeld,cern lhcb在线计算项目负责人[/s2/]

你想知道amd epyc处理器如何帮助你吗?欢迎注册并接收我们的数据中心内容

标题:[科技界] AMD EPYC(霄龙)CPU 助力 CERN 在 LHCb 实验中进行快速夸克检测

地址:http://www.heliu2.cn/xw/5607.html