通过电源完整性测试提高 AI 数据中心的能源效率

2024-08-01 14:52:53 Christopher Loberg

基于人工智能的技术正在数据中心部署。处理器密集型服务器正在推高能源需求。下表说明了影响的程度。国际能源署 IEA) 预测,到 2030 年,数据中心将占全球电力消耗的 7%;这个数字相当于整个印度国家的用电量。

微信图片_20240801145055.png

1:数据中心中 CPUGPU 技术的功耗。

随着对电力的需求不断增长,对能源效率的重视至关重要。与备受认可的电力完整性专家史蒂夫·桑德勒(Steve Sandler)合作;泰克开发了良好的测量技术,以提高下一代 AI 数据中心的运营/瓦特。

提高供电网络 PDN) 的能源效率

PDN 必须为驱动这些服务器机架中 GPU 的敏感负载提供许多低噪声直流电源轨。追求更高的速度和更高的密度意味着更快的边沿速率、更高的频率和更多的电源轨,但电压水平更低,电流更高,如上图所示。这强调了良好的电源完整性。

进行电源完整性测量的目的是验证在所有预期工作条件下到达负载点 POL) 的电压和电流是否符合负载的电源轨规格。在GHz频率下,需要特别注意精确测量电源轨噪声的毫伏。让我们看一下如何通过基于服务器的系统上的配电网络的高级视图来评估 PDN 性能。

图片2.png

2:数据中心的高级配电网络

如图所示,典型的数据中心通过 12、24 或 48 V DC 电源为其基于 AI 的服务器供电,然后将其转换为主板上的其他电源电压。工程师能够查看从电源输出到 FPGA处理器和其他复杂 IC 的链条中的每个环节,因此必须将电源轨阻抗管理在非常低的水平,以便提供由 GPU 技术驱动的以 AI 为中心的服务器中的高电流。使阻抗管理复杂化的是,网络由许多阻抗组成,包括稳压器、去耦电容器和PCB走线。高速交换和热插拔服务器卡会带来意想不到的阻抗变化,从而导致过多的瞬变或噪声。

要确保稳定、节能的设计,首先要将 PDN 中的噪声降至最低。电源轨上的噪声规格可以上升到MHz或GHz频率范围,幅度以毫伏为单位。

评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线路电压和线路电流。评估质量的测量值如下所示:

· 频率

· RMS 电压和电流

· 阻抗

· 波峰因数(电压和电流)

· 真实功率、无功功率和视在功率

· 功率因数和相位

确保这些测量准确无误;示波器探头的选择很重要;使用差分探头测量系统的线路电压,使用电流探头测量系统的线路电流。

另一个关键测量是对PDN的控制环路响应进行频率响应分析。这将提供有关控制回路速度和电源稳定性的宝贵信息。波特图用于查看分析,图 3 中的设置示例如下。

 图片3.png

3:配电网中阻抗的测量设置。

 

电源完整性探测系统值得关注

当今示波器附带的高阻抗 10X 无源探头可能具有足够的带宽,但它们会衰减您尝试测量的噪声信号。1X探头通过噪声信号而不衰减,但它们被限制在几个MHz带宽内。输入阻抗为 50 Ω的传输线探头或电缆具有出色的高频性能,但在直流时会造成很大的负载,除非添加直流模块。 衰减传输线探头提供更少的负载,同时保持低噪声和高带宽。

电源轨探头是另一类探头,可在高达 4 GHz 的频率下提供低噪声和高失调范围,直流失调范围为 -60 至 +60 Vdc。在识别噪声源方面,这被视为传统无源探头的更准确替代方案;如下图 4 所示。根据电源轨的电压,可能需要一个直流块。如果是这种情况,请确保它为示波器提供浪涌保护,并且对直流或交流偏置不敏感。电源轨探头虽然噪声非常低,但也是单端的。为此,请寻找能够进一步减小测量接地环路误差的同轴隔离器。Picotest提供一系列直流模块和同轴隔离器来满足这些需求。了解有关终极电源轨噪声测量的更多信息。

图片4.png

4:使用无源探头(下图)和电源轨探头(上图)对纹波的电源线测量比较。看到区别了吗?

快速、低噪声采集与超快边缘负载相结合,可模拟 AI处理器工作负载;允许准确评估 PDN 设计中的电源轨噪声电压和电源轨到电源轨串扰。与泰克 5 系列 B MSO 或 6 系列 B MSO 示波器结合使用;Picotest 提供高达 2,000 安培、1ns 边缘负载的完整负载系列,支持高达 65MS/s 的采样率,以实现精确的仿真工作。(见图5)

图片5.png5.显示 AI处理器高振幅负载的伪随机步长的表征。这种表征的准确性是通过使用 Picotest 负载实现的,并由泰克 6 系列 B MSO 示波器测量,非常适合低噪声和高分辨率信号捕获。

示波器测量分析可节省时间,减少误差

识别和分析 PDN 中的故障点可能需要一些时间。在供电网络中寻找纹波、过冲、欠冲、导通、关断、时间趋势、建立时间和抖动是一项复杂的工作。值得庆幸的是,当今大多数现代示波器都提供内置分析软件来设置仪器并自动进行信号采集和显示。下面是一个显示纹波自动测量的示例。将其内置到仪器中,并能够从远程 PC 自动执行,从而简化了大型团队的工作,以评估 AI 支持的性能随时间和温度变化的变化,从而强调服务器的效率和耐用性。

 图片6.png

6:5 系列 B MSO 示波器显示器右侧的带注释的自动纹波测量结果。

总结

随着人工智能 AI) 推高下一代数据中心的能源需求;评估供电网络的性能和效率变得比以往任何时候都更加重要。拥有良好的 PDN 评估测试测量策略将导致数据中心在性能、可靠性和能源效率方面实现最佳功能、人工智能就绪。


关键词: 通过 电源 完整性

  • EETOP 官方微信

  • 创芯大讲堂 在线教育

  • 创芯老字号 半导体快讯

全部评论