服务器 psu 是什么?

服务器 psu 是什么?,第1张

服务器 psu 是服务器的电源装置组件。

在服务器的维修手删, 电源装置基本用PSU缩写表示。

psu的全称为=power supply unit

中文解释: 电源装置。

针对问题:CPU利用率可以建模平均能耗,但是对于预测峰值粒度过粗。

提出模型:表征服务器利用率和电源行为之间的关系,对实际峰值功耗建模。引入新的操作系统指标,捕获所需信息,以较低的开销设计峰值功率。

如今,数据中心运营商普遍以几十分钟到几小时的采样间隔收集实用跟踪信息。 由于存储和处理的开销,对成千上万的服务器禁止更细粒度的采样。 例如,对于1000个节点的群集,以OS调度程序的粒度(100Hz)采样将每周产生225 GB数据。

要确定服务器的峰值功率,就要了解服务器 开关模式电源单元(SMPSU插座式电源) 的行为。这些设备效率很高,但是依赖于开关和电荷存储机制,从而将 RC(电阻-电容)行为 引入了功耗。我们的贡献是将服务器的操作系统视图与电源能耗峰值相连接。

介绍一个易于采集的操作系统级别的度量(30ms),该度量可确定一段时间内的峰值功耗。通过模型合并SMPSU的RC行为,并以较低的开销跟踪峰值功率。这种机制可以记录随时间变化的峰值功率,并有助于大规模数据中心能耗供应研究。

贡献:

说明了以细粒度采集利用率所面临的挑战,以及峰值和平均度量之间的重要差异。

服务器开关电源单元的特性及其能耗与服务器利用率之间关系的解析信号处理模型。

一种新的操作系统级度量标准,可捕获峰值功率信息以用于服务器检测。

通常PDU会被过度配置,预配置容量远高于平均负载。

功率上限power capping是一种数据中心级别的技术,可以对服务器的峰值功耗(例如,使用控制回路)进行硬限制。节流服务器电源DVFS(通过频率/电压缩放)用作安全机制,以确保不超过最大功率水平并且断路器不跳闸。使得PDU和其他电源供应基础架构就可以得到超额订购,从而降低了有效的资本成本。由于负载/功率峰值很少,因此节流性能几乎没有损失。通过使用电源路由可以进一步降低资本成本,这可以在负载不平衡时在PDU之间转移负载。

所有这些技术都需要软件机制来跟踪和预测峰值功率,以管理每个服务器,电路和PDU的功率预算,同时最大程度地降低性能节流。尽管可以通过显式计量和记录来跟踪峰值功率,但是直接从操作系统级别的指标评估峰值功率可以大大降低成本。要从操作系统级别的指标推断和记录峰值功率,我们必须了解服务器电源的操作及其与利用率的关系。

服务器中SMPSU设备的行为以及其与OS观察到的利用率的关系。

研究对象: 两种不同的系统:具有便宜商品PSU(“商品”)的小型系统和具有企业级PSU(“服务器”)的大型系统。 由于SMPSU的设计不同,这些系统在行为上存在一些差异。 但是,与预测峰值能耗方面相似。

商品PSU的峰值传输电流比服务器更明显。 这种差异是由于在高端设备中常见的第一级额外开关调节,用于产生更连续的电流。

使用工作负载SQUARE观察 利用率 变化 频率 的影响。使内核在 矩阵乘法 与处理器 空闲模式 之间切换,使系统利用率产生方波。工作负载的 占空比(占空比是指在一个脉冲循环内,通电时间相对于总时间所占的比例) 固定为50%,平均利用率为50%。改变方波的频率,并观察PSU的响应。

使用工作负载STEP表征 利用率变化和PSU响应之间的延迟 。使系统处于空闲状态,等待直到PSU行为达到稳定状态。然后在所有内核上进行矩阵乘法。由于无法直接从外部观察CPU利用率,因此在过渡到在示波器上开始计时之前立即发送了一个信号(使用比预期的SMPSU响应快得多的通用I / O)。

图5表明:调制频率对观察到的功率波形有很大影响。 只要对CPU的利用率进行缓慢调制,功耗的包络就大致类似于方波,与CPU的行为相匹配。 然而,随着频率增加,功率消耗变得更加均匀。

对SMPSU峰值进行建模,以细粒度(在许多系统的内核调度间隔附近)监控利用率。

使用STEP工作负载研究SMPSU电源负载的相位延迟。 瞬时功率响应存在一个延迟,该延迟随着RC滤波的阶跃函数的期望而增加。 图示利用率转换的I / O信号(“trigger”)以及隐含的利用率波形(“ Utilization”)。 最后,我们显示了一个已过滤(“filter”)的阶跃函数,该函数适合观察到的上升波形。 该信号由具有界限频率30 Hz的一阶RC滤波器产生。

低于20HZ的更细微的变化会被电源的RC行为过滤掉,因此不考虑。 通过对SMPSU的运行及其与服务器利用率的关系的新了解,我们构建了一种开销低的方法,可以从操作系统内核的利用率中推断出峰值功率。 然后,我们使用真实的机器验证我们的模型,并表明我们可以预测峰值功率曲线,且误差低于20%。

实验设置:两种服务器配置验证能耗模型。

在系统执行Linux内核的并行编译时收集能耗,该工作负载产生了混乱的突发使用模式。

 瞬时能耗(“实测”)。预测能耗(“ Predicted”)很好地跟踪能耗峰值,但有时能耗仍然超出预测值。 幸运的是,该模型趋于保守,并且高估的能耗多于低估的能耗。 因此,它将在例如功率预算/封顶研究中提供保守估计。 商品计算机和服务器计算机的标准化均方根偏差(NRMSD)分别为14%和19%。

总结

1.使用CPU利用率对服务器的峰值功耗建模。

2.描述了OS级利用率与现代服务器中SMPSU行为之间以前被忽略的关系。 

3.通过测量真实的服务器PSU,证明必须以 33 ms或更低的粒度监视利用率以预测峰值功率 。 我们基于轻量级PSU的RC行为的信号处理启发模型,介绍了OS级解决方案,并演示了峰值功率可以近似在20%的NRMSD之内。

Dell服务器有时会若硬件的改动,在开机以后会提示错误信息。信息一般会提示在显示器上,以后举出如下信息的解决办法。信息 原因 纠正措施Alert! iDRAC6 not responding.Rebooting. iDRAC6 未响应 BIOS 通信,一种原因是它未正常运行,另一种原因是它未完成初始化。系统将重新引导。 请等待系统重新引导。Alert! iDRAC6 not responding.Power required may exceed PSU wattage.Alert! Continuing system boot accepts the risk that system may power down without warning. iDRAC6 挂起。系统在引导时,iDRAC6 被远程重设。在交流电恢复之后,iDRAC6 需要比正常情况下更长的时间来引导。 断开系统的交流电源 10 秒,然后重新启动系统。Alert! Node Interleaving disabled! Memory configuration does not support Node Interleaving. 内存配置不支持节点交叉,或配置已更改(例如,内存模块出现故障),导致无法支持节点交叉。 系统将继续运行,但没有节点交叉功能。 请确保将内存模块安装在支持节点交叉的配置中。请查看其它系统信息,以获取有关可能原因的更多信息。有关内存配置信息,请参阅内存模块一般安装原则。如果问题仍然存在,请参阅系统内存故障排除。Alert! Power required exceeds PSU wattage.Check PSU and system configuration.Alert! Continuing system boot accepts the risk that system may power down without warning. 电源设备可能不支持处理器、内存模块和扩充卡的系统配置。 如果某些系统组件刚刚进行了升级,请将系统恢复为以前的配置。如果系统引导时不再显示此警告,则表明此电源设备不支持新更换的组件。请参阅电源设备。Alert! Redundant memory disabled!Memory configuration does not support redundant memory. 虽然系统设置程序中已启用内存镜像功能,但当前配置不支持冗余内存。内存模块可能出现故障。 请检查内存模块是否出现故障。请参阅系统内存故障排除。根据具体情况,重置内存设置。请参阅"使用系统设置程序和 UEFI 引导管理器"。Alert! System fatal error during previous boot. 某个错误导致系统重新引导。 请查看其它系统信息,以获取有关可能原因的更多信息。BIOS MANUFACTURING MODE detected.MANUFACTURING MODE will be cleared before the next boot.System reboot required for normal operation. 系统处于生产模式。 请重新引导系统使其退出生产模式。BIOS Update Attempt Failed! 远程 BIOS 更新尝试失败。 请重新尝试更新 BIOS。如果问题仍然存在,请参阅获得帮助。Caution!NVRAM_CLR jumper is installed on system board NVRAM_CLR 跳线采用清除设置进行安装。CMOS 已被清除。 请将 NVRAM_CLR 跳线移动到默认位置(插针 3 和 5)。有关跳线位置,请参阅图 6-1。请重新启动系统并重新进入 BIOS 设置。请参阅"使用系统设置程序和 UEFI 引导管理器"。CPU set to minimum frequency. 处理器速度可能出于节能考虑而有意设得较低。 如果不是有意设置,请检查其它系统信息以了解可能的原因。CPUs with different cache sizes detected.CPUs with different core sizes detected!System haltedCPUs with different logical processors detected!System halted.CPUs with different power rating detected!System halted. 系统中安装的处理器不相匹配。 请确保所有处理器都具有完全相同的高速缓存大小、内核和逻辑处理器数量以及电源额定值。请确保处理器安装正确。请参阅处理器。Current boot mode is set to UEFI.Please ensure compatible bootable media is available. Use the system setup program to change the boot mode as needed. 系统引导失败,因为 BIOS 中启用了 UEFI 引导模式,而引导操作系统并非 UEFI。 请确保引导模式设置正确,并且具有正确的可引导介质。请参阅"使用系统设置程序和 UEFI 引导管理器"。Embedded NICx and NICy:OS NIC=<ENABLED |DISABLED>, Management Shared NIC=<ENABLED |DISABLED>操作系统 NIC 接口在 BIOS 中设置。在管理工具中设置了管理共享 NIC 接口。 请检查 NIC 设置的系统管理软件或系统设置程序。如果仍然指示存在问题,请参阅NIC 故障排除。Error 8602 - Auxiliary Device Failure. Verify that mouse and keyboard are securely attached to correct connectors. 鼠标和键盘电缆松动或连接不正确。鼠标或键盘出现故障。 请重置鼠标或键盘电缆。请确保鼠标和键盘可正常工作。请参阅USB 设备故障排除。Gate A20 failure 键盘控制器出现故障;系统板出现故障。 请参阅获得帮助。General failure 操作系统无法执行命令。 此信息通常后跟具体信息。请记下此信息并采取相应的措施解决问题。Invalid configuration information - please run SETUP program. 无效的系统配置导致系统停机。 请运行系统设置程序并检查当前设置。请参阅"使用系统设置程序和 UEFI 引导管理器"。Invalid PCIe card found in the Internal_Storage slot! 由于在专用存储控制器插槽中安装了无效的 PCIe 扩充卡,因此系统停机。 请卸下 PCIe 扩充卡,在专用插槽中安装集成存储控制器。请参阅集成存储控制器卡。Keyboard controller failure 键盘控制器出现故障;系统板出现故障 请参阅获得帮助。Keyboard data line failureKeyboard stuck key failure 键盘电缆连接器连接不正确,或键盘出现故障。 请重置键盘电缆。如果问题仍然存在,请参阅USB 设备故障排除。Keyboard fuse has failed 检测到键盘连接器电流过载。 请参阅获得帮助。Local keyboard may not work because all user accessible USB ports are disabled. If operating locally, power cycle the system and enter system setup program to change settings. 在系统 BIOS 中禁用了 USB 端口。 请关闭系统后通过电源按钮重新启动,然后进入系统设置程序来启用 USB 端口。请参阅"进入系统设置程序"。DIMMs <x>disabled - Memory Buffer communication error 内存模块未正确就位。内存模块连接器或处理器插槽可能沾上灰尘。处理器插针弯曲。 重置内存模块。请参阅卸下内存模块和安装内存模块。确保内存模块连接器和处理器插槽的清洁。确认处理器中没有弯曲的插针。如果处理器有弯曲的插针,请参阅获得帮助。DIMMs <x>disabled - MemBIST error 内存模块未正确就位。内存模块连接器或处理器插槽可能沾上灰尘。不支持的内存模块。 更换或重置内存模块。请参阅卸下内存模块和安装内存模块。确保内存模块连接器干净并且在有效配置中安装支持的内存模块。请参阅内存模块一般安装原则。DIMMs <x>disabled - MemBIST timeoutDIMMs <x>disabled - Rank not foundDIMMs <x>disabled - DIMM communication errorDIMMs <x>disabled - DDR training failureDIMMs <x>disabled - Simple memory test failureDIMMs <x>disabled - Simple memory test failureDIMMs <x>disabled - Invalid DIMM 不支持的内存模块位于第一个锁步对中。 请参阅内存模块一般安装原则。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/664264.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-26
下一篇2023-07-26

发表评论

登录后才能评论

评论列表(0条)

    保存