同方服务器集群统一管理平台 高效解决方案 TF-DCM (同方数据中心管理平台)
发布时间:2017-11-20
同方服务器集群统一管理平台 高效解决方案
TF-DCM (同方数据中心管理平台)

同方数据中心管理平台(Tongfang DataCenter Manager)通过数据中心带外管理网络,实现了数据中心内服务器集群等IT设备统一管理,能耗/温度信息统一监测管理,IT设备健康信息实时报警等功能。同方数据中心管理平台产品方案用于数据中心日常维护,可帮助数据中心有效改善能源效率,提升管理水平,节省运维成本。

- 基于服务器级别的能耗实时监测,替代昂贵的智能PDU电源分配单元
- 当前主流的数据中心能耗管理方案为使用价格昂贵的智能PDU进行功耗的读取,大多数的智能PDU只能获得入口的总功耗,对于每一个出口的功耗监测则无能为力,如果针对每一个出口进行监测,则代价更为昂贵。利用同方数据中心管理平台 能耗管理平台,可以有效取代这些价格昂贵的智能PDU,直接做到对于服务器级别/机柜级别/房间级别/数据中心级别的功耗实时监测,并且由统一的操作界面进行管理,大大提高了能耗监测的精细度,同时降低了实现能耗管理的成本。
- 基于服务器级别的进风口环境温度监测,取代温度传感器硬件设施,或者有效的补充了温度传感器硬件设施密度不足所带来的盲点
- 在现有的数据中心环境温度监测管理方案中,一般都是在机柜上安装温度传感器,对于造价昂贵的机柜或方案,一般会在机柜的上中下三个位置各放置一个温度传感器,然后通过信号采集器和转换器,将温度信息转化为IP信号,传递给中央控制台进行监测和分析,这样的方案投入了许多的硬件设施。利用同方数据中心管理平台,不需要添加任何的物理设备,直接利用服务器内置的环境温度传感器,则相当于在每一个服务器的进风口均安装了环境温度的探测器, 不需要硬件成本的投入,既可以做到环境温度更为精细化的管理。同时,对于已经部署了温度传感器的数据中心环境,同方数据中心管理平台可以从服务器级别读取出实时的环境温度,对于外置温度传感器系统进行相互有效的校验和补充。
- 增加机柜密度,进行有效的容量规划
- 目前,针对服务器上架到机柜,一般来说,都是利用经验功率或者服务器铭牌功率为标准进行服务器的上架,如果一个42U的机柜,额定功耗限流为20A,则如果2U服务器的经验功率为350瓦,则最多可以放置12个服务器,空间资源大大浪费了,如果利用同方数据中心管理平台进行实时功耗监测,监测一段时间后,发现每台服务器的功耗从来没有超过300瓦,甚至更低,这个时候,利用同方数据中心管理平台的功耗监测和控制功能,可以大大提高机柜的密度,合理的进行能源和空间资源的优化。同时,在一个已经存在的数据中心,如果有新的服务器设备加入,利用同方数据中心管理平台能耗平台对历史数据的统计,可以利用功耗和空间的信息,有效地找到放置新的服务器的最佳机柜位置。
- 机柜级功耗策略,防止机柜过载时电路爆表断路
- 在一些HPC高性能计算的案例中,有些客户在运行高负荷的负载时,由于机柜上架较满,很可能会发生电路断路的危险,利用同方数据中心管理平台的能耗控制功能,则可以在尽可能不影响工作性能的情况下,进行电路断路的保护,始终让运算和功耗处在可控的范围之内,从而保障了服务和计算的正常进行。
- 数据中心热点分析与预警
- 利用同方数据中心管理平台服务器环境温度和功耗实时监测与告警功能,可以很清晰的针对数据中心环境温度和功耗的分布有一个清楚的认识,从而针对数据中心制冷系统进行分析优化,即时预警,防止热点的发生。客户可以在任何一个级别上(服务器/刀箱/机柜/房间/数据中心)自定义功耗和温度事件,这些事件一旦发生,会及时透过邮件系统传送给数据中心管理人员进行下一步的操作和判断,从而有效消除潜在的能耗和温度的热点。
- 紧急状态下的业务保护
- 当由于外力不可控因素发生突发情况时,比如空调失灵,正常电力供应中断,利用同方数据中心管理平台 紧急状态策略,可以对不同优先级的服务器设备自动进行不同的操作,比如对最低优先级业务的服务器自动关机,对中等优先级业务的服务器实施最小能耗策略将实时能耗降为最低,而保持高优先级业务的服务器持续运行在最好状态。这样可以用来延长UPS工作时间,减少热量产生,从而最终延长关键业务持续运行时间,做到业务的安全保障。
- 组级别自动开关机,不影响业务情况下有效降低能耗
- 利用同方数据中心管理平台可以进行基于带外IPMI网络服务器群组自动开关机设置,利用群组级别自动开关机,可以在没有业务的情况下将部分机器一次性关机,而在业务来临时迅速将关机状态的服务器开启投入运行,这样可以在不影响业务性能的情况下,最大限度的降低了能耗水平,节省了能耗成本。同时,服务器群组级别自动开关机也为数据中心运维管理提供了有效的工具。
- 透过能耗监测分析,有效判定数据中心低负载服务器或僵尸服务器
- 在一个成熟的数据中心,总会有一些服务器一直在开启状态,不过很长时间没有业务负载,一直在空闲状态,据统计这些僵尸服务器在数据中心会有15%左右。利用同方数据中心管理平台能耗分析,可以很容易的定位这些僵尸服务器的存在,从而将这些服务器合理的利用起来,或者进行有效的服务器升级,更好的服务于业务。
- IT设备远程接入,有效提升数据中心运维水平,降低采购运营成本
- 利用同方数据中心管理平台 vKVM远程接入,数据中心管理员可以不需要进入数据中心,通过各种方式接入服务器设备的远程桌面进行操作,通过vKVM会话,可以有效地配置BIOS, 观察服务器异常事件并进行诊断,远程安装操作系统,文件传输等等,这些操作通过带外管理网络进行,不需要操作系统的支持,不会占用业务系统的资源。通过部署同方数据中心管理平台,数据中心不需要购买昂贵的KVM交换机等传统设备,不需要单独的空间U位放置这些设备,可以直接对数据中心所有IT设备进行有效管理和配置。数据中心管理员也不需要频繁进出数据中心,在办公室即可对所管控的服务器设备进行操作,这大大降低了采购成本,提升了管理运维水平。
- 针对IT设备组件级别及系统级别进行实时健康状态管理与告警,提升了数据中心运营效率,降低了运营成本
- 同方数据中心管理平台支持对IT设备的组件级别和系统级别进行健康状况监测与告警,从而使得数据中心运维人员迅速定位故障点,对业务的影响降至最低,同时取代了人工巡检,降低了人工巡检的误操作和误判断,使得数据中心健康诊断电子化自动化,降低了运行成本。支持的组件一般包括CPU, 内存,存储,风扇,电源,电压,温度,电池等。