大型数据中心验证测试阶段工程管理重点关注的几个问题

发表时间:2020/8/11   来源:《基层建设》2020年第10期   作者:石磊
[导读] 摘要:针对大型数据中心项目验证测试过程中业主关注的问题,比如对验证测试单位的选择、假负载的位置和路由、以及空调间内的气流组织以及业主其他部门意见等,从工程管理角度用案例阐述具体解决方式,为其他IDC项目工程提供借鉴和参考。
        上海现代建筑设计集团工程建设咨询有限公司  上海市  200040
        摘要:针对大型数据中心项目验证测试过程中业主关注的问题,比如对验证测试单位的选择、假负载的位置和路由、以及空调间内的气流组织以及业主其他部门意见等,从工程管理角度用案例阐述具体解决方式,为其他IDC项目工程提供借鉴和参考。
        关键词:互联网数据中心;验证测试;假负载;工程管理;电源使用效率
        Focus on several problems in the engineering management of the Test and Verification of IDC
        【Abstract】Aimed at the problems concerned by owners in the engineering of large IDC,such as how to choose a Test and Verification team,the location and route of the dummy load,air distribution in the AC room,as well as to pay attention to the suggestions of other departments of the owner etc.,this article describes the solutions with special cases from the point of view of engineering and management,,to provide reference for other IDC projects’ engineering.
        【Key words】Internet Data Center(IDC),Test and Verification,Dummy Load,Engineering Management,Power Usage Effectiveness(PUE).
        随着社会经济水平的提高、信息化建设步伐的加快,数据中心已成为电子信息技术必不可少的基础设施,从现有的互联网、电信网、广电网等,到即将组建的物联网,电子信息的传输、运算和存储都离不开数据中心的支持。随着信息技术的不断发展,以及功能需求的快速提升,数据中心机房,尤其是IDC机房设施的规划、设计、选型和施工成为一项极其繁杂的系统工程。
        一、验证测试的定义及其重要性
        许多传统的机房建成之后,经历多年一直没有出现大问题,但是由于市场侧需求的与日俱增,负荷逐渐增大、设备的日益老化,机房的安全运行面临着越来越大的风险。配电系统以及电缆发热逐步加剧,类似开关故障或线缆虚接发热等现象也层出不穷。不仅是配电系统,作为数据中心负荷担当的空调系统的散热问题,也常令开发者一筹莫展。那么如何最大程度的避免未来数据中心在运维过程中出现此类问题,便成了重中之重。
        传统的验证测试,是在数据中心机房完工后,对机房系统通过模拟带载的耐压测试以及基于运维流程的整体的故障和灾难预演的步骤测试。把数据中心作为一个整体,并配置假负载进行100%满负载测试验证,来测试所有配合的系统,对包括从最前端的高压系统,到柴油发电机、UPS系统模块,以及机房内部的制冷系统,进行带载的测试,以确保通过联合测试来确认整体系统的可行性、可靠性,并对机房范围内所涉及设备设施的施工工艺、电气连接(含精密配电柜、工业连接器等全部电气设备设施)进行可靠性测试。因此,验证测试作为新建数据中心投产前对基础设施部分的一次全面检查和考验,尤其是供配电和空调系统,将直接影响数据中心的安全运行。然而笔者认为,广义的“验证测试”不仅在于实施阶段,而应涵盖项目的全寿命周期。
        二、全过程验证测试的必要性
        1.决策控制
        当业主最初有建设数据中心的需求时,大多也只是有一个大体框架的构想,但仍不清楚要以怎样的规模建以及在哪里建,这时就需要对业主的需求进行验证,确保其合理性与可行性。此后,在设计院进行规划设计时,要对设计院的设计图纸进行方案优化、验证,从初期考虑较低PUE值的方案并充分考虑后期运营效果,同时制定验收标准和针对性的验证方案。
        2.实施控制
        当进入到施工阶段时,现场条件难免会存在限制,个别施工单位也许认为,施工现场的小改动并无大碍,其实不然,一些小细节的变更,可能就会影响数据中心后期的运行(例如:墙体需要后期开凿的部位,若不采取合理的封堵措施,就存在防鼠隐患),所以需要在过程变更之前进行验证控制;
        再比如,在分期交付使用的项目过程中,业主考虑到后期各数据中心单体之间的数据互联需求,提出了在已交付运行的单体及即将建设的单体之间增加连廊,仅供数据传输。此刻就需要对此构想进行评估,同时形成初步方案并进行多方验证,包括设计、造价、政府报批、消防报验等诸多环节,此外还需要验证复核连廊实施阶段对已运行的系统可能造成的影响。如果有需求就立即实践,那么就可能产生一系列的连带反应。此时对方案进行多方位的考量评估,对内外部环境进行反复验证测试,方能有效地满足业主需求。
        3.交付运维
        传统建设项目的机房施工完成后,施工和监理单位会配合各产品的厂商,仅仅做一些设备的调试,就让业主验收,此种验收方式在IDC建设中往往会存在诸多隐患。因此,在IDC竣工验收的环节,要求聘请第三方测试单位,不仅仅是要对单系统调试,还要做单元调试、集成调试、综合联调测试、满载压力测试、灾难切换演练等,并出具相关资质(CMA、CNAS)的报告,业主可以依据此测试报告,委托第三方检测机构向中国质量认证中心申请《数据中心场地基础设施服务评价证书》,通过国家级认证,确保数据中心的可靠性,为数据中心的运维提供一份保障。
        三、验证测试单位的选择
        在全过程各个阶段当中,实施阶段的控制是相当重要的,而要保证实施阶段的质量,必然要对验证测试单位进行严格管理。
        1.资质把控
        验证测试主要包含设计、工厂验收、到货验收、设备调试、系统联调及运维测试等阶段。许多人认为只要选择最优质的设计单位,用最好的产品,找最好的施工单位,建立起来的IDC就不会有问题,然而从过去多年的案例来看,事实并非如此。为了保证各阶段的顺利实施,首先需要选择资深的第三方测试团队,并且配备技术经验丰富的专业数据中心测试人员。尤其对于类似包含1000个机架以上的大型或超大型数据中心,更需要对测试团队的过往案例予以严格审核,需要其充分理解整个大型数据中心系统需要联合验证调试的项目及内容,并知晓IDC的核心风险点。


        2.进度把控
        对于第三方测试单位介入项目的时间,同样需要严格把控。在IDC机房正式交付的节点之前至少2个月,应该完成对其的招标工作;并且在验证测试实施过程前1个月,应当安排各专业工程师提前进入施工现场,检查项目情况,提前发现项目隐患点;此外,整个验证测试的周期,不应低于25个工作日,以保证对整个系统的全面查验。
        四、对验证测试单位实施过程的控制
        在完成对验证测试单位的资质审查,且团队专业人员进场后,验证测试过程的控制便成为了关注的重点。
        1.验证测试制度及方案的建立
        根据业主实际需求及企业规范,制定相关的验收测试方案,通常包含:
        1)机房周边和外观检验(又称目视检查),此部分以机房建设施工质量、设备运行状态、周边安全及运维工作条件为主要内容,;
        2)各系统的设备运行测试验证,包括数据中心内配电、空调、自控、消防、监控、安防等各系统的功能、容量和故障冗余能力等进行的全面测试验证;
        3)运维能力的检验,包括数据中心日常基础设施及网络的日常运维管理、7×24小时应急响应能力、机房物理安全管理能力、现场人员专业技能、各专业人员对数据中心各系统掌握程度等。
        2.验证测试中的问题
        笔者在以往的验证测试当中,遇到形形色色的问题项,涵盖各种风险值。接下来,笔者在此抛砖引玉,以华东某传统大型IDC及华北某新型微模块式(T-Block,又称方仓)大型IDC为例,简要梳理过程中需要引起格外关注的问题。在工程管理中,做好对于此类问题的预控,更有利于验证测试顺利实施。
        1)10kV电源的接入及时性:10kV电源的接入实施涉及电缆敷设、端接、交接试验。需要在计划编制时给10kV电源接入预留足够时间;
        2)调试定值与正式定值的确认:项目进行过程中,由于调试及第三方测试需求,理想状态需要出具一版调试定值,方便项目的合理推进。在项目正式投运后,需要调整定值至正式版,以便保护项目各设备的安全运行。此项工作需要在设备完成前就确定,以利项目的有效推进;
        3)假负载的位置和路由:数据中心对于电源的带负载切换要求较高,所有在日常测试过程中需要配置假负载来进行调试,而假负载的合理布置对于现场的电缆布局和成本控制有一定成效;
        4)空调间内的气流组织直接影响到IDC的空调效果,借助CFD软件可以模拟房间内的空气分布详细情况,从而更好地指导设计。在方仓项目中,CFD更是验证空调方仓是否满足设计功能需求的重要工具;
        5)对于方仓工厂标准化精细制造:所有方仓产品在出厂前,原则上均应在工厂内通过抽查测试。方仓内部设备基本在工厂内进行安装,项目园区现场仅进行方仓间的拼接及必要的设备管线敷设、端接、调试、验证工作;
        6)对于方仓模式的独特性,空调方仓布局的独特功能需求,需要引起足够的重视,例如:排水措施应单独设置,与室内除湿及新风排水相隔离;空调配电柜内强电区域应设置绝缘板;空调机组控制器优先采用 PLC 或 DDC,风机应具备自保持功能等等;
        7)在验证测试及各项工作的衔接过程中,原则上,各专业施工单位不得交叉作业,必需交叉时,需协调制定提交交叉作业成品保护方案。各档位应在交叉作业实施前,按既定的交叉作业成品保护方案做好现场的成品保护工作,并报区域协调负责人验收;
        8)在测试过程中,需要真实反馈每日测试结果及次日工作计划,对正常数据及异常数据均要做好记录,对于异常的问题及现象,需要配有实际现场图片说明,并严格执行销项制度;
        五、新技术的应用
        在中央的大力推动和媒体的轮番宣传下,“新基建”火爆了。无论从疫后的经济重启,还是未来几年的数字化发展看,“新基建”的地位都非常重要。数据中心虽然是“新基建”的重点基础设施,但和5G网络、交通网络、能源网络等不同,是市场竞争非常充分,且拥有发展多年的成熟的商业化体系。尤其,各地政府相继出台相关数据中心能耗指标管控政策,制约周期内新建数据中心投产规模,再加上新兴行业客户侧的需求量尚未形成相当的规模,而现有行业的客户需求难以扩大国内IDC业务市场规模增速,整体市场是逐步趋于成熟的。
        数据中心作为一种高能耗、低收益的产业。特别是互联网公司的IDC,消耗着本地能源,却服务于全世界的业务,最后的收益也难以转化为当地税收。令人鼓舞的是,很多运营商在降低数据中心用电增长率方面采取了重大措施。数据中心功耗通常支持计算能力及其数据中心的散热需求。其目的是推动更多的节能实践,因此发展了PUE这一概念。
        然而实现完美PUE的代价也很高昂。要实现更低的PUE,一些解决方案包括在寒冷地区运营数据中心,这些数据中心产生的热量使建筑物变暖,并使用外界冷空气为IT设备制冷,同时设计了可以在高环境温度下运行的服务器,以消除机房空调的应用。此外,类似新型冷热通道的布置、浸入式液冷、HVDC、母线到机柜供电系统等技术的应用,同样在追求更低PUE值的方面,提供了诸多解决方案的尝试和实际进展。
        六、结语
        随着更多新技术的应用,对于全过程验证测试也提出了更高的要求。验证测试作为数据中心建设与运维的桥梁,在保证数据中心高质量平稳交付、检验数据中心可用性、降低初始故障率,提高系统效率、提供有记录的识别运行风险、提升运维团队实战能力、减少运维操作故障等诸多方面,都有着显著作用。
        本文限于篇幅原因,仅选取了笔者参与项目过程中业主关注的一小部分问题做了简要介绍。希望本文可以抛砖引玉,让我们的工程管理同行们重视业主需求的变化,在全过程管理过程中提供更为精细化的产品和更加及时合理有效的服务。
        参考文献:
        [1]谢静,数据中心空调系统的测试验证,《电信工程技术与标准化》,2017年04期
        [2]张晨昱,论数据中心第三方验证测试,《UPS应用》,2019年第4期
        [3]张春阳,数据中心验证测试的基本情况测试环境的搭建.《UPS应用》,2016年02期
        作者简介:
        石磊(1991.01-),男,大学本科/双学士学位,工程师,建设工程管理;
 
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: