全生命周期管理，是趋势更是未来

作者：施耐德电气IT业务部服务业务及能力中心总监王晓军发布时间：2018-12-19

分享到

在数据中心全生命周期管理领域，施耐德电气起步很早，拥有最全的产品线，还有多年的行业经验，后台有大量的资源支持等，可以真正参与到数据中心生命周期的每一个阶段之中并实现积极的反馈循环。

世界正处于新一轮科技革命和产业变革之中，科学技术还从来没有像今天这样深刻影响着我们，从国家前途命运到个人工作生活。在这一过程中，数据中心产业作为科技必要的信息基础设施同样也在发生深刻的改变：由于对数据中心可性要求越来越高、对绿色节能的高度重视以及新技术的不断涌现，数据中心很多传统的理念和方法等都面临挑战，从数据中心前期的设计、规划到中期的建设再到后期的运营和管理等环节都迫切需要做出相应的调整。然而，新知识和技能的掌握并不容易，相关人才稀缺，种种因素共同促成了数据中心全生命周期管理服务这一新趋势。

施耐德电气IT业务部服务业务及能力中心总监王晓军

数据中心新变局

近年来，在云计算、大数据、物联网等技术和应用的推动下，数据中心市场出现了蓬勃向上的发展势头。根据中国信息通信研究院、开放数据中心委员会联合发布的《数据中心白皮书(2018年)》，2012-2017年我国IDC市场收入年复合增长率32%，预计2020年我国IDC市场收入规模有望突1500亿元。与此同时，快速成长中的数据中心市场也在发生着变化。

第一，大型和超大型数据中心频频出现。10年前，一个单体能承载6、7万台服务器的数据中心能让业界为之侧目。如今，10万台、50万台服务器的数据中心也都稀松平常。这些大型数据中心大部分来自互联网服务商和专业云服务商。根据相关统计，以AWS、Google、微软为首的全球10个超大规模数据中心其服务器部署量占到了全球服务器保有量的10%，这些大型和超大型数据中心通常拥有成千上万的客户，一旦数据中心出现故障可能带来大范围的影响。特别是有些企业业务与IT的联系非常密切，有些甚至IT即业务(比如金融，托管)，故障不仅影响数据中心的收入，还可能带来不好的社会影响。

第二，绿色节能成为数据中心刚需。绿色数据中心被认为是数据中心发展的必然。近些年，国家一直在积极引导绿色节能数据中心的建设，先后出台多项政策大力推广绿色数据中心先进适用技术。此前工业和信息化部、国家机关事务管理局、国家能源局三部委联合公布了《国家绿色数据中心名单(第一批)》名单，对于绿色数据中心的落地实施进一步进行了政策层面的引导。然而，要很好地实现绿色节能是一个非常复杂的事情，或者说是一个系统工程，涉及多个环节，需要综合考量，需要技术更需要经验。

第三，数据中心市场出现了不少非专业业主。数据中心持续多年火爆的市场行情引来了众多投资者，有一些投资者通过收购直接进入这个市场，还有不少传统数据中心在云计算等需求的推动下需要改造升级，然而，它们的运营者往往欠缺相关的能力，并不能很好设计和运维数据中心，这就需要专业团队的帮助。

第四，数据中心相关技术进步。最近几年软件定义数据中心、模块化、异构计算为代表的新技术对数据中心内部的供电、制冷设计都提出了新的要求，加快了数据中心基础设施领域的进步。比如，AI的兴起带来了高密度计算，单机柜超过8kW的供电需求挑战的不只是供电，对制冷要求也相应提升。同样，锂电池取代传统铅酸电池而兴起的分布式电源正在改变机柜内的部署和数据中心的整体设计和管理。

技术和观念的双重制约

一直以来数据中心的核心诉求有两个：高可用和低TCO，但数据中心的上述变化让我们越来越难以满足上述两个诉求。而另一方面，因数据中心出现故障被频频爆出，故障带来的损失也越来越高，不少企业不得不寻求外部帮助。

今年10月份，Github因为更换海底光缆引发对美国用户服务降级24小时;去年CBRE数据中心停电导致英国航空公司672个航班被取消，预计损失超过1亿英镑。在中国类似的事件也不新鲜。

根据2017年的数据统计，18%的数据中心在一年内出现过宕机等业务中断的情形，另有50% 的企业虽然没有业务中断，但也发生过异常事件。其原因包括规划设计阶段因控制成本导致的建设质量低下、运维阶段出现的体系流程不完善、人员资质和数量不够导致的维护不足等诸多因素。与此同时，每次事故的损失越来越多。根据波洛蒙研究所发布的“数据中心中断成本”报告显示，自2010年以来，停机时间的平均成本上升了38%，平均每起事件成本为74万美元，损失从每分钟926美元到17244美元不等。

造成这一现状的根源不在于数据中心的管理者和运维者不重视，根本原因在于要满足数据中心高可用、高可靠，同时还要降低整体运营成本，非常困难，其中有技术方面的原因更有观念和认识上的原因。

我们必须承认，和美国等先进国家相比，我们对数据中心的建设和运维的研究要晚，对其理解和美国等相比有一定差距。比如，对于数据中心运维我们常常满足于不坏，只要设备不报警就是好运维，但是在欧美，运维除了不坏外，还要让客户的数据中心有更高可靠性以及更好的经济性，这就是观点上的差异。我们很多数据中心在设计和建造的时候，往往只考虑到建设阶段需要投入的成本，没有为数据中心的可持续发展做太多考虑。而不恰当的设计和建设尽管可能会节省初期投入，但会给后期满足可用性、可靠性和节能的要求带来更大挑战。

除了观点上的也有技术上的原因，数据中心的运维一直以来非常依赖个人的经验。比如，数据中心设计完成后要真正施工前，是要对设计进行审查以发现错误，这非常依赖审查者的个人经验，经验丰富就能及时发现错误，否则就得到真正实施后才发现。不过，今天随着技术的不断进步，人们逐渐研发出很多工具可以帮助来做这件事，甚至可以直接借助工具来进行设计验证，在实际建设前对整个设计进行一次模拟故障、性能推演服务，以降低系统设计风险，并优化核心指标(PUE、可用性)，从而最大程度地发现设计错误。

另外，我们在技术的跟进上过于谨慎。比如，数据中心配电系统我们最常用的设计是UPS双机备份的双路供电，原来这样设计是因为UPS的旁路技术不足以保证断电后无缝切换，但今天随着施耐德电气E变换运行模式这样的技术日渐成熟，可以通过旁路直接用市电供电，从而既保证了可靠性又降低了能耗。有研究显示，和2007年PUE为2.0的数据中心相比，最多能让PUE降低11.5%。但我们在新一代数据中心的设计中大胆采用这些技术的并不多。还有，在制冷技术方面，国外采用自然冷却的案例越来越多，不少数据中心充分利用自然条件制冷，而把传统的制冷系统作为后备，从而降低了制冷系统的能耗，甚至海底数据中心、矿洞数据中心等非常规数据中心不时出现在媒体报道中，而在中国这方面才刚刚开始。

所喜的是，我们也在进步，比如这几年在张北、宁夏中卫建了很多数据中心，充分利用这些地方的气候条件来制冷，PUE值得以大大降低。施耐德电气参与设计和建设的河南中原云案例，该项目中我们因地制宜，充分利用紧邻热电厂产生的具有一定温度、压力的余热，作为溴化锂制冷机的动力，将热电余热转换为数据中心的冷源。该制冷方式电能消耗仅是电力驱动制冷机用电量的2%～3%，大幅度降低了数据中心运营成本。

数据中心的全生命周期管理

如上所述，数据中心是一个非常复杂的系统，要满足高可靠性、高可用性以及低成本的要求并不容易，不是单靠某个环节就能实现的，而是需要全面的、系统的考虑和评估、周密的实施和长期的优化和改进，换而言之，要对数据中心从前期的规划、设计、建设、部署、运维和优化实现数据中心的全生命周期管理。

本质上，数据中心全生命周期管理是通过一套工具和方法论来让我们能系统、周密、长期的来设计和运营数据中心，而不局限在一个点、一个设备或者一个阶段。具体来说，从数据中心的咨询和设计阶段开始，它就要指导设计人员以前瞻性的眼光来进行，不光是看到初期投资，同时也看到将来运营阶段的可用性怎么保障、高经济性怎么保证;在数据中心的建设阶段，它指导人们挑选最合适的产品(包括UPS、空调、配电设备)来保证系统级的高可用性和高节能;在运营阶段它指导运维人员通过对供电、制冷等不断优化来满足IT设备的供电制冷的需求，同时降低能源消耗。

但是，很少有数据中心的业主(或拥有者)具有这么全面的能力，这也就是数据中心全生命周期服务出现在市场的重要原因之一。有必要指出的是，数据中心全生命周期管理服务并不是新事物，但是今天数据中心行业的新变化让它成为市场的一个新热点。

施耐德电气很早就提供这项服务，相比其他跟进者，施耐德电气的数据中心全生命周期服务是一个沉淀了自己在数据中心领域20多年的积累，并基于收购公司Lee Technologies的先进方法论，是覆盖数据中心设计、建造、运营的一体化解决方案，可协助客户建立起内部运维管理标准和M&O认证体系，从而便于客户日后因业务扩展等需求实现数据中心的快速部署和运营管理。

小结：

数据中心是一个长期的投资，全生命周期管理是必然趋势更是未来。在数据中心全生命周期管理领域，施耐德电气起步很早，拥有最全的产品线，还有多年的行业经验，后台有大量的资源支持等，可以真正参与到数据中心生命周期的每一个阶段之中并实现积极的反馈循环。除了完整的、标准化的流程和专家级的维护服务，施耐德电气还可以提供各种数字化工具，比如数据中心设计门户(Design Portal)、权衡工具、以及基于EcoStuxure架构的数字化管理及服务平台，这些都是施耐德电气与众不同之处。希望通过我们的帮助，能让更多的数据中心管理者能够真正聚焦于自己的业务，更好地推动企业业务的发展。