返回顶部

机房数据搬迁解决方案

项目介绍: 机房 是作为一个分地区中心数据机房使用,包含了oracle数据库,对外服务系统,相关网络设备。核心设备要实现在搬迁时中断时间不超过10分钟,对外服务中断不超过30分钟

项目介绍:机房是作为一个分地区中心数据机房使用,包含了oracle数据库,对外服务系统,相关网络设备。核心设备要实现在搬迁时中断时间不超过10分钟,对外服务中断不超过30分钟。

针对这样的时间上的要求,在制作搬迁方案考虑的因素就比较多,特别是对于时间上的控制,如何能顺利的完成整个搬迁切换,如何能确保每一步实施都是按照搬迁方案落实,这是我在制作搬迁方案时和后期搬迁切换时不得不考虑的问题,所以我认为有以下几点值得大家注意:


机房数据搬迁解决方案

(1)前期对自己所要搬迁的环境有详细的了解,包括老机房的设备系统和新机房的环境,这项工作最好交给一个比较细心同时对于整个系统有着完整理解的同事来进行完成,确定搬迁所涉及的各个设备,对搬迁所产生的影响有个初步的估计,避免盲目的制作搬迁方案,因为一旦方案制定后,就算以后会对初期制定的搬迁方案进行修改,但是人很容易局限于现成的安排中,这对整个搬迁是相当不利的。初期方案是需要很多修改的,这是必然的,所以作为方案的制定人不能因为没有考虑全面被同事发现问题就产生情绪问题,避免焦躁,多与同事沟通,特别是自己不够了解的部分。

(2)在制定搬迁方案时,重要的是全面考量。主要是针对具体的情况进行规划,如:备份设备的数量是否能完全替代现有系统;网络在此次搬迁中是否会进行改变;新购设备是否能按时到位;人员的分工是否能到人,是否有足够的人员进行安排同时保证责任的落实;新机房的硬件环境是否能保障搬迁后设备设施的运行。这些问题在制作搬迁方案前就要考虑周详。在制作方案时,多用流程图,这样可以更加直观体现出搬迁的步骤,对于涉及的搬迁设备和系统,做好相应的标示,最好做到方案中的名称与实际设备系统一一对应,这样在搬迁实施中能更加方便更加直观的执行搬迁方案。

(3)涉及于机房的搬迁,很大的一部分工作其实对于网络的规划,所以先做好一个完整的网络拓扑图对于整个搬迁是有很大的帮助。有很多的公司单位会趁着搬迁这个时机对整个网络进行一些优化,在这其实有利有弊。首先在搬迁是更改现有网络结构的话会很大程度的提升搬迁的难度;同时如果在没有做好相应的应急准备的情况下有可能导致搬迁行动无法回滚。但是又不能看到这样做的好处,所以我想说的是如果决定要通过一次搬迁优化网络结构,那么就要做好各种准备,如:备份设备一定要到位;和其他不受控制的单位(如电信)做好沟通,确保出现问题时能及时切回原来的网络情况;做好各种应急措施;对各种可能出现的故障和问题进行排查,力保做到出现问题都有解决办法。对于本来网络情况就比较复杂的搬迁,最稳妥的方式还是保持原本的网络结构不变,这样搬迁时出现问题的风险较小,并且如果有问题发生由于相关人员对于原本结构都熟悉能更好的处理问题,确保搬迁的顺利。

(4)在搬迁开始前对于新机房的环境之类也要有相应的检查,确定具备了设备运行的条件,特别是一些不太被搬迁人员注意的地方,如机房空调的设置和机房配电的管理,这些其实在实际的搬迁中会对真个搬迁产生巨大的影响。在搬迁设备时,对于相应机柜的安排也是搬迁工作中一大重要部分,在设备安装到机柜时要仔细考虑,这一步可以再搬迁方案中制定(如能具体得到机柜的数量和位置等情况,可在制作搬迁方案是根据规划后的网络体系进行安排);如果不能得到具体的机柜安排,需要再搬迁开始后对设备安放进行规划的情况,那么就需要在实施设备搬迁时尽可能的让负责网络的人员进行机柜安排。设备的安放主要是依靠网络拓扑图,尽量的方便插线与走线,切勿随机性的安装,这样会增大网络的负责度,同时在正式切换时提高很大的出错几率,而且在后期维护时也会产生很大的困难。在这里我的建议是,如果使用防火墙进行网络隔离的话,最好服务器机柜按照防火墙的分区进行设备安装,这样做能最大程度的体现网络的层次。对于网络机柜,由于会有很多的接线,如果能使用理线架,这是一个很好的选择;如果没有那么就需要对网络设备进行规划,我的建议是将网络设备按照其功能进行机柜上架,如安全设备在一块,接入设备在一块,交换设备在一块。对于要使用由运营商提供的线路的情况,在搬迁方案中就要明确与运营商的联系,这些线路不受本单位控制,容易在搬迁时出现无法顺利实施的情况,我的建议是由专人负责联系,确定线路割接的时间点,尽量的提前,争取在搬迁开始前就把这些不受控的因素完全排除。

(5)机房搬迁,人员的分工是一项很复杂的工作。如果搬迁人员没有进行人员分工,有可能导致人不能尽其用,还会出现也许大部分人的注意力关注到一个大的方向而忽略了其他方面,而在搬迁中往往出现问题的就是大多数人没有想到的地方。人员的分工因做在搬迁方案里,在提出搬迁方案时就应该让各个搬迁人员明白自己在此次搬迁中扮演的角色,负责服务器的就专心负责服务器,负责网络的就安心的完善网络,尽量的做到各个方面都有负责人,这样才能最大程度的发挥一个人的能动性。

(6)在搬迁工作有很大一部分工作都是对于新设备的安装调试,如果时间比较紧的话,那么在人员分工后就应该安排相应人员对新设备进行系统的学习,力求在搬迁准备时能尽快的完成新设备的安装和调试。在新设备安装后,由于搬迁切换会使用新设备来替代现有设备,那么对于新设备测试必不可少,也许就是因为一个很细微的差别就有可能导致切换不成功,比如在我们这次搬迁中,由于IBM服务器AIX操作系统的系统时间是使用的夏令时,这一小小的区别导致了整个业务程序起不起来,有由于是在切换中,花了极大的时间进行了排查才找到了这个小问题,由此可见前期对于新设备的测试是多么重要。

(7)对于方案制定后,实施的过程中,力求按部就班,不要突前也不要拖延,尽量的确保每一步按方案实施到位。对于时间的控制也十分重要。这里不仅仅是在方案中实施的时间控制,同时也是指在切换中的时间控制。在实施中,对于方案中的每一步进行有效的时间控制能更加好的执行搬迁方案,对于搬迁人员也能加大对搬迁成功的信心。在切换中,对于时间的控制主要是指在发生预想之外的情况时,对于是否要回滚的把握,是抓紧时间解决问题还是回滚回去然后再排除问题,这就是搬迁核心人员所要注意的地方。

400-0806-056