我们要讲述的就是某省级体彩中心下辖投注站数据遗失及补救的案例,该投注站由于数据遗失对于日常业务产生了很大的影响,迫切需要一套解决方案。彩票的业务模式是将散落的数据“集中”到省级中心的数据库中,并上传国家级数据备份中心,这是一个典型异地、异构数据备份系统。主要特点体现在:
我们讲述故事中,所幸的是丢的仅是个别“羊”只——个别投注站上传数据丢失、利用较窄带宽传输数据“失真”——局部号段错位、丢失,等等,好在还没有丢失“羊群”,但这个警钟已敲响,彩票在投注站打印出来就形成了合同关系,如中奖数据丢失还需给付奖金造成的损失都是由省体彩中心“买单”的。
究其上述某省级体彩中心数据丢失灾难的原因是因为存在手工上传数据时低带宽环境的信号延时、不同数据库类型间转换数据等潜在的漏洞,这些漏洞更需“补牢”,而且这次“补牢”需要一个彻底的解决方案——实现数据库异构备份:各投注站与省级中心间、各省级中心与国家中心间都要建立跨平台的“N+1”模式容灾。 纵观各路数据库备份产品中,能够实现异构备份者已是凤毛麟角。再论性能优劣、技术前瞻性、客户口碑,IBM TSM(Tivoli Storage Manager)备份管理工具实为最佳选择。
IBM TSM全面支持主流平台和主流厂商的数据库系统,包括Oracle、DB2、Informix、SQL Server、Sybase等。对于异构数据库(以Oracle为例),使用TSM的数据库保护模块TSM for Database/Oracle能够很好的对其进行全面的保护——使用数据库的备份接口,以透明化的方式提供数据库管理员一种进行数据备份的方法。基本原理是:
仍以Oracle为例,备份Oracle数据库需要TSM for Database/Oracle,它利用ORACLE数据库提供的备份接口RMAN来对数据库进行备份。Oracle备份工具RMAN能够生成需要备份的数据文件,并能够保证数据库的一致性,所有的热备和逻辑备份都通过Oracle RMAN唯一接口进行。Tivoli可以利用这些工具实现对Oracle数据库的各种对象进行在线/离线备份,另外通过RMAN增量备份的机制,TSM可以实现对Oracle数据库的增量备份。而在被备份数据的输出上采用了和TSM结合的方式,TSM就是一个双向管道,一方面利用数据库的API和数据库备份软件连接,另一方面利用TSM的API和TSM连接,将数据库备份软件的输出传送到TSM管理的备份介质中。在Oracle中,直接设置了和TSM的连接,只需要在Oracle的相关配置中设置TSM服务器的名称和IP地址即可。为了减少DB主机压力和减少备份时间,对于Oracle数据库,同时能够提供数据库的增量备份,仅仅备份包括自从上次备份过程以后被改变过的data files的data blocks。这些数据可以和上面谈到的文件备份分开,存在不同的存储池中,通过不同的存储策略来进行管理。
恢复同样可以根据发生故障的种类,在数据库管理员的判断下,灵活的针对数据库的任意一个部件进行。如果业务数据量较大,建议对数据库的全备份每天或每两天做一次,而每隔一段时间备份数据量较小的Transaction Log。当发生数据损坏或丢失时,先恢复最近备份的数据库和Transaction Log,再用Transaction Log进行Forward Recovery,从而将数据库恢复到最近一次备份Transaction Log时的状态。在这种备份策略下,最坏情况会丢失一段时间的数据。通过将备份Transaction Log的时间间隔减小,例如减小到每小时备份一次(这一备份时间间隔应根据Log数据量和网络带宽情况制定),能够最大限度地减少数据丢失;对于 master database的数据,由于数据量不会太大,而且数据变化相对较小,所以建议每周做一次全备份。
class='fit-image' onload='javascript:if(this.width>498)this.width=498;' onmousewheel = 'javascript:return big(this)' width="494" height="904" border="0" alt="" src="http://images.51cto.com/files/uploadimg/20110721/1044420.jpg" />
综上所述,使用TSM能够灵活的对用户的异构数据库自动化的定时进行备份的工作,已达到容灾的效果——应用到上述省级彩票中心的案例中,在全省方位内没有对终端数据库进行改造的前提下,可以将各投注站或县市级体彩中心数据“整齐划一”,也彻底消灭了数据丢失!而且与主要竞争对手的备份方案各方面对比,详见下表,均有优势。通过上述技术性能的阐述,TSM作为当今面临数据爆炸式增长环境中,企业成功管理和控制 “信息浪潮”的利器,应该被人信服的。唯一有所忌惮的是先期成本的投入,诚然TSM这样优秀产品是有代价的。但“补牢”后,不仅不会再丢羊,而且羊儿会更强壮!——有助于提高IT操作的效率, 帮助削减与存储管理相关的成本,特别是数据灾难的“沉没成本”。