服务器双机容错方案
需求分析:
目前,今天的企业越来越离不开信息化。信息化使得企业大大提高了工作效率。
然而,企业的信息化建设情况并非十分完善,还有许多亟待解决的问题。
◇ 整个企业的数据只是存放在服务器的硬盘或本地计算机的硬盘上,一旦硬盘损坏,那么数据
将丢失,造成不可估的损失。
◇ 应用软件运用在一台单一的服务器上,一旦服务器出现故障,整个网络将瘫痪。
◇ 有的服务器自带有阵列卡,但服务器出现故障后,硬盘中的数据将无法恢复。
而一旦系统出现故障,就会影响整个企业的正常运作,收发文件、电子文档的批阅、各级档案的调阅、生产管理等系统都将停滞或瘫痪,如果系统在短时间内无法恢复,您可能将面对生产,库存,销售,财务损失、等各种问题,势必给企业带来巨大的经济损失。
因此,如何能够保证企业系统的正常运行,保证系统数据的安全,就非常重要。
相关机构的调查表明,在服务器的硬件中,最容易发生故障的是可动的机械部分既硬盘(故障发生率为52%),其次是内存(占23%)和电源(占6%),三者之和约占硬件故障的80%以上。在软件故障中,WINDOWS的事故约占60%,由应用引起的故障约占40%。
绝大多数用户没有采取容错措施,发生问题的情况很多,许多用户都发生过由于硬件或软件或人工操作带来的核心故障,而只好暂时中断系统,人工进行办公,可相应的数据就缺乏(数据丢失)。而系统故障也需要计算机中心的人员进行清除,往往花费最短2小时到一天的时间,麻烦还不止于此,用户部门还需要将系统瘫痪时发生的办公数据重新向修好的系统进行输入,以保存丢失的数据。可见,由于未采取容错措施,而为用户带来的麻烦。若干专业人员的重复劳动,时间的耗费,为用户带来的损失,不言自喻。
现代IT技术认为,一个成功系统中的数据与作业的重要性已远远超过硬件设备的本身。
在成功地解决了数据的安全存储问题后,摆在我们面前的是整个Client/Server结构中最重要的Server端的安全性。因为单服务的模式已不能够可靠地保障整个系统的安全。服务器的故障随时可能发生,并且也会影响到整个Client/Server系统的安全。而这一切将给用户带来巨大的损失。在我们所提供的安全容错解决方案中,可提供99.99%的容错安全,可在每周7*24小时状态下高效安全地运行。
这一方案的思想是:
- 在Server端采用双冗余Server;(两台Server)
- 数据保存在安全可靠的存储介质上;(可提供RAID保护的Proware磁盘阵列)
- 采用高可靠性的容错软件;(DataWare双机容错软件)
解决方案:
(双机热备份方式)
结构示意图:

硬件配置
两台相对应的服务器,一块本地硬盘,每台服务器内装一或两片以太网卡(Network Card);一台可接两台服务器的Proware磁盘阵列。
操作系统及应用
WindowsNT/2000/2003,Sbase、Oracle等数据库,相应的应用,DataWare双机容错软件。
系统配置
硬件连接参见结构示意图,两台服务器通过SCSI卡接口及SCSI线与磁盘阵列连接,进行数据传输;两台服务器通过RS-232接口及RS-232线连接,用于DataWare容错软件进行“心跳侦测”;两台服务器通过网卡及网线与网络连接,进行数据传输与故障服务器的切换;服务器本地硬盘上安装相应的操作系统,相应的应用,数据库引擎及DataWare容错软件,用户数据放在磁盘阵列上。
本套双机容错解决方案采用双机热备份加磁盘阵列的方式,以保障整个网络系统的稳定安全与数据安全。
所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)。当工作机经过维修恢复正常后,它会将其先前的工作自动抓回,恢复以前正常时的工作状态。
对于本系统,Active Server作为工作服务器,Backup Server 作为备份服务器。在正常情况下,Active Server为网络信息系统提供支持,负责整个网络的正常运行,同时,通过侦测链路RS-232监视Backup Server的运行情况,但发现Backup Server出现异常时,将及时通知管理员解决,确保切换的可靠性。Backup Server通过侦测链路RS-232监视Active Server的运行情况,当侦测Active Server出现异常,不能支持信息系统运营时,通过切换,将主动接管Active Server的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行。当出现异常的Active Server 经过维修恢复正常后,它会自动抓回先前的工作,恢复以前正常时的工作状态。由于大量的数据存放在磁盘阵列上,所以整个切换过程不回牵涉这些数据,并且不需要占用有限的网络资源,提高了切换的速度,更进一步的提高了数据的安全性。
软件
高可靠性容错软件系统(DataWare)
◆ 支持多平台的容错软件
DataWare容错软件包可支持SCO Unix、Windows NT/2000、Sun Solaris、Linux多种版本。根据应用平台的需求,可使用相应的版本。
◆ 功能
◇ DataWare可防止错误,提供故障安全防护和零故障操作环境
◇ DataWare采取高可靠度与高效率机制减少系统宕机,停机时间防范错误,提供故障警告
◇ DataWare可设定故障排除后,自动或手动回复
◇ DataWare提供网络卡本地故障排除
◇ DataWare安装时不需要更改操作系统的核心,变更应用软体和特殊的硬件
◇ DataWare采用直觉式与GUI图形使用者界面让管理者在远程或本地管理
◇ DataWare不需要复杂的设定与操作,安装维护方便
◆ 强大的管理工具
◇ 易操作的图形操作使用者界面(DataWare Unix或Linux采用Java语言设计,使用者可在远程浏览器上管理)
◇ 及时的操作状况监视
◇ 系统管理者可在区域或广域网络通过个人计算机管理,及时在操作画面显示两部主机的操作状况
◆ 支持的对象资源
◇ Volumes资料卷 ◇ IP addresses IP地址
◇ Services服务 ◇ User Defined 使用者定义
◇ Computer alias names计算机别名(DataWare NT)
◇ File shares 分享的档案(DataWare NT)
◆ 支持的应用软体
◇ NFS
◇ 国际互联网服务(WWW,FTP,等)
◇ 数据库(MSSQL Server,Oracle,Sybase,Informix)
◇ Lotus Notes Server,Microsoft Exchange Server
◇ 企业网络管理
- 使用TCP/IP网络协议之Client/Server应用软体
硬件
容错磁盘阵列系统
◆ 豪威Proware磁盘阵列提供数据安全的保障:
“数据与主机电气分离”观念倡导将重要数据及作业存放在与主机分离的外部智能磁盘阵列上,并且加以本地智能管理,其安全性得到特别保护,扩展能力不受主机限制,数据I/O不需主机CPU分时,双机容错时也不需要占用有限的网络资源以传输备份数据。它不仅解决了以前存在的问题,而且全面突破了长期困扰系统性能的外存I/O瓶颈,使得这种观念迅速成为当前I/O技术的新潮流。
Proware专业化的结构设计,用全硬件方式保证数据的安全性。
固化的RAID校验(Redundant Array of Inexpensive of Disk),保证任意硬盘故障时,其上数据不会丢失。豪威Proware磁盘阵列用硬件方式支持RAID 0,1,0+1,3,5校验。
除此以外,豪威Proware磁盘阵列还在系统结构上做了如下精心设计以保证数据安全性:
◇ 所有硬盘均配有热插拔硬盘盒,可带电热插拔
◇ 机箱内配置有热插拔双冗余电源及双风扇
◇ 每个阵列硬盘盒自带冷却风扇
◇ 高级合金硬盘盒保证散热
◇ 每个硬盘盒上均配有防静电合金屏蔽罩
◆ 豪威Proware磁盘阵列:作业的连续性
豪威Proware磁盘阵列支持双机容错。
阵列背后提供两个(可扩展)主机SCSI接口,通过SCSI电缆与主机连接,主机的数据及应用程序均可组织在阵列上,在主机上可以只保留一块本地硬盘以安装操作系统及容错软件。
豪威Proware磁盘阵列支持双机热备及双机双工两种工作方式。
豪威Proware磁盘阵列配合不同操作系统平台的DataWare双机容错软件包,支持双机自动在线侦测,双机故障时,自动在线切换,前端作业连续运行,故障主机修复后可重构双机容错系统。
◆豪威Proware磁盘阵列:提升I/O性能
豪威Proware磁盘阵列自带专用Intel RAID控制器,32M-512MB缓存,RAID RISC专用芯片组,所有RAID校验恢复及格式化工作均内部完成,不需主机CPU分时;
磁盘阵列CPU及缓存自动完成预读/预写工作,主机读写时不需等待;
所有阵列硬盘均由内部SCSI并行通道支持并行读写(Multi-SCSI Parallel Channel);


