一.环境介绍 master eth0:192.168.48.128 eth1:192.168.1.228 ---作为主服务器 slave eth0:192.168.48.129 eth1:192.168.1.229 ---作为从服务器 虚拟IP 192.168.48.130 ---通过Heartbeat来实现,对外提供服务的IP 两台服务器将 /dev/sdb4 作为镜像 1.两台都同步时钟(实践证明这个不同步关系不大,但是做下这步也无防) yum install -y ntp ntpdate ntp.api.bz 2.两台都设置hosts相互解析 在 /etc/hosts 文件中加入如下内容: 192.168.48.128 master 192.168.48.129 slave yum 安装: yum -y install drbd83 kmod-drbd83 2.加载模块 [root@master ~]# modprobe drbd 查看drbd模块是否已经加载到内核中了: [root@master ~]# lsmod |grep drbd drbd 300440 0 先确认两台要镜像的机器是否正常, 之间的网络是否通畅, 需要加载的硬盘是否处于umount状态. 在两台主机上都创建硬件设备drbd. mknod /dev/drbd0 b 147 0 //mknod /dev/drbd1 b 147 1 //mknod /dev/drbd2 b 147 2 如需多个drbd设备则依次去创建. 二台机器将/dev/sdb1互为镜相(两台机器配置相同). yum -y install portmap yum -y install nfs mkdir /d //创建共享目录. vim /etc/exports /d 192.168.48.0/255.255.255.0(rw,no_root_squash,no_all_squash,sync) [root@master ~]# chkconfig --level 3 portmap on [root@master ~]# chkconfig --level 3 nfs off [root@master ~]# /etc/init.d/portmap start 启动 portmap: [确定] 两台都配置drbd [root@master ~]# mv /etc/drbd.conf /etc/drbd.conf.bak [root@master ~]# vim /etc/drbd.conf resource r0 { protocol C; #采用C协议,表示收到远程主机的写入确认后,则认为写入完成。 startup { wfc-timeout 0; degr-wfc-timeout 120; } disk { on-io-error detach; } net { timeout 60; connect-int 10; ping-int 10; max-buffers 2048; max-epoch-size 2048; } syncer { rate 30M; } #设置主备节点同步时的网络速率最大值 on master { device /dev/drbd0; disk /dev/sdb; address 192.168.48.128:7788; meta-disk internal; } on slave { device /dev/drbd0; disk /dev/sdb; address 192.168.48.129:7788; meta-disk internal; } } drbd的启动, 激活前面配置的drbd资源 “r0″. (两个节点都要执行) [root@slave ~]# drbdadm create-md r0 出现提示: * If you wish to opt out entirely, simply enter 'no'. * To continue, just press [RETURN] success 现在可以启动drbd了, 分别在两台主机上执行. [root@master ~]# /etc/init.d/drbd start或者service drbd start 设置drbd开机自动启动. [root@master ~]# chkconfig --add drbd [root@slave ~]# chkconfig --add drbd 现在可以查看drbd当前的状态, 然后在master上执行: [root@master ~]# cat /proc/drbd version: 8.3.13 (api:88/proto:86-96) GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by mockbuild@builder10.centos.org, 2012-05-07 11:56:36 0: cs:Connected ro:Secondary/Secondary ds:Inconsistent/Inconsistent C r----- ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:2097052 第一行的’ro’表示两台主机的状态,都是”备机”状态.‘ds’是磁盘状态,都是”不一致”状态. 这是由于,DRBD无法判断哪一方为主机,以哪一方的磁盘数据作为标准数据.所以,我们需要初始化一个主机, 那么需要在centos1上执行. 初始化master(这步只要在主节点上操作) [root@master ~]# drbdsetup /dev/drbd0 primary -o //定义为主节点. 第一次设置主节点时用 drbdadm 命令会失败, 所以先用drbdsetup 来做, 以后就可以用drbdadm了. 再次查看drbd当前的状态. [root@master ~]# cat /proc/drbd version: 8.3.13 (api:88/proto:86-96) GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by mockbuild@builder10.centos.org, 2012-05-07 11:56:36 0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r----- ns:1649664 nr:0 dw:0 dr:1649664 al:0 bm:100 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:447388 [==============>.....] sync'ed: 78.8% (447388/2097052)K finish: 0:00:13 speed: 32,096 (31,124) K/sec 现在主备机状态分别是’主/备’, 主机磁盘状态是’实时’, 备机状态是’不一致’. 在第3行, 可以看到数据正在同步中, 即主机正在将磁盘上的数据, 传递到备机上. 现在的进度是0.3%. 设置完之后的第一次同步耗时比较长, 因为需要把整个分区的数据全部同步一遍. 第一次同步完成之后, 就可以对drbd的设备创建文件系统了: 稍等一段时间, 在数据同步完后, 再查看一下两台机器的DRBD状态: [root@master ~]# cat /proc/drbd version: 8.3.13 (api:88/proto:86-96) GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by mockbuild@builder10.centos.org, 2012-05-07 11:56:36 0: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r----- ns:2097052 nr:0 dw:0 dr:2097052 al:0 bm:128 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0 [root@slave ~]# cat /proc/drbd version: 8.3.13 (api:88/proto:86-96) GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by mockbuild@builder10.centos.org, 2012-05-07 11:56:36 0: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r----- ns:0 nr:2097052 dw:2097052 dr:0 al:0 bm:128 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0 现在磁盘状态都是’实时’, 表示数据同步完成了. #查看drbd的实时状态,我喜欢用service drbd status drbd的使用. 现在可以把主机上的DRBD设备挂载到一个目录上进行使用. 备机的DRBD设备无法被挂载, 因为它是用来接收主机数据的, 由DRBD负责操作. 在master主服务器上执行: [root@master ~]# mkfs.ext3 /dev/drbd0 [root@master ~]# mount /dev/drbd0 /d 注意: secondary节点上不允许对drbd设备进行任何操作, 包括只读. 所有的读写操作只能在primary节点上进行. 只有当primary节点挂掉之后, secondary节点才能提升成为primary节点, 继续进行读写操作. 如在备服务器上 [root@slave ~]# mkfs.ext3 /dev/drbd0 mke2fs 1.39 (29-May-2006) mkfs.ext3: 错误的介质类型 while trying to determine filesystem size 五、Heartbeat的配置过程 真实的服务器之间的连接用交叉线连接,本着简单高效的原则,直接购买即可。 1. 安装, 在两台主机都同样的安装. yum -y install heartbeat #奇怪的事,此命令要执行二次,不然heartbeat还真安装不上去,奇怪的问题。 其中Heartbeat配置共涉及3个文件. /etc/ha.d/ha.cf /etc/ha.d/haresources /etc/ha.d/authkeys /etc/ha.d/resource.d/killnfsd 2. 二个节的配置的配置文件ha.cf都是一样, 文件内容如下: [root@master ha.d]# vim ha.cf logfile /var/log/ha-log #定义HA的日志名字及存放位置 logfacility local0 keepalive 2 #设定心跳(监测)时间为2秒 deadtime 10 warntime 10 deadtime 5 #死亡时间定义为5秒 ucast eth1 192.168.1.229 #采用单播方式,IP地址指定为对方IP auto_failback off #服务器正常后由主服务器接管资源,另一台服务器放弃该资源 node master node slave #定义节点 [root@slave ha.d]# vim ha.cf logfile /var/log/ha-log #定义HA的日志名字及存放位置 logfacility local0 keepalive 2 #设定心跳(监测)时间为2秒 deadtime 10 warntime 10 deadtime 5 #死亡时间定义为5秒 ucast eth1 192.168.1.228 #采用单播方式,IP地址指定为对方IP从服务器心跳接口 IP,主从之间相互指定对方IP auto_failback off #服务器正常后由主服务器接管资源,另一台服务器放弃该资源 node master node slave #定义节点 2. 编辑双机互联验证文件: authkeys [root@master ha.d]# vim authkeys auth 1 1 crc [root@master ha.d]# chmod 600 authkeys //需要将 /etc/ha.d/authkeys设为600的权限. [root@slave ha.d]# chmod 600 authkeys 3. 编辑集群资源文件: haresources root@master ha.d]# vim haresources master IPaddr::192.168.48.130/24/eth0 drbddisk::r0 Filesystem::/dev/drbd0::/d::ext3 killnfsd [root@slave ha.d]# vim haresources master IPaddr::192.168.48.130/24/eth0 drbddisk::r0 Filesystem::/dev/drbd0::/d::ext3 killnfsd #为服务器加VIP,此文件二台机器上配置一样,千万不要自做聪明在另一台机器上配置成slave 4.编辑脚本文件killnfsd,目的其实就是为了重启nfs服务。这是因为NFS服务切换后,必须重新mount一下nfs共享出来的目录,否则会出现stale NFS file handle的错误。 [root@master ha.d]# vim /etc/ha.d/resource.d/killnfsd killall -9 nfsd; /etc/init.d/nfs restart; exit 0 [root@master ha.d]# chmod 755 /etc/ha.d/resource.d/killnfsd [root@slave ha.d]# vim /etc/ha.d/resource.d/killnfsd killall -9 nfsd; /etc/init.d/nfs restart; exit 0 [root@slave ha.d]# chmod 755 /etc/ha.d/resource.d/killnfsd 5. 在二个节点启动Heartbeat即可,先在主节点启动 [root@master ha.d]# service heartbeat start [root@slave ha.d]# service heartbeat start 加到启动项 [root@master ~]# chkconfig --add heartbeat [root@slave ~]# chkconfig --add heartbeat #这时就可以在另外的机器上面,正常挂载192.168.4.194:/d到自己的/mnt/data下进行正常的读写了,client会认为这个就是一个提供NFS的机器。
生产环境测试:
测试一、在另一台centos下挂载192.168.48.130:/d,向里面写数据时,忽然重新启动主DRBD,看此时写数据有影响不,发现DRBD+Heartbeat正常切换还是需要些时间的; 测试二、正常状态下关机Primary机,然后看数据有无问题,观察DRBD的status;然后等主机启动后,再观察变化,然后再关机secondary,然后再启动,观察DRBD变化及Heartbeat起作用了没。 测试三、假设此时把primary的eth0 给ifdown了, 然后直接在secondary上进行主的提升,并也给mount了, 发现在primary上测试拷入的文件确实同步过来了。之后把primary的 eth0 恢复后, 发现没有自动恢复主从关系, 经过支持查询,发现出现了drbd检测出现了Split-Brain 的状况, 两个节点各自都standalone了,故障描术如下:Split-Brain detected, dropping connection!这个即时传说中的脑裂了,DRBD官方推荐手动恢复(生产环境下出现这个机率的机会很低的,谁会去故障触动生产中的服务器) 以下手动恢复Split-Brain状况: i. 在secondary上: drbdadm secondary r0 drbdadm disconnect all drbdadmin -- --discard-my-data connect r0 ii.在primary上: drbdadm disconnect all drbdadm connect r0 当主节点状态变成 primary/unknow 从节点此时是 secondary/unknow 时,可以采用以下步骤进行解决: 1.从节点操作: drbdadm -- --discard-my-data connect all 2.主节点操作: drbdadm connnect all 基本以上两步就OK了! 测试四、假设Primary因硬件损坏了,需要将Secondary提生成Primay主机,如何处理,方法如下: 在primaty主机上,先要卸载掉DRBD设备. [root@centos1 /]# umount /d 将主机降级为”备机” [root@centos1 /]# drbdadm secondary r0 [root@centos1 /]# cat /proc/drbd 1: cs:Connected st:Secondary/Secondary ds:UpToDate/UpToDate C r— 现在,两台主机都是”备机”. 在备机centos2上, 将它升级为”主机”. [root@centos2 /]# drbdadm primary r0 [root@centos2 /]# cat /proc/drbd 1: cs:Connected st:Primary/Secondary ds:UpToDate/UpToDate C r— 现在centos2成为主机了. 还得把heartbeat重启下,把VIP移走。