1、keepalived 原理
1、keepalived是什么
keepalived是集群管理中保证集群高可用的一个服务软件,其功能类似于heartbeat,用来防止单点故障。
2、keepalived工作原理
keepalived是以vrrp协议为实现基础的,vrrp全称virtual router redundancy protocol,即虚拟路由冗余协议。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将n台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp包时就认为master宕掉了,这时就需要根据vrrp的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。
keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现vrrp协议的。
3、keepalived的配置文件
keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、static_ipaddress、static_routes、vrrp_script、vrrp_instance和virtual_server
2、keepalived 在linux下的安装
1、准备工作
linux主机:10.122.111.80 、
linux主机:10.122.111.81、
虚拟ip:10.122.111.99、
操作系统:银河麒麟 v3.3
2、安装keepalived
两台linux主机都需要安装keepalived,如下步骤两台机需要重复进行。
1、下载keepalived
下载至目录:/home/zz/user/software
wget http://keepalived.org/software/keepalived-1.3.8.tar.gz
2、解压keepalived
tar -zxvf keepalived-1.3.8.tar.gz
3、配置keepalived
cd keepalived-1.3.8/
./configure
此步骤可能出现错误,
checking libnfnetlink/libnfnetlink.h usability... no
checking libnfnetlink/libnfnetlink.h presence... no
checking for libnfnetlink/libnfnetlink.h... no
configure: error: libnfnetlink headers missing
如下图:
解决方法如下:
将 usr.zip 包解压至keepalived-1.3.8目录,解压,然后执行
cp -r usr/ /
成功后,重新执行
./configure
成功,如下图:
4、编译安装keepalived
make
make install
3、配置防火墙
firewall-cmd --direct --permanent --add-rule ipv4 filter input 0 \ --in-interface p4p1 --destination 224.0.0.18 --protocol vrrp -j accept
firewall-cmd --direct --permanent --add-rule ipv4 filter output 0 \ --out-interface p4p1 --destination 224.0.0.18 --protocol vrrp -j accept
firewall-cmd --reload
注意:上述【p4p1】为配置的网卡名称。
4、配置服务启动
cp /home/zz/user/software/keepalived-1.3.8/keepalived/etc/init.d/keepalived /etc/init.d/
mkdir /etc/keepalived
cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/
执行完成后,即可使用服务的形式启动keepalived,如下:
service keepalived start
如果使用 service keepalived status命令查看状态出现如下问题:
/etc/init.d/keepalived:行15: /etc/sysconfig/keepalived: 没有那个文件或目录
则需要执行:
ln -s /usr/local/etc/sysconfig/keepalived /etc/sysconfig/
执行成功后,重启keepalived服务,即可查看状态。
如果keepalived启动不成功,错误信息如下:
keepalived_vrrp exited with permanent error config. terminating
说明keepalived 核心配置文件配置有误,继续往下配置即可,此问题先不用处理。
5、配置双机
keepalived配置文件为:/etc/keepalived/keepalived.conf,
现进行如下配置:
使用10.122.111.80 为主节点,
使用10.122.111.81为从节点 进行配置,
修改主节点80的配置文件 keepalived.conf,内容修改如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
! configuration file for keepalived global_defs { notification_email { # acassen@firewall.loc # failover@firewall.loc # sysadmin@firewall.loc } notification_email_from alexandre.cassen@firewall.loc # smtp_server 192.168.200.1 # smtp_connect_timeout 30 router_id server_1 vrrp_skip_check_adv_addr vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance vi_1 { state master interface p4p1 virtual_router_id 55 priority 100 protocol tcp advert_int 1 authentication { auth_type pass auth_pass 1111 } virtual_ipaddress { 10.122.111.99/24 } } |
修改从节点81的配置文件 keepalived.conf,内容修改如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
! configuration file for keepalived global_defs { notification_email { # acassen@firewall.loc # failover@firewall.loc # sysadmin@firewall.loc } notification_email_from alexandre.cassen@firewall.loc # smtp_server 192.168.200.1 # smtp_connect_timeout 30 router_id server_2 vrrp_skip_check_adv_addr vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance vi_1 { state backup interface p4p1 virtual_router_id 55 priority 50 protocol tcp advert_int 1 authentication { auth_type pass auth_pass 1111 } virtual_ipaddress { 10.122.111.99/24 } } |
配置完成后,分别启动 keepalived,并进行状态查看,如下图:
6、配置非抢占模式
keepalived默认为抢占模式,主节点master在故障回复重新开启使用时会掠夺当前从服务器的虚拟ip,重新占据中心地位,在一个去中心化的集群中,可配置非抢占模式,即正在处于服务状态的主机虚拟ip不会被抢走知道此台服务器出现问题。
只需要在原有master配置文件中修改如下配置即可(backup节点无需更改):
nopreempt
state backup
调整后的配置文件如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
! configuration file for keepalived global_defs { notification_email { # acassen@firewall.loc # failover@firewall.loc # sysadmin@firewall.loc } notification_email_from alexandre.cassen@firewall.loc # smtp_server 192.168.200.1 # smtp_connect_timeout 30 router_id server_1 vrrp_skip_check_adv_addr vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance vi_1 { state backup # 此处由master调整为backup nopreempt # 此处添加非抢占模式配置 interface p4p1 virtual_router_id 55 priority 100 protocol tcp advert_int 1 authentication { auth_type pass auth_pass 1111 } virtual_ipaddress { 10.122.111.99/24 } } |
7、查看虚拟ip指向
判断当前服务器是否拥有虚拟ip,执行如下命令,如果有结果则说明当前服务器正处于服务状态,如果查询为空,则说明当前服务器不用有虚拟ip,处于备用状态。
ip addr|grep 10.122.111.99
说明当前服务器拥有虚拟ip。
8、如何判断脑裂?
分别在两台机查看当前服务器是否拥有虚拟ip,如果两台服务器都拥有,则说明发生了脑裂,证明目前双机通信出现问题,产生此问题的原有在于 两台服务器都探测不到组内其他服务器的状态(心跳请求无法正常响应),私自判定另一台服务器挂起,则抢占虚拟ip,脑裂的出现是不被允许的,解决此问题的方法为检查防火墙设置(关闭防火墙)或者使用串口通信。