keepalived介紹
Keepalived 軟件起初是專為LVS負載均衡軟件設計的,用來管理并監(jiān)控LVS集群系統(tǒng)中各個服務節(jié)點的狀態(tài),后來又加入了可以實現(xiàn)高可用的VRRP功能。因此,Keepalived除了能夠管理LVS軟件外,還可以作為其他服務(例如:Nginx、Haproxy、MySQL等)的高可用解決方案軟件。
Keepalived軟件主要是通過VRRP協(xié)議實現(xiàn)高可用功能的。VRRP是Virtual Router RedundancyProtocol(虛擬路由器冗余協(xié)議)的縮寫,VRRP出現(xiàn)的目的就是為了解決靜態(tài)路由單點故障問題的,它能夠保證當個別節(jié)點宕機時,整個網絡可以不間斷地運行。
所以,Keepalived 一方面具有配置管理LVS的功能,同時還具有對LVS下面節(jié)點進行健康檢查的功能,另一方面也可實現(xiàn)系統(tǒng)網絡服務的高可用功能。
keepalived的重要功能
keepalived 有三個重要的功能,分別是:
- 管理LVS負載均衡軟件
- 實現(xiàn)LVS集群節(jié)點的健康檢查
- 作為系統(tǒng)網絡服務的高可用性(failover)
keepalived高可用故障轉移的原理
Keepalived 高可用服務之間的故障切換轉移,是通過 VRRP (Virtual Router Redundancy Protocol ,虛擬路由器冗余協(xié)議)來實現(xiàn)的。
在 Keepalived 服務正常工作時,主 Master 節(jié)點會不斷地向備節(jié)點發(fā)送(多播的方式)心跳消息,用以告訴備 Backup 節(jié)點自己還活看,當主 Master 節(jié)點發(fā)生故障時,就無法發(fā)送心跳消息,備節(jié)點也就因此無法繼續(xù)檢測到來自主 Master 節(jié)點的心跳了,于是調用自身的接管程序,接管主 Master 節(jié)點的 IP 資源及服務。而當主 Master 節(jié)點恢復時,備 Backup 節(jié)點又會釋放主節(jié)點故障時自身接管的IP資源及服務,恢復到原來的備用角色。
VRRP ,全 稱 Virtual Router Redundancy Protocol ,中文名為虛擬路由冗余協(xié)議 ,VRRP的出現(xiàn)就是為了解決靜態(tài)踣甶的單點故障問題,VRRP是通過一種競選機制來將路由的任務交給某臺VRRP路由器的。
keepalived工作原理描述
Keepalived高可用對之間是通過VRRP通信的,因此,我們從 VRRP開始了解起:
- VRRP,全稱 Virtual Router Redundancy Protocol,中文名為虛擬路由冗余協(xié)議,VRRP的出現(xiàn)是為了解決靜態(tài)路由的單點故障。
- VRRP是通過一種竟選協(xié)議機制來將路由任務交給某臺 VRRP路由器的。
- VRRP用 IP多播的方式(默認多播地址(224.0_0.18))實現(xiàn)高可用對之間通信。
- 工作時主節(jié)點發(fā)包,備節(jié)點接包,當備節(jié)點接收不到主節(jié)點發(fā)的數(shù)據包的時候,就啟動接管程序接管主節(jié)點的開源。備節(jié)點可以有多個,通過優(yōu)先級競選,但一般 Keepalived系統(tǒng)運維工作中都是一對。
- VRRP使用了加密協(xié)議加密數(shù)據,但Keepalived官方目前還是推薦用明文的方式配置認證類型和密碼。
介紹完 VRRP,接下來我再介紹一下 Keepalived服務的工作原理:
Keepalived高可用是通過 VRRP 進行通信的, VRRP是通過競選機制來確定主備的,主的優(yōu)先級高于備,因此,工作時主會優(yōu)先獲得所有的資源,備節(jié)點處于等待狀態(tài),當主掛了的時候,備節(jié)點就會接管主節(jié)點的資源,然后頂替主節(jié)點對外提供服務。
在 Keepalived 服務之間,只有作為主的服務器會一直發(fā)送 VRRP 廣播包,告訴備它還活著,此時備不會槍占主,當主不可用時,即備監(jiān)聽不到主發(fā)送的廣播包時,就會啟動相關服務接管資源,保證業(yè)務的連續(xù)性.接管速度最快可以小于1秒。
keepalived配置文件詳解
keepalived 的主配置文件為/etc/keepalived/keepalived.conf
! Configuration File for keepalived global_defs { #全局配置 notification_email { #定義報警收件人郵件地址 acassen@firewall.loc failover@firewall.loc sysadmin@firewall.loc } notification_email_from Alexandre.Cassen@firewall.loc #定義報警發(fā)件人郵箱 smtp_server 192.168.200.1 #郵箱服務器地址 smtp_connect_timeout 30 #定義郵箱超時時間 router_id LVS_DEVEL #定義路由標識信息,同局域網內唯一 vrrp_skip_check_adv_addr vrrp_strict vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance VI_1 { #定義實例 state MASTER #指定keepalived節(jié)點的初始狀態(tài),可選值為MASTER|BACKUP interface eth0 #VRRP實例綁定的網卡接口,用戶發(fā)送VRRP包 virtual_router_id 51 #虛擬路由的ID,同一集群要一致 priority 100 #定義優(yōu)先級,按優(yōu)先級來決定主備角色,優(yōu)先級越大越優(yōu)先 nopreempt #設置不搶占 advert_int 1 #主備通訊時間間隔 authentication { #配置認證 auth_type PASS #認證方式,此處為密碼 auth_pass 1111 #同一集群中的keepalived配置里的此處必須一致,推薦使用8位隨機數(shù) } virtual_ipaddress { #配置要使用的VIP地址 192.168.200.16 } } virtual_server 10.10.10.2 1358 { #配置虛擬服務器 delay_loop 6 #健康檢查的時間間隔 lb_algo rr #lvs調度算法 lb_kind NAT #lvs模式 persistence_timeout 50 #持久化超時時間,單位是秒 protocol TCP #4層協(xié)議 sorry_server 192.168.200.200 1358 #定義備用服務器,當所有RS都故障時用sorry_server來響應客戶端 real_server 192.168.200.2 1358 { #定義真實處理請求的服務器 weight 1 #給服務器指定權重,默認為1 HTTP_GET { url { path /testurl/test.jsp #指定要檢查的URL路徑 digest 640205b7b0fc66c1ea91c463fac6334d #摘要信息 } url { path /testurl2/test.jsp digest 640205b7b0fc66c1ea91c463fac6334d } url { path /testurl3/test.jsp digest 640205b7b0fc66c1ea91c463fac6334d } connect_timeout 3 #連接超時時間 nb_get_retry 3 #get嘗試次數(shù) delay_before_retry 3 #在嘗試之前延遲多長時間 } }
定制主配置文件
vrrp_instance段配置
nopreempt #設置為不搶占。默認是搶占的,當高優(yōu)先級的機器恢復后,會搶占低優(yōu)先 級的機器成為MASTER,而不搶占,則允許低優(yōu)先級的機器繼續(xù)成為MASTER,即使高優(yōu)先級 的機器已經上線。如果要使用這個功能,則初始化狀態(tài)必須為BACKUP。 preempt_delay #設置搶占延遲。單位是秒,范圍是0---1000,默認是0.發(fā)現(xiàn)低優(yōu)先 級的MASTER后多少秒開始搶占。
vrrp_script段配置
#作用:添加一個周期性執(zhí)行的腳本。腳本的退出狀態(tài)碼會被調用它的所有的VRRP Instance記錄。 #注意:至少有一個VRRP實例調用它并且優(yōu)先級不能為0.優(yōu)先級范圍是1-254. vrrp_script <SCRIPT_NAME> { ... } #選項說明: script "/path/to/somewhere" #指定要執(zhí)行的腳本的路徑。 interval <INTEGER> #指定腳本執(zhí)行的間隔。單位是秒。默認為1s。 timeout <INTEGER> #指定在多少秒后,腳本被認為執(zhí)行失敗。 weight <-254 --- 254> #調整優(yōu)先級。默認為2. rise <INTEGER> #執(zhí)行成功多少次才認為是成功。 fall <INTEGER> #執(zhí)行失敗多少次才認為失敗。 user <USERNAME> [GROUPNAME] #運行腳本的用戶和組。 init_fail #假設腳本初始狀態(tài)是失敗狀態(tài)。 #weight說明: 1. 如果腳本執(zhí)行成功(退出狀態(tài)碼為0),weight大于0,則priority增加。 2. 如果腳本執(zhí)行失敗(退出狀態(tài)碼為非0),weight小于0,則priority減少。 3. 其他情況下,priority不變。
real_server段配置
weight <INT> #給服務器指定權重。默認是1 inhibit_on_failure #當服務器健康檢查失敗時,將其weight設置為0, 而不是從Virtual Server中移除 notify_up <STRING> #當服務器健康檢查成功時,執(zhí)行的腳本 notify_down <STRING> #當服務器健康檢查失敗時,執(zhí)行的腳本 uthreshold <INT> #到這臺服務器的最大連接數(shù) lthreshold <INT> #到這臺服務器的最小連接數(shù)
tcp_check段配置
connect_ip <IP ADDRESS> #連接的IP地址。默認是real server的ip地址 connect_port <PORT> #連接的端口。默認是real server的端口 bindto <IP ADDRESS> #發(fā)起連接的接口的地址。 bind_port <PORT> #發(fā)起連接的源端口。 connect_timeout <INT> #連接超時時間。默認是5s。 fwmark <INTEGER> #使用fwmark對所有出去的檢查數(shù)據包進行標記。 warmup <INT> //指定一個隨機延遲,最大為N秒??煞乐咕W絡阻塞。如果為0,則關閉該功能。 retry <INIT> #重試次數(shù)。默認是1次。 delay_before_retry <INT> #默認是1秒。在重試之前延遲多少秒。
keepalived實現(xiàn)nginx負載均衡的高可用
環(huán)境:
- CentOS7-linuxmi-192.168.26.128
- centos7-linuxmi-192.168.83.132
- 虛擬IP(VIP)地址為 192.168.83.250
#在兩個機器上配置yum源及環(huán)境(這里只寫出主機的,從機一樣) [root@linuxmi ~]# systemctl stop firewalld [root@linuxmi ~]# systemctl disable firewalld [root@linuxmi ~]# setenforce 0 [root@linuxmi ~]# sed -ri 's/^(SELINUX=).*/1disabled/g' /etc/selinux/config [root@linuxmi ~]# curl -o /etc/yum.repos.d/CentOS7-Base-163.repo http://mirrors.163.com/.help/CentOS7-Base-163.repo [root@linuxmi ~]# sed -i 's/$releasever/7/g' /etc/yum.repos.d/CentOS7-Base-163.repo [root@linuxmi ~]# sed -i 's/^enabled=.*/enabled=1/g' /etc/yum.repos.d/CentOS7-Base-163.repo [root@linuxmi ~]# yum -y install epel-release vim wget gcc gcc-c++ #安裝keepalived [root@linuxmi ~]# yum -y install keepalived #安裝nginx [root@linuxmi ~]# yum -y install nginx [root@linuxmi ~]# cd /usr/share/nginx/html/ [root@linuxmi ~]# mv index.html{,.bak} [root@linuxmi ~]# echo 'slave' > index.html [root@linuxmi ~]# systemctl start nginx [root@linuxmi ~]# systemctl enable nginx
修改配置文件
#主機配置文件 [root@linuxmi ~]# cat > /etc/keepalived/keepalived.conf <<EOF ! Configuration File for keepalived global_defs { router_id lb01 } vrrp_instance VI_1 { state BACKUP interface ens32 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass linuxmi123 } virtual_ipaddress { 192.168.83.250 } } virtual_server 192.168.83.250 80 { delay_loop 6 lb_algo rr lb_kind DR persistence_timeout 50 protocol TCP real_server 192.168.83.128 80 { weight 1 TCP_CHECK { connect_port 80 connect_timeout 3 nb_get_retry 3 delay_before_retry 3 } } real_server 192.168.83.132 80 { weight 1 TCP_CHECK { connect_port 80 connect_timeout 3 nb_get_retry 3 delay_before_retry 3 } } } EOF
#從機配置文件 [root@linuxmi ~]# cat > /etc/keepalived/keepalived.conf <<EOF ! Configuration File for keepalived global_defs { router_id lb02 } vrrp_instance VI_1 { state BACKUP interface ens32 virtual_router_id 51 priority 90 advert_int 1 authentication { auth_type PASS auth_pass linuxmi123 } virtual_ipaddress { 192.168.83.250 } } virtual_server 192.168.83.250 80 { delay_loop 6 lb_algo rr lb_kind DR persistence_timeout 50 protocol TCP real_server 192.168.83.128 80 { weight 1 TCP_CHECK { connect_port 80 connect_timeout 3 nb_get_retry 3 delay_before_retry 3 } } real_server 192.168.83.132 80 { weight 1 TCP_CHECK { connect_port 80 connect_timeout 3 nb_get_retry 3 delay_before_retry 3 } } } EOF
keepalived監(jiān)控nginx負載均衡
主機
#編寫監(jiān)控腳本 [root@linuxmi ~]# mkdir /scripts [root@linuxmi ~]# cd /scripts/ [root@linuxmi scripts]# cat > check_n.sh <<EOF #!/bin/bash nginx_status=$(ps -ef|grep -Ev "grep|$0"|grep 'bnginxb'|wc -l) if [ $nginx_status -lt 1 ];then systemctl stop keepalived fi EOF [root@linuxmi scripts]# chmod +x check_n.sh [root@linuxmi scripts]# cat > notify.sh <<EOF #!/bin/bash VIP=$2 sendmail (){ subject="${VIP}'s server keepalived state is translate" content="`date +'%F %T'`: `hostname`'s state change to master" echo $content | mail -s "$subject" 1470044516@qq.com } case "$1" in master) nginx_status=$(ps -ef|grep -Ev "grep|$0"|grep 'bnginxb'|wc -l) if [ $nginx_status -lt 1 ];then systemctl start nginx fi sendmail ;; backup) nginx_status=$(ps -ef|grep -Ev "grep|$0"|grep 'bnginxb'|wc -l) if [ $nginx_status -gt 0 ];then systemctl stop nginx fi ;; *) echo "Usage:$0 master|backup VIP" ;; esac EOF [root@linuxmi scripts]# chmod +x notify.sh #修改主機配置 [root@linuxmi ~]# vim /etc/keepalived/ #按如下內容添加 global_defs { router_id lb01 } vrrp_script nginx_check { script "/scripts/check_n.sh" interval 1 weight -20 } vrrp_instance VI_1 { state BACKUP interface ens32 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass linuxmi123 } virtual_ipaddress { 192.168.83.250 } notify_master "/scripts/notify.sh master 192.168.83.250" notify_backup "/scripts/notify.sh backup 192.168.83.250" }
從機
[root@linuxmi ~]# mkdir /scripts [root@linuxmi ~]# cd /scripts/ [root@linuxmi scripts]# cat > notify.sh <<EOF #!/bin/bash VIP=$2 sendmail (){ subject="${VIP}'s server keepalived state is translate" content="`date +'%F %T'`: `hostname`'s state change to master" echo $content | mail -s "$subject" 1470044516@qq.com } case "$1" in master) nginx_status=$(ps -ef|grep -Ev "grep|$0"|grep 'bnginxb'|wc -l) if [ $nginx_status -lt 1 ];then systemctl start nginx fi sendmail ;; backup) nginx_status=$(ps -ef|grep -Ev "grep|$0"|grep 'bnginxb'|wc -l) if [ $nginx_status -gt 0 ];then systemctl stop nginx fi ;; *) echo "Usage:$0 master|backup VIP" ;; esac EOF [root@linuxmi scripts]# chmod +x notify.sh #修改配置文件 [root@linuxmi ~]# vim /etc/keepalived/ #按如下內容添加 vrrp_instance VI_1 { state BACKUP interface ens32 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass linuxmi123 } virtual_ipaddress { 192.168.83.250 } notify_master "/scripts/notify.sh master 192.168.83.250" notify_backup "/scripts/notify.sh backup 192.168.83.250" }