keepalived 执行脚本-1.1.20中怎么写监控脚本

[工具开发] keepalived使用nagios监控脚本 - hahp - 博客园
最近在做开发和办公环境的高可用,采用的是keepalived;keepalived基于Linux内核支持的LVS,既能实现高可用,又能实现负载均衡,非常实用。
keepalived监控服务状态时可以用多种方式,如:HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHECK(自定义脚本方式),为了精确的监控服务的状态,我们需要编写自定义监控脚本。
目前很多公司都会部署nagios作为服务的监控平台,nagios也有监控脚本或者程序,如果keepalived监控脚本能套用naigios的,那么就可以省去很多麻烦。但是nagios监控脚本或者程序与keepalived有一些不同:
nagios脚本或者程序的返回值:0-OK,1-Warn, 2-Critical, 3-Unknown
keepalived脚本返回值:0-OK,1-Fail,2~255-OK且退出码-2
可见,只需要把nagios脚本或者程序的返回值改一下就可以用在keepalived上了。如果是文本格式的nagios脚本,可以直接改返回值,如果是二进制格式的程序,就不能直接改了。我采用的方法是把 nagios监控程序放到python里并且修改其返回值,这样就可以给keepalived用了。
下面的例子是用python把nagios的check_dns二进制监控程序改成keepalived能用的脚本,请注意commands.getstatusoutput里的命令,就是调用的nagios二进制监控程序:
(由于我的服务不需要修改退出状态码,因此只返回0或者1)
#!/usr/bin/python
#coding: utf-8
#返回0:健康检查OK,权重保持
#返回1:健康检查失败,权重设为0
#返回2-255:健康检查OK,权重设置为:退出状态码-2
import commands
import sys, getopt
import os.path
def check_dns(server='', timeout='', name='', address=''):
status, output = commands.getstatusoutput("/usr/lib64/nagios/plugins/check_dns -s " + server + " -t " + timeout + " -H " + name + " -a " + address)
return status
if __name__ == '__main__':
server, timeout, name, address = '', '', '', ''
script = os.path.split(os.path.realpath(__file__))[1]
opts, args = getopt.getopt(sys.argv[1:], "s:n:a:t:", ["server=", "name=", "address=", "timeout="])
except getopt.GetoptError, err:
#print str(err)
sys.exit(3)
for o, a in opts:
if o in ("-s", "--server"):
server = a
elif o in ("-n", "--name"):
elif o in ("-a", "--address"):
address = a
elif o in ("-t", "--timeout"):
timeout = a
#print "usage: " + script + " -s server -n name -a address -t timeout"
sys.exit(3)
if server == '' or name == '' or address == '' or timeout == '':
#print "usage: " + script + " -s server -n name -a address -t timeout"
sys.exit(3)
status = check_dns(server, timeout, name, address)
if status:
#print status
sys.exit(1)
#print status
sys.exit(0)匿名用户不能发表回复!|
每天回帖即可获得10分可用分!小技巧:
你还可以输入10000个字符
(Ctrl+Enter)
请遵守CSDN,不得违反国家法律法规。
转载文章请注明出自“CSDN(www.csdn.net)”。如是商业用途请联系原作者。作为一个高可用集群软件,Keepalived 没有 Heartbeat 、RHCS 等专业的高可用集群软件功能强大,它不能够实现集群资源的托管,也不能实现对集群中运行服务的监控,好在 Keepalived 也考虑到了这一点,它提供了 vrrp_script 、notify_master 、notify_backup 等多个功能模块,通过这些模块也可以实现对集群资源的托管以及集群服务的监控。
## 下面是一个 Keepalived 主备切换的演示过程
shell & curl 192.168.1.35
welcome to Master Nginx
## 客户机访问虚拟 IP 192.168.1.35 ,这时由主服务器提供服务## 当主服务器宕机或网络出现异常或 Keepalived 本身停止时,主备切换
shell & curl 192.168.1.35
welcome to Slave Nginx
## 当手动停止 Keepalived 服务时,由备机来提供服务,这并没有什么问题
## 第二种测试
shell & curl 192.168.1.35
welcome to Master Nginx
## 现在由主服务器提供服务,当主服务上提供服务的 web 停止时,是否会出现主备切换呢 ?
shell & curl 192.168.1.35
curl: (7) couldn't connect to host
## 很显然,并没有主备切换。## 主服务器没有移除 VIP ,备服务器也没有绑定 VIP 。## 这是因为他们之间通过 VRRP 协议来确定对方是否存活,而 web 停止并不妨碍他们之间的通信。## 所以备机就认为主服务器处于存活状态,从而导致无法正常提供服务。
## 这时就要由 vrrp_script 出马了 !
vrrp_script
此模块专门用于对集群中服务资源进行监控 。与此模块同时使用的还有 track_script 模块,在此模块中可以引入监控脚本、命令组合、shell 语句等 ,以实现对服务、端口等多方面的监控。track_script 模块主要用来调用 vrrp_script 模块使 keepalived执行对集群服务资源的检测。vrrp_script 模块中还可以定义对服务资源检测的时间间隔、权重等参数,通过 vrrp_script 和 track_script 组合,可以实现对集群资源的监控并改变优先级,进而实现 keepalived 主备节点切换。
## 下面是 vrrp_script 模块常见的几种监控机制
1、killall 命令探测服务运行状态
vrrp_script check_nginx {
# check_nginx 为自定义的一个监控名称
script "killall -0 nginx"
# 采用 killall 信号 0 来对进程运行状态进行监控,0 为正常,1 为异常
interval 2
# 检测间隔时间,即两秒检测一次
# 一个正整数或负整数。权重值,关系到整个集群角色选举,尤为重要( 单独出帖 )
track_script {
check_nginx
# 引用上面定义的监控模块
2、检测端口运行状态
vrrp_script check_nginx {
script "& /dev/tcp/127.0.0.1:80"
# 通过 & /dev/tcp/127.0.0.1:80 这样的方式定义一个对本机端口状态的检测
interval 2
# 检测失败的最大次数,超过两次认为节点资源发生故障
# 请求一次成功认为节点恢复正常
track_script {
check_nginx
3、通过 shell 语句进行状态监控
vrrp_script check_nginx {
script " if [ -f /usr/local/nginx/logs/nginx.pid ]; then exit 0 ; else exit 1; fi"
interval 2
track_script {
check_nginx
4、通过脚本进行服务状态监控
vrrp_script check_nginx {
script "/etc/keepalived/check_nginx.sh"
interval 2
track_script {
check_nginx
## 其中 check.nginx.sh 也是本着正常返回 0 ,异常返回 1 的原则来定义
## 这两种方法,个人感觉基本一个意思,简单点的检测就用语句,复杂点的就写脚本里
阅读(...) 评论()}

我要回帖

更多关于 keepalived 切换脚本 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信