监控命令之tsar
1.1 tsar是什么?
tsar是淘宝自己开发的一个采集工具(类似于sar工具),主要用来收集服务器的系统信息(如cpu,io,mem,tcp等),以及应用数据(如squid haproxy nginx等)。
收集到的数据存储在磁盘上,可以随时查询历史信息,输出方式灵活多样,另外支持将数据存储到mysql中,也可以将数据发送到nagios报警服务器。
tsar在展示数据时,可以指定模块,并且可以对多条信息的数据进行_merge_输出,带_–live_参数可以输出秒级的实时信息。
tsar可以通过编写模块轻松扩展,这使得它成为一个功能强大且多功能的报告工具。
github地址:https://github.com/alibaba/tsar
1.1.1 总体架构
tsar是基于模块化设计的程序,程序有两部分组成:框架和模块。
框架程序源代码主要在src目录,而模块源代码主要在modules目录中。
框架提供对配置文件的解析,模块的加载,命令行参数的解析,应用模块的接口对模块原始数据的解析与输出。 模块提供接口给框架调用。
tsar依赖与cron每分钟执行采集数据,因此它需要系统安装并启用crond,安装后,tsar每分钟会执行tsar –cron来定时采集信息,并且记录到原始日志文件。
1.1.2 tsar的运行流程图
主要执行流程有:
(1)解析输入
根据用户的输入,初始化一些全局信息,如间隔时间,是否merge,是否指定模块,运行模式
(2)读取配置文件信息
主要解析tsar的配置文件,如果include生效,则会解析include的配置文件
配置文件用来获得tsar需要加载的模块,输出方式,每一类输出方式包含的模块,和此输出方式的接收信息,如mod_cpu on代表采集cpu的信息
output_interface file,nagios表示向文件和nagios服务器发送采集信息和报警信息
(3)加载相应模块
根据配置文件的模块开启关闭情况,将模块的动态库load到系统
(4)tsar的三种运行模式
tsar在运行的时候有三种模式:
** print****模式,**仅仅输出指定的模块信息,默认显示最近一天的;
** live****模式,**是输出当前信息,可以精确到秒级
** cron****模式,**此一般是crontab定时执行,每一分钟采集一次所有配置的模块信息,并将数据写入原始文件,在cron运行的时候 会判断是否配置输出到db或者nagios,如果配置则将相应格式的数据输出到对应接口。
(5)释放资源
程序最后,释放动态库,程序结束
1.2 tsar的安装
1.2.1 使用git下载源码包
可以访问alibaba的github找到tsar进行下载
1.2.2 下载zip文件并安装
访问连接地址,获取源码包,进行编译安装
1.2.3 目录文件说明
安装后,您可能会看到这些文件:
1.2.4 tsar配置文件说明
####output_interface file,db,nagios output_interface file #设置输出类型,支持file,nagios,db
####[output_file] original data to store output_file_path /var/log/tsar.data
####[output_stdio] these mod will be show as using tsar command #设置用户终端默认显示的模块 output_stdio_mod mod_swap,mod_partition,mod_cpu,mod_mem,mod_lvs,mod_haproxy,mod_traffic,mod_squid,mod_load,mod_tcp,mod_udp,mod_tcpx,mod_apache,mod_pcsw,mod_io,mod_percpu
####[output_db] #设置哪些模块输出到数据库 #output_db_mod mod_swap,mod_partition,mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udp,mod_pcsw,mod_io #output_db_addr console2:56677 #数据库的ip和端口
####[output_tcp] #output_tcp_mod mod_swap,mod_cpu #output_tcp_addr localhost:9666 #output_tcp_merge on
####support include other mod conf include /etc/tsar/conf.d/*.conf
####The IP address or the host running the NSCA daemon #server_addr nagios.server.com ####The port on which the daemon is running - default is 5667 #server_port 8086 ####The cycle of send alert to nagios #cycle_time 300 #指定上报的间隔时间,由于tsar每一分钟采集一次,上报时会判断是否符合时间间隔,如设置300的话,则在0,5等整点分钟会上报 ####nsca client program #send_nsca_cmd /usr/bin/send_nsca #send_nsca_conf /home/a/conf/amon/send_nsca.conf
####tsar mod alert config file ####threshold servicename.key;w-min;w-max;c-min;cmax; #threshold cpu.util;N;N;N;N; #设置某个要报警项的阀值,前面是模块和要监控的具体名称,后面的四个数据代表报警的范围,warn和critical的范围。
1.3 tsar的使用
查看使用帮助
1.3.1 常用命令
#以1秒钟为间隔,实时打印tsar的概述数据
# 检查磁盘io情况
# tsar 显示1天内的历史汇总(summury)信息,以默认5分钟为间隔
MAX 0.16 18.54 0.00 72.00 89.00 0.15 0.00
MEAN 0.16 18.37 0.00 10.60 13.00 0.03 0.00
MIN 0.16 18.24 0.00 4.00 3.00 0.03 0.00
# tsar –cpu -i 1 显示一天内cpu的历史信息,以1分钟为间隔
# tsar –live –mem -i 2 以2秒钟为间隔,实时打印mem的数据。
# tsar –cpu –mem -i 1 显示一天内的cpu和内存历史数据,以1分钟为间隔。
1.4 tsar添加模块
1.4.1 模块开发
tsar编译安装后即可以进行自定义模块的开发
步骤如下
1.执行tsardevel mymod会在当前目录生成一个mymod文件夹
2.修改里面的mod_mymod.c****成自己想要的采集程序开发手册,make make install即可以安装到系统
3.这时系统即可以使用mymod的采集:
4.自定义的模块配置:/etc/tsar/conf.d/mymod.conf 可以在这个文件配置模块开启关闭,是否输出到db/nagios,以及nagios的报警阀值 mod_mymod on
1.4.2 安装nginx模块
tsar中可以添加很多的监控模块,这次添加nginx监控模块。
tsar的nginx扩展模块项目主页为:https://github.com/taobao/tsar-mod_nginx ,点击下载zip包。
测试
1.4.3 nginx模块不能用问题的处理
此时通过使用tsar –nginx –live -i 1 命令查看,若出现都是横线。是因为nginx没有开启status统计页面 。
因为该工具统计的原理是通过获取status页面的输出结果,并对输出内容进行统计和计算得出的结果。而且其获取状态页的url默认是http://127.0.0.1/nginx_status ,所以在nginx上你必须有如下的配置:
注:以上的url并非不能更改,可以修改环境变量实现。其自带的几个环境变量如下。
1.5 参考文献
<p class="a">
[2] <a href="https://blog.csdn.net/tanga842428/article/details/52913883">https://blog.csdn.net/tanga842428/article/details/52913883</a>
</p>
<p class="a">
[3] <a href="/wp-content/themes/clsn-003/inc/go.php?url=http://blog.51cto.com/cuchadanfan/1738568" >http://blog.51cto.com/cuchadanfan/1738568</a>
</p>
<p class="a">
[4] <a href="https://github.com/taobao/tsar-mod_nginx">https://github.com/taobao/tsar-mod_nginx</a>
</p>
<p class="a">
[5] <a href="https://github.com/alibaba/tsar">https://github.com/alibaba/tsar</a>
</p>
</div>
<p>
[6] <a href="https://github.com/taobao/tsar-mod_nginx">https://github.com/taobao/tsar-mod_nginx</a>
</p>
<li>
<a href="#12_tsar">1.2 tsar的安装</a><ul>
<li>
<a href="#121_git">1.2.1 使用git下载源码包</a>
</li>
<li>
<a href="#122_zip">1.2.2 下载zip文件并安装</a>
</li>
<li>
<a href="#123">1.2.3 目录文件说明</a>
</li>
<li>
<a href="#124_tsar">1.2.4 tsar配置文件说明</a>
</li>
</ul>
</li>
<li>
<a href="#13_tsar">1.3 tsar的使用</a><ul>
<li>
<a href="#131">1.3.1 常用命令</a>
</li>
</ul>
</li>
<li>
<a href="#14_tsar">1.4 tsar添加模块</a><ul>
<li>
<a href="#141">1.4.1 模块开发</a>
</li>
<li>
<a href="#142_nginx">1.4.2 安装nginx模块</a>
</li>
<li>
<a href="#143_nginx">1.4.3 nginx模块不能用问题的处理</a>
</li>
</ul>
</li>
<li>
<a href="#15">1.5 参考文献</a>
</li>
- 原文作者:惨绿少年
- 原文链接:https://clsn.io/clsn/lx1090.html
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。