引言
Linux
以其稳定性,
越来越多地被用作服务器的操作系统
(
当然,
有人会较真地说一句:
Linux
只是操作系统内核
)
。
但使用了
Linux
作为底层的操作系统,
是否我们就能保证我们的服务做到
7
*
24
地稳定呢?非也,
要知道业务功能
是由系统上跑的程序实现的,
要实现业务功能的稳定性,
选择
Linux
只是迈出的第一步,
我们更多地工作是不让
业务程序成为稳定性的短板。
当我们的服务器出现问题的时候,外在的表现是业务功能不能正常提供,内在的原因,从程序的角度看,可能
是业务程序的问题
(
程序自身的
bug
)
,
也可能是服务器上人为的误操作
(
不当地执行脚本或命令
)
;
从系统资源的
角度看,可能是
CPU
抢占、内存泄漏、磁盘
IO
读写异常、网络异常等。出现问题后,面对各种各样可能的原因,
我们应如何着手进行分析?我们有什么工具进行问题定位吗?
atop
简介
本文要介绍的
atop
就是一款用于监控
Linux
系统资源与进程的工具,
它以一定的频率记录系统的运行状态,
所采
集的数据包含系统资源
(
CPU
、
内存、
磁盘和网络
)
使用情况和进程运行情况,
并能以日志文件的方式保存在磁盘
中,
服务器出现问题后,
我们可获取相应的
atop
日志文件进行分析。
atop
是一款开源软件,
我们可以从
support
网站上的
atop
工具页面获得其安装包和安装指导文档,在
《
ATAE
–
关于
ATAE
单板
SUSE
Linux
部署故障定位工具的
4
级预警公告》中也包含
atop
工具的部署安装。
atop
使用方法
在安装
atop
之后,
系统会在
/
var
/
log
/
atop
目录下记录
atop
日志文件,
我们在命令行下敲入
”
atop”
命令也可看到
系统当前的运行情况:
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227182.html原文链接:https://javaforall.net
