Linux的系统性能监测参数获取

目前的工程需要简单的监测一下Linux系统的：CPU负载、内存消耗情况、几个指定目录的磁盘空间、磁盘I/O、swap的情况还有就是网络流量。
Linux下的性能检测工具其实都有很多。mrtg（http://people.ee.ethz.ch/~oetiker/webtools/mrtg/）就是一个很不错的选择。不过用mrtg就要装sysstat、apache、snmp、perl之类的东西。而且安装也要好几个步骤，似乎比较麻烦。本来也想直接调用sar、vmstat之类的命令，parse一下结果就算了。哪知道发现不同的版本的linux这些命令的结果也都是不一样。既然要按版本parse它们的结果，那还不如直接去系统里面获得算了。于是研究了一下sysstat（http://freshmeat.net/projects/sysstat/）和gkrellm（http://gkrellm.net ）的源代码，找到监测性能的数据所在。

1、CPU
   在文件"/proc/stat"里面就包含了CPU的信息。每一个CPU的每一tick用在什么地方都在这个文件里面记着。后面的数字含义分别是：user、nice、sys、idle、iowait。有些版本的kernel没有iowait这一项。这些数值表示从开机到现在，CPU的每tick用在了哪里。例如：
cpu0 256279030 0 11832528 1637168262
就是cpu0从开机到现在有256279030 tick用在了user消耗，11832528用在了sys消耗。所以如果想计算单位时间（例如1s）里面CPU的负载，那只需要计算1秒前后数值的差除以每一秒的tick数量就可以了。gkrellm就是这样实现的：((200 * (v2 - v1) / CPU_TICKS_PER_SECOND) + 1) /2
例如，第一次读取/proc/stat，user的值是256279030；一秒以后再读一次，值是256289030，那么CPU在这一秒的user消耗就是：((200 * (256289030 - 256279030) / CPU_TICKS_PER_SECOND) + 1) /2 = ((10000 * 200 / 1000000) + 1) / 2 = 1%了。

2、内存消耗
   文件"/proc/meminfo"里面包含的就是内存的信息，还包括了swap的信息。例如：
$ cat /proc/meminfo
        total:    used:    free: shared: buffers: cached:
Mem: 1057009664 851668992 205340672        0 67616768 367820800
Swap: 2146787328 164429824 1982357504
MemTotal:      1032236 kB
MemFree:        200528 kB
MemShared:           0 kB
……
不过从gkrellm的源代码看，有些版本没有前面那两行统计的信息，只能够根据下面的Key: Value这种各式的数据收集。

3、磁盘空间
   从gkrellm的源代码看，这个是一个很复杂的数据。磁盘分区的数据有可能分布在：/proc/mounts、/proc/diskstats、/proc/partitions等等。而且如果想要检查某几个特定的路径，还需要通过mount、df等命令的帮助。为了减少麻烦，这个数据我就直接用statfs函数直接获得了。
int statfs(const char *path, struct statfs *buf);
这个函数只需要输入需要检查的路径名称，就可以返回这个路径所在的分区的空间使用情况：
总空间：buf.f_bsize * buf.f_blocks
空余空间：buf.f_bsize * buf.f_bavail

4、磁盘I/O
   磁盘I/O的数据也同样比较复杂，有些版本看/proc/diskstats，有些版本看/proc/partitions，还有些版本至今我也不知道在那里看……不过可以看到数据的版本也像CPU那样，需要隔一段时间取值，两次取值的差就是流量。

5、网络流量
   网络流量也是五花八门，不过基本上都可以在/proc/net/dev里面获得。同样也是需要两次取值取其差作为流量值。

   以上就是数据获得源头。程序也比较好写，不外乎就是打开一些文件，逐行读出来然后用sscanf来parse一下数据就可以了。

posted on 2006-03-02 22:54 cyt 阅读(4507) 评论(3) 编辑收藏引用所属分类: Work

Comments

# re: Linux的系统性能监测参数获取
nomad
Posted @ 2006-04-09 17:26
我在现在到公司一直开发 snmp 网管软件。。。
其实走 snmp 的管理还是很爽的，通用很多。但是系统必须装一个 snmpd ，主流操作系统都自带了。回复更多评论
# re: Linux的系统性能监测参数获取
cyt
Posted @ 2006-04-10 14:59
snmp绝对是正途。
不过在我们的应用中，需要自己的程序去检查一些系统资源，发现不妥的时候要做一些相应的举措。例如磁盘分区满了，要自动调整分区的存放数据的权重；CPU过忙，就减少一些复杂运算的请求等等……如果这些操作都用snmp，消耗在snmp上的资源就太多了，所以才会想到自己去获取这些信息。回复更多评论
# re: Linux的系统性能监测参数获取
magixescuchador@hotmail.com
Posted @ 2007-12-18 21:51
ni hao 回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。


相关文章: 如何在windows service里面控制console程序退出补充一个OCI的问题 OpenDBX 一个访问多数据库的C类库移植代码到64bits碰上的问题 db4o and GigaBase 实在惭愧新版本的Qu OCI访问Oracle的一些刁钻问题 Linux的系统性能监测参数获取简单的类型安全format输出后记

网站导航: 博客园博客园最新博文博问管理

导航

常用链接

留言簿(12)

随笔分类

随笔档案

文章分类

好友Blog

搜索

最新评论

阅读排行榜

评论排行榜