大家好,欢迎来到IT知识分享网。
- 目的 4
- Nmon简介 4
2.1 软件特性 4
2.2 软件组成 4
2.3 运行环境 5
2.4 软件功能 5
2.5 软件获取 6 - Nmon使用 7
3.1 下载软件 7
3.2 安装软件 7
3.3 运行界面 8
3.4 使用方法 9
3.4.1 实时监控 9
3.4.2 后台监控 10
3.4.3 定时任务 10 - Nmon监控结果介绍 11
4.1 生成结果文件 11
4.2 主要性能参数介绍 12
4.3 页面介绍 12 - Nmon监控案例介绍 19
5.1 常见现象和产生原因 19
5.2 实例介绍 20
5.2.1 示例一 20
5.2.2 示例二 22
5.2.3 示例三 26
附录一常用网站 28
附录二参考资料 28 - 目的
本文介绍操作系统监控工具Nmon的概念、使用方式及使用参数。指导运维人员通过nmon工具监视AIX/Linux操作系统资源使用情况,收集监控结果及产生的数据文件,制作相关系统性能分析报告。 - Nmon简介
Nmon (Nigel’s Monitor)是由IBM 提供、免费监控 AIX 系统与 Linux 系统资源的工具。该工具可将服务器系统资源耗用情况收集起来并输出一个特定的文件,并可利用 excel 分析工具(nmon analyser)进行数据的统计分析。
2.1 软件特性
nmon 工具可以在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新。这个高效的工具可以工作于任何哑屏幕、telnet 会话、甚至拨号线路。另外,它不会消耗大量的 CPU 周期,通常低于百分之二(在更新的计算机上,其 CPU 使用率将低于百分之一)。nmon使用哑屏幕,在屏幕上对数据进行显示,并且每隔两秒钟对其进行更新。用户可以很容易地将这个时间间隔更改为更长或更短的时间段。如果拉伸窗口,并在 X Windows、VNC、PuTTY 或类似的窗口中显示这些数据,nmon 工具可以同时输出大量的信息。
nmon 工具还可以将相同的数据捕获到一个文本文件,便于以后对报告进行分析和绘制图形。输出文件采用电子表格的格式 (.csv)。
目前nmon已开源,以sourceforge为根据地,网址是http://nmon.sourceforge.net。
2.2 软件组成
Nmon使用需要nmon工具和nmonanalyser分析程序两者配合使用。nmon工具生成性能数据文件,然后monanalyser以nmon生成的数据文件作为输入,输出为Excel电子表格,并自动地生成相应的图形,使得我们能够直观地观察OS性能(CPU、IO和内存等)的变化过程。
2.3 运行环境
nmon 工具运行于:
∙ AIX® 4.1.5、4.2.0、4.3.2 和 4.3.3(nmon Version 9a:该版本的功能已经确定,并且不会对其进行进一步的开发。)
∙ AIX 5.1、5.2 和 5.3(nmon Version 10:该版本现在支持 AIX 5.3 和基于 POWER5™ 处理器的计算机,并且提供了 SMT 和共享 CPU 微分区的支持。)
∙ pSeries® p5 和 OpenPower™ 上的 Linux™ SUSE SLES 9、Red Hat EL 3 和 4、Debian
∙ Linux SUSE、Red Hat 和许多最新的 x86(32 位模式的 Intel 和 AMD)上的发布版
∙ zSeries® 或 mainframe 上的 Linux SUSE 和 Red Hat
nmon 工具大约每六个月更新一次,或者在可用的新的操作系统发布版中对其进行更新。
2.4 软件功能
nmon 工具可以为 AIX 和 Linux 性能专家提供监视和分析性能数据的功能,其中包括:
∙ CPU 使用率
∙ 内存使用情况
∙ 内核统计信息和运行队列信息
∙ 磁盘 I/O 速度、传输和读/写比率
∙ 文件系统中的可用空间
∙ 磁盘适配器
∙ 网络 I/O 速度、传输和读/写比率
∙ 页面空间和页面速度
∙ CPU 和 AIX 规范
∙ 消耗资源最多的进程
∙ IBM HTTP Web 缓存
∙ 用户自定义的磁盘组
∙ 计算机详细信息和资源
∙ 异步 I/O,仅适用于 AIX
∙ 工作负载管理器 (WLM),仅适用于 AIX
∙ IBM TotalStorage® Enterprise Storage Server® (ESS) 磁盘,仅适用于 AIX
∙ 网络文件系统 (NFS)
∙ 动态 LPAR (DLPAR) 更改,仅适用于面向 AIX 或 Linux 的 pSeries p5 和 OpenPower
2.5 软件获取
nmon工具和nmonanalyser工具都可以在IBM的Wike页面上下载到。
- Nmon下载:
位置:可从IBM Wiki上下载
http://www-941.haw.ibm.com/collaboration/wiki/display/WikiPtype/nmon
下载页面如下:
例如测试的系统是AIX5.3,那么就可以下载nmon4aix12e.zip ,下载后可以看到压缩包里是一些文件,如下:
- 下载之前须确定操作系统内核版本,本文以公司服务器192.168.40.212为例。登录服务器使用命令获取操作系统版本信息:
- 用root用户登录系统,建立目录:#mkdir /nmon
- 通过FTP将下载的nmon工具上传至服务器 192.168.40.212目录/nmon下。
- 修改tar包权限:#chmod +xnmon_linux_14g.tar.gz
- 解压文件:#tar xvfZ nmon_linux_14g.tar.gz
- 执行授权命令:#chmod +x nmon_x86_rhel54
3.3 运行界面 - 运行./nmon_x86_rhel54,便可进入nmon的监控界面,如下图:
- 键入“c”查看系统CPU使用情况
- 键入“m”查看系统内存使用情况
- 键入“d”查看系统磁盘I/O情况
- 键入“h”查看帮助信息
- 执行命令:#crontab –e
- 在最后一行添加如下命令:
0 8 * * 1,2,3,4,5 /nmon/nmon_x86_rhel5 -f -N -m /nmon/log -s 30 -c 1200
表示:
周一到周五,从早上08点开始,监控10个小时(到18:00整为止),输出到/nmon/log
- Nmon监控结果介绍
4.1 生成结果文件
通过后台监控和定期监控,我们可以得到扩展名为nmon的监控文件,这些文件记录着系统资源的数据,需要配合分析工具(nmon analyser)进行解读。
- 使用FTP工具从服务器上取下生成结果文件/nmon/log/sjfx212__1723.nmon到本机。
- 打开nmon_analyser.zip 包下的nmon analyser v33g.xls 文件,点击Analyse nomn data按钮,选择之前get下来的sjfx212__1723.nmon文件。
- 生成分析结果文件sjfx212__1723.nmon.xlsx,并生成统计图,直观显示系统资源情况。
- 系统汇总页面:对应标签页(SYS_SUMM)
页面显示项主要有主机名,执行日期,系统cpu使用情况(蓝线),系统I/O情况(粉红线),其中坐标左纵轴为系统cpu(user%+sys%)使用率,横轴为运行时长(下图为一个小时),右纵轴为系统磁盘传输(Disk xfers),坐标下侧为统计信息:系统I/O情况(一个周期内的平均值、最大值、出现最大值的时间),系统CPU使用情况。
选项 说明 备注 User% 用户进程时间在CPU 开销时间百分比 如果一个CPU 被充分使用,利用率分类之间均衡的比例应该是: 65% - 70% User Time 30% - 35% System Time 0% - 5% Idle Time Wait% 所有进程线程被阻塞等待完成一次IO 请求所占CPU 开销idle的时间百分比 Sys% 线程和中断在CPU 开销时间百分比 Idle% CPU 空闲时间的百分比 CPU% CPU 利用率的百分比
- 系统详细信息:标签页(BBBP)
页面信息主要包括:操作系统版本,主机磁盘信息,主机CPU型号、主频信息,内存信息,网卡信息等。
- CPU使用情况:标签页(CPU_ALL,CPU_SUMM,CPU001,CPU002,CPU003,CPU004)
主机CPU使用情况汇总以及单颗CPU的运行情况。
- 磁盘读写情况汇总:标签页(DISK_SUMM,DISKBSIZE,DISKBUSY,DISKREAD,DISKWRITE,DISKXFER)
磁盘的读、写及I/O统计信息,系统各磁盘分区的读写情况。其中DISKBUSY页主要反映系统本地磁盘使用,DISK_SUMM包括本地和存储(ESS, EMC, FASt及HDS)上所有磁盘使用情况。
- 内存使用情况:标签页(MEM)
系统内存空闲、使用,swap、cached等统计信息。
- 系统网络情况:标签页(NET,NETPACKET)
反映系统的网络运行情况,系统各个网络适配器读写的数据包数
- 系统进程:标签页(PROC)
反映系统运行线程及等待切换的线程平均数。其中RunQueue – 每个处理器应该运行队列不超过1-3个线程。
- 活动虚拟内存总量:标签页(VM)
Linux操作系统特有指标,主要包括系统/proc/vmstat文件中信息,两张图片主要显示系统分页文件(pagefile)和swap分区运行情况。如果系统总是存在大量换出页(pgpgout/s)KB数,说明系统需要更多内存。
- 页式调度:标签页(PAGE)
记录系统(AIX)页式调度的情况。这一栏主要记录系统换页(paging)情况和页面扫描:自由比率(page scan:free ratio)。其中系统换页频率应该不大于5次/秒,而当页面扫描:自由比率持续大于4时,需要重点关注下系统内存和分页空间的使用情况。
- Nmon监控案例介绍
本节介绍通过nmon工具发现系统性能下降问题的常见现象和处理流程。
5.1 常见现象和产生原因
性能下降(Performance Degradation),主要是指系统的性能随时间而逐渐下降(这里假定在系统性能下降的过程中系统的负载状况没有明显变化)。系统运行过程中占用的CPU或内存随时间增加也属于广义的性能下降问题。
在生产环境中,通常由终端客户最先感觉到并报告性能下降问题。所以狭义的性能下降问题主要是指系统运行指标随时间变化,比如吞吐率随时间下降或页面响应时间随时间上升,或者两者兼而有之。
下面列举一些引起性能下降问题的原因:
✓ 应用程序资源使用问题。主要是内存使用问题,即由于应用服务器的内存碎片问题或内存泄漏问题,导致垃圾回收的开销随时间增大。也有可能是因为磁盘临时文件积累造成磁盘访问开销增大。
✓ 应用程序设计问题。由于应用程序的设计存在可扩展性或可靠性问题,导致运行开销随时间或业务对象的积累而增大。
✓ 数据库访问问题。该问题又可以分为许多类型,如调优参数问题、表结构或索引设计问题、垃圾数据问题等。其共同特点是导致应用程序利用特定操作访问数据库的开销随时间而增大。
✓ 服务器软件资源使用问题。虽然可能性很小,但是应用服务器、数据库服务器等服务器程序也是软件程序,也有可能存在性能下降问题。这些服务器程序在自身测试过程中可能遗漏了某些性能问题,而在用户特定的执行状况下触发了这些问题,结果导致这些服务器程序使用的操作系统资源泄漏而出现性能下降问题。
✓ 测试用例设计问题。性能测试中有可能发现一些“假”的性能下降问题。比如测试用例设计时假设在测试执行过程中系统负载保持恒定,但实际的测试用例实现导致系统负载或特定页面的处理内容随时间增多,也可能导致测试工具的测试报告中出现性能下降问题。
5.2 实例介绍
5.2.1 示例一
- 收集服务器基本信息
分别输入c、t、n、m,可以了解系统cpu,内存,消耗资源最高的线程的使用情况。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/138005.html