IBM 系列AIX小型机巡检项目及流程参考 1、机器型号 # uname -uM IBM,7029-6E3 IBM,01100550A 2、检查系统硬件设备故障灯是否有亮 3、系统错误报告 # errpt -d H -T PERM //硬件的错误报告 IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION BFE4C025 0530085308 P H sysplanar0 UNDETERMINED ERROR BFE4C025 0529091308 P H sysplanar0 UNDETERMINED ERROR # errpt -d S -T PERM //软件的错误报告 # errpt -aj *******|more //具体的错误信息 # errpt -d H -T PERM>/tmp/hwerror.log //可以把错误的报告存成一个文件 4、有否给 root 用户的错误报告 # mail Mail [5.2 UCB] [AIX 5.X] Type ? for help. "/var/spool/mail/root": 5 messages 3 new 5 unread U 1 root Thu May 15 09:53 24/884 "diagela message from p615" U 2 root Fri May 16 04:07 24/884 "diagela message from p615" >N 3 root Sat May 24 13:08 23/874 "diagela message from p615" 5、检查 hacmp.ou t, smit.log, bootlog 等 # lssrc -g cluster/#>lssrc -g cluster Subsystem Group PID Status clstrmgrES cluster 16334 active 一般上 hacmp.out 的位置: /usr/sbin/cluster/ 或者 /tmp/ 然后找到最近的 hacmp.out 文件,察看有没有错误信息 6、文件系统检查 # df -k Filesystem 1024-blocks Free %Used Iused %Iused Mounted on /dev/hd4 131072 101568 23% 2268 4% / /dev/hd2 1441792 31256 98% 36056 11% /usr /dev/hd9var 131072 117048 11% 418 2% /var 看看有没有超过 90% 使用率的,建议用户改善 7、逻辑卷有否 "stale" 的状态 # lsvg -l rootvg LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT hd5 boot 1 1 1 closed/syncd N/A hd6 paging 4 4 1 open/syncd N/A hd8 jfslog 1 1 1 open/syncd N/A hd4 jfs 1 1 1 open/syncd / hd2 jfs 11 11 1 open/syncd /usr hd9var jfs 1 1 1 open/syncd /var 如果系统还有其他卷组,也需要察看 8、内存交换区的使用率是否超过 70% # lsps -a Page Space Physical Volume Volume Group Size %Used Active Auto Type hd6 hdisk0 rootvg 512MB 1 ye...