最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

HP小型机及存储巡检手册

IT圈 admin 70浏览 0评论

2024年2月20日发(作者:吾文林)

HP小型机及存储巡检手册

第一章 1

HP 小型机巡检手册

2

检查机房环境

CONTENTS

目录

第一章 检查机房环境:

3

第二章 HP 小型机巡检

4

2.1

系统配置检查 ........................................................... 4

2.2

检查系统硬件情况: ..................................................... 8

2.3

系统日志检查 .......................................................... 11

2.4

LVM 相关检查 .......................................................... 15

2.5

集群状态的检查 ........................................................ 18

2.6

系统总体性能评估 ...................................................... 20

2.7

系统备份检查 .......................................................... 22

第三章 HP PC 服务器巡检

23

3.1

检查前面板指示灯 ...................................................... 23

3.2

查3.3

看 iml 日志 ........................................................... 26

3.4

查看系统操作日志 ...................................................... 26

3.5

看 BOIS 版本号 ........................................................ 27

第四章 HP 磁阵巡检

28

4.1

EVA 系列 .............................................................. 28

4.2

MSA 系列 .............................................................. 32

第一章 检查机房环境

第一章 3

温度:室内温度应保持在 20~25 ℃ ? 湿度:相对湿度应保持在

40~60% ? 火线- 零线电压:198~232V ? 零线- 地线电压:应<1V, 最高不超过 3V ? 洁净度:机房应保持清洁,不能有太多的灰尘,如机房太脏应提醒客户注意。 ? 维护空间:机柜旁不宜摆放杂物,要根据各机型的规定留有足够的散热空间和维 护空间。 ? 电话线:机房应该配备电话线(用于紧急拨号维护或及时电话支持)。 ? 机房环境( 电源,

空调…) 近期内有没有较大变动

4

HP 小型机巡检

第二章 HP 小型机巡检

看 SMH(System Management

Homepage ) ............................... 26

2.1 系统配置检查

2.1.1 检查 HP-UX 操作系统版本

在终端上执行以下命令: asogz3:/ # uname -a HP-UX asogz3

B.11.11 U 9000/800 1135931517 unlimited-user license

2.1.2 检查 PDC 固件版本

在 cstm 或 mstm 中看 CPU 设备的 information,以 cstm 为例

#cstm cstm>map Dev Last Last Op Num Path Product Active Tool

Status === ====================

=========== 1 =========================

system system () Information Successful 2 0 Bus Adapter (582)

Information Successful 3 0/0 PCI Bus Adapter (782) Information

Successful 4 0/0/0/0 Core PCI 100BT Interface Information

Successful 5 0/0/1/0 PCI SCSI Interface (10000 Information

Successful 6 0/0/1/0.3.0 SCSI Tape (HPC1537A) Information

Successful 7 0/0/1/1 PCI SCSI Interface (10000 Information

Successful 8 0/0/1/1.15.0 SCSI Disk (SEAGATEST31840

Information Successful 9 0/0/2/0 PCI SCSI Interface (10000

Information Successful 10 0/0/2/0.3.0 SCSI Disk (HPDVD-ROM)

Information Successful 11 0/0/2/1 PCI SCSI Interface (10000

Information Successful 12 0/0/2/1.15.0 SCSI Disk

(HP36.4GATLAS10 Information Successful 13 0/0/4/0 RS-232

Interface (103c104 Information Successful 14 0/0/5/0 RS-232

Interface (103c104 Information Successful 15 8 MEMORY (9b)

Information Successful 16 160 CPU (5cb) Information Successful

第二章 5

cstm>select dev 16 cstm>info -- Updating Map -Updating

cstm>il Hardware path: 160 Product ID: CPU Module Type:

0 Hardware Model: 0x5cb Software Model: 0x4 Hardware

Revision: 0 Software Revision: 0 Hardware ID: 0 Software ID:

566770598 Boot ID: 0x1 Software Option: 0x91 Processor

Number: 0 Path: 160 Hard Physical Address: 0xfffffffffffa0000 Soft

Physical Address: 0 Slot Number: 8 Software Capability:

0x100000f0 PDC Firmware Revision: 41.18 IODC Revision: 0

Instruction Cache [Kbyte]: 512 Processor Speed: N/A

Processor State: N/A Monarch: Yes Active: Yes Data Cache

[Kbyte]: 1024

2.1.3 通过 sam 检查 CPU 和内存信息

例如检查 CPU 信息: hp01:/>#sam Starting the terminal

version To move around in sam: - use the "Tab" key to

move between screen elements - use the arrow keys to move

within screen elements - use "Ctrl-F" for context-sensitive help

anywhere in sam On screens with a menubar at the top like this:

-----------------------------------------------------|File

--- ---| - use "Tab" to move from the list to the menubar

6

HP 小型机巡检

- use the arrow keys to move around - use "Return" to pull

down a menu or select a menu item - use "Tab" to move from the

menubar to the list without selecting a menu item - use the

spacebar to select an item in the list On any screen, press

"CTRL-K" for more information on how to use the keyboard. Press

"Return" 根据提示按任意键则进到 SAM 界面:

在 SAM 的界面,可以用 tab 键和上下左右箭头方向键来移动光标。

在 SAM 界面下可以执行大部分管理员日常任务,比如我要查看主机 CPU 和内存的信 息,可以移动光标到 Performance Monitors 这行,如图:

View

Options Actions Help| | ---- ---- ------- ----------------------------

回车,选择 System Properties:

第二章 7

回车进去就能看到 CPU 内存等主机信息:

移动光标到 File 菜单下,选择 Exit SAM,回车,即可退出 SAM:

2.1.4 检查本地磁盘的大小和个数

用 ioscan –fnCdisk 可查看硬盘的信息,例如: # ioscan -fnCdisk Class I H/W Path Driver S/W State H/W Type Description

================================================================

8

HP 小型机巡检

disk 1 0/1/1/0.0.0 sdisk CLAIMED DEVICE HP

73.4GST373454LC /dev/dsk/c2t0d0 /dev/rdsk/c2t0d0 可以看到本地只有一个硬盘,大小为 73..4G

2.2 检查系统硬件情况:

2.2.1 指示灯状态

以下以 rp3440, rp4440 为例解释前面板指示灯的具体含义 1、

rp3440 前视图

控制面板:

我们需要留意如图所示的系统 LED 指示灯的状态,在机器运行正常的情况下,系统 LED 是绿色长亮,如果系统 LED 是黄色闪烁状态,表明机器存在一般告警,如果是 红色闪烁状态,表明机器有严重的错误 2、 rp4440 前视图

第二章 9

控制面板:

主要还是观察系统 LED 和温度 LED 的状态,正常应是绿色。 注:除了检查系统 LED 外,机器的所有部件的指示灯也要检查,正常状态

是绿色,如 果发现有黄色,红色或者指示灯不亮的情况,则一般存在硬件故障。

10

HP 小型机巡检

2.2.2 用 ioscan 查看硬件状态

在 ioscan 的输出结果中,查看 S/W State 这一列的状态,正常情况下,硬件的状态应 该是“CLAIMED”,如果发现状态是“NO_HW”或者”UNCLAIMED”, 则表明该硬件 已经无法识别,需要进一步检查。

2.2.3 用 lanscan 命令查看网卡状态

2.2.4 检查磁带机和光驱是否可用(过程略)

2.3 系统日志检查

第二章 11

2.3.1 检查 MP/GSP 卡日志

MP/GSP 卡是 HP 小型机里的一张独立于主机和系统之外的集成卡,这张卡里面有小 型的集成系统,这个系统可以监控和管理主机和系统的运行状况,一般我们可以 通过串口连接的方式访问 MP 卡。

收集 MP 卡日志的方法如下:

第 1 步:首先找到机器 MP 卡上的串口,有的 MP 卡上可能有多个串口,我们需要用到 的串口旁边一般会标注有“local”或者“console”字样,以 RP4440 为例,我们需 要用到的串口就是如图所示最左边的串口:

第 2 步.用串口线连接 MP 卡的串口和我们笔记本(或台式机)的串口

第 3 步.运行笔记本上的超级终端软件,配置如下: ? 8 位,无奇偶校验 ? 9600 波特 ? 无(接收) ? 无(传输) 第 4 步.回车或者按

ctrl-b 看是否已经连接成功,如果连接成功,会提示你输 入用户名和密码,默认的用户名和密码均是 Admin(注意 A 要大写),登陆成 功后,界面如下:

12

HP 小型机巡检

MP MAIN MENU: CO: Console VFP: Virtual Front Panel CM:

Command Menu CL: Console Logs SL: Show Event Logs HE: Main

Menu Help X: Exit Connection

第 5 步.输入 sl 命令收集日志,显示如下:

[mp0015608aca2d] MP>

Event Log Viewer Menu:

Log Name

Entries

% Full

E - System Event 06 32

3%

F - Forward Progress 33

0%

B - Current Boot 06 33

11 %

P - Previous Boot

0

C - Clear All Logs

L - Live Events

Enter menu item or [Ctrl-B] to Quit:

Latest Timestamped Entry Apr 2009 00:33:56 06 Apr 2009

00:33:56 Apr 2009 00:33:5

第 6 步.输入 e,选择 System Event,

Enter menu item or [Ctrl-B] to Quit: e

Log Name

Entries

% Full

Latest Timestamped

Entry

Event Log Navigation Help:

+

View next block (forward in time, e.g. from 3 to 4)

Continue to the next or previous block

D

Dump the entire log

F

First entry

L

Last entry

J

Jump to entry number

H

View mode configuration - Hex

K View mode configuration - Keyword

T

View mode configuration - Text

A

Alert Level Filter options

U

Alert Level Unfiltered

Display this Help menu

Q Ctrl-B

Quit and return to the Event Log Viewer Menu Exit command,

and return to the MP Main Menu

第二章 13

第 7 步,可以选择 a-->3 查看 3 等级以上的日志: MP:SL (+,-,,D,

F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >a a Alert Level

Threshold Filter: 1 : Major Forward Progress 2 : Informational 3 :

Warning 5 : Critical 7 : Fatal Enter alert level threshold or [Q] to

quit filter setup: 3 -> Alert threshold level 3 filter will be applied.

MP:SL (+,-,,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >

# Location|Alert| Encoded Field | Data Field | Keyword /

Timestamp

556

SFW 0 *3 0x648001D200E030A0

MEM_DIMM_HW_DEALLOCATED

08:46:31

555

SFW 0 *3 0x648001D200E03080

MEM_DIMM_HW_DEALLOCATED

08:46:31

554

SFW o *3 0x648001D200E03060

MEM_DIMM_HW_DEALLOCATED

08:46:31

553

SFW o *3 0x648001D200E03040

MEM_DIMM_HW_DEALLOCATED

552

SFW o *3 0x648001D200E03020

MEM_DIMM_HW_DEALLOCATED

FFFFFFFF003BFF74

02

Jun

FFFFFFFF003AFF74

02

Jun

FFFFFFFF002BFF74

02

Jun

FFFFFFFF002AFF74

02

Jun

FFFFFFFF003BFF74

02

Jun

也可以选择 d-->y ,把整个 System Event 日志保存下来:

2010 2010 2010 2010 2010

14

2.3.2

HP 小型机巡检 查看 dmesg 输出

运行命令 dmesg 是一个即简单又快捷的方法来查看系统硬件及文件系统有无报 错。dmesg 的工作原理是直接从系统的缓冲器(buffer)中读取系统最近一段时期内 的硬件状态。 查看 dmesg 的输出时,应着重观察有没有类似”SCSI Reset”, “Disk PowerFailed”, “PV

path …”, “LPMC”, “file system full”等报错信息 。

2.3.3 查看系统启动日志

系统的启动日志是指文件:/etc/ . 可以用 vi 命令进行查看,看/etc/ 日志中有没有”Fail”或”error”;如果 有,就代表系统在启动时相应的启动脚本运行失败。

2.3.4 查看 syslog 日志

syslog 日志所在的路径是:/var/adm/syslog/. 查看

日志中有没有”SCSI Reset”, “Disk Power Failed”,

“PV path…”, “LPMC”, “file system full”, “Fail”, “Error”,

“Warning”等错误信息

2.3.5 查看 event 日志

event 日志所在的路径是:/var/opt/resmon/log/ 通过 event 日志可以查看到硬件的报错信息。

2.3.6 查看 shutdown 日志

shutdown 日志所在的路径是:/etc/shutdownglog shutdowng

日志记录了系统所有停止,重启的时间

2.3.7 查看 crash 日志

进到/var/adm/crash 文件夹,查看系统近期有没有发生过 core

dump

2.4 LVM 相关检查

第二章 15

2.4.1 用 vgdisplay –v 检查 VG 状态

从输出结果中可以查看 VG,LV 和 PV 的状态,VG 和 PV 正常状态是 available,LV

正常状态是 available/sync,也可以从输出中查看 LV 是否做了镜像

例如: # vgdisplay -v --- Volume groups --VG Name VG Write

Acces VG Status s Max LV Cur LV Open LV Max PV Cur PV Act PV

Max PE per PV VGDAPE Size (Mbytes) 16 Total PE Alloc PE Free

PE Total PVG Total Spare PVs Total Spare PVs in use

/dev/vg00

read/write available 255 10 10 16 2 1 4384 2 4374 1836 2538

0 0 0

- Logical volumes ---

LV Name LV Status Current LE LV Size (Mbytes) Allocated PE

Used PV

/dev/vg00/lvol1 available/stale

32 512 64 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvol2 available/stale 8192 512 1024 1

16

LVName

HP 小型机巡检

/dev/vg00/lvol3

LVStatus LV Size (Mbytes) Current LE Allocated PE Used PV

available/stale 1024 64 128 1

LV Name LV Status LV Size (Mbytes) Current LE 64 Allocated

PE Used PV

/dev/vg00/lvol4 available/stale 1024 64 128 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvol5 available/stale 4096 256 512 1

LV Name LV Status LV Size (Mbytes)

/dev/vg00/lvol6 available/stale 4096

Current LE

256

Allocated PE

512

Used PV

1

LV Name LV Status e Used PV 1

/dev/vg00/lvol7 available/stal

LV Size (Mbytes) Current LE Allocated PE Used PV

4096 256 512 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

LVName

/dev/vg00/lvol8

/dev/vg00/lvol_oracle

LV Status LV Size (Mbytes) Current LE Allocated PE Used PV

available/stale 208 13 26 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvorainst available/syncd 2032 127 127 1

--- Physical volumes --PV Name PV Status Total PE Free PE

Autoswitch

/dev/dsk/c2t0d0 available 4374 2538 On

第二章 17

2.4.2 用 bdf 查看 文件系统 的使用情况

用命令 bdf 查看文件系统的使用情况,如果有文件系统的使用率超过 90%,则建议对文

件系统进行清理或者扩大该文件系统

# bdf

Filesystem

Kbytes

used

/dev/vg00/lvol3 1048576

364840

Avail%used Mounted on

678464

35% /

/dev/vg00/lvol1 511672

8254

4 377960

available/stale 4096 256 512

18% /stand

/dev/vg00/lvol8 4194304

817952

3351600

20% /var

/dev/vg00/lvol7 4194304

1420944

2751760

34% /usr

/dev/vg00/lvol4 1048576

857000

190944

82% /tmp

/dev/vg00/lvol6 4194304

1719528

2455456

41% /opt

/dev/vg00/lvol5 4194304

3496

4158168

0% /home

18

HP 小型机巡检

2.5 集群状态的检查

1、用 cmviewcl –v 查看整个集群的运行状态

第二章 19

2、查看群集每个包(package) 日志

包日志所在路径是:/etc/cmcluster/pkgXX/。集群

的每个包(Package)都有自己的运行日志,并且每个包(Package)的实 时日志是保存在这个包所正在运行的主机节点上。我们查看集群的日志主要是看日 志中有没有类似于“Failed”, “Error”等报错信息 3、 检查锁盘标记

2024年2月20日发(作者:吾文林)

HP小型机及存储巡检手册

第一章 1

HP 小型机巡检手册

2

检查机房环境

CONTENTS

目录

第一章 检查机房环境:

3

第二章 HP 小型机巡检

4

2.1

系统配置检查 ........................................................... 4

2.2

检查系统硬件情况: ..................................................... 8

2.3

系统日志检查 .......................................................... 11

2.4

LVM 相关检查 .......................................................... 15

2.5

集群状态的检查 ........................................................ 18

2.6

系统总体性能评估 ...................................................... 20

2.7

系统备份检查 .......................................................... 22

第三章 HP PC 服务器巡检

23

3.1

检查前面板指示灯 ...................................................... 23

3.2

查3.3

看 iml 日志 ........................................................... 26

3.4

查看系统操作日志 ...................................................... 26

3.5

看 BOIS 版本号 ........................................................ 27

第四章 HP 磁阵巡检

28

4.1

EVA 系列 .............................................................. 28

4.2

MSA 系列 .............................................................. 32

第一章 检查机房环境

第一章 3

温度:室内温度应保持在 20~25 ℃ ? 湿度:相对湿度应保持在

40~60% ? 火线- 零线电压:198~232V ? 零线- 地线电压:应<1V, 最高不超过 3V ? 洁净度:机房应保持清洁,不能有太多的灰尘,如机房太脏应提醒客户注意。 ? 维护空间:机柜旁不宜摆放杂物,要根据各机型的规定留有足够的散热空间和维 护空间。 ? 电话线:机房应该配备电话线(用于紧急拨号维护或及时电话支持)。 ? 机房环境( 电源,

空调…) 近期内有没有较大变动

4

HP 小型机巡检

第二章 HP 小型机巡检

看 SMH(System Management

Homepage ) ............................... 26

2.1 系统配置检查

2.1.1 检查 HP-UX 操作系统版本

在终端上执行以下命令: asogz3:/ # uname -a HP-UX asogz3

B.11.11 U 9000/800 1135931517 unlimited-user license

2.1.2 检查 PDC 固件版本

在 cstm 或 mstm 中看 CPU 设备的 information,以 cstm 为例

#cstm cstm>map Dev Last Last Op Num Path Product Active Tool

Status === ====================

=========== 1 =========================

system system () Information Successful 2 0 Bus Adapter (582)

Information Successful 3 0/0 PCI Bus Adapter (782) Information

Successful 4 0/0/0/0 Core PCI 100BT Interface Information

Successful 5 0/0/1/0 PCI SCSI Interface (10000 Information

Successful 6 0/0/1/0.3.0 SCSI Tape (HPC1537A) Information

Successful 7 0/0/1/1 PCI SCSI Interface (10000 Information

Successful 8 0/0/1/1.15.0 SCSI Disk (SEAGATEST31840

Information Successful 9 0/0/2/0 PCI SCSI Interface (10000

Information Successful 10 0/0/2/0.3.0 SCSI Disk (HPDVD-ROM)

Information Successful 11 0/0/2/1 PCI SCSI Interface (10000

Information Successful 12 0/0/2/1.15.0 SCSI Disk

(HP36.4GATLAS10 Information Successful 13 0/0/4/0 RS-232

Interface (103c104 Information Successful 14 0/0/5/0 RS-232

Interface (103c104 Information Successful 15 8 MEMORY (9b)

Information Successful 16 160 CPU (5cb) Information Successful

第二章 5

cstm>select dev 16 cstm>info -- Updating Map -Updating

cstm>il Hardware path: 160 Product ID: CPU Module Type:

0 Hardware Model: 0x5cb Software Model: 0x4 Hardware

Revision: 0 Software Revision: 0 Hardware ID: 0 Software ID:

566770598 Boot ID: 0x1 Software Option: 0x91 Processor

Number: 0 Path: 160 Hard Physical Address: 0xfffffffffffa0000 Soft

Physical Address: 0 Slot Number: 8 Software Capability:

0x100000f0 PDC Firmware Revision: 41.18 IODC Revision: 0

Instruction Cache [Kbyte]: 512 Processor Speed: N/A

Processor State: N/A Monarch: Yes Active: Yes Data Cache

[Kbyte]: 1024

2.1.3 通过 sam 检查 CPU 和内存信息

例如检查 CPU 信息: hp01:/>#sam Starting the terminal

version To move around in sam: - use the "Tab" key to

move between screen elements - use the arrow keys to move

within screen elements - use "Ctrl-F" for context-sensitive help

anywhere in sam On screens with a menubar at the top like this:

-----------------------------------------------------|File

--- ---| - use "Tab" to move from the list to the menubar

6

HP 小型机巡检

- use the arrow keys to move around - use "Return" to pull

down a menu or select a menu item - use "Tab" to move from the

menubar to the list without selecting a menu item - use the

spacebar to select an item in the list On any screen, press

"CTRL-K" for more information on how to use the keyboard. Press

"Return" 根据提示按任意键则进到 SAM 界面:

在 SAM 的界面,可以用 tab 键和上下左右箭头方向键来移动光标。

在 SAM 界面下可以执行大部分管理员日常任务,比如我要查看主机 CPU 和内存的信 息,可以移动光标到 Performance Monitors 这行,如图:

View

Options Actions Help| | ---- ---- ------- ----------------------------

回车,选择 System Properties:

第二章 7

回车进去就能看到 CPU 内存等主机信息:

移动光标到 File 菜单下,选择 Exit SAM,回车,即可退出 SAM:

2.1.4 检查本地磁盘的大小和个数

用 ioscan –fnCdisk 可查看硬盘的信息,例如: # ioscan -fnCdisk Class I H/W Path Driver S/W State H/W Type Description

================================================================

8

HP 小型机巡检

disk 1 0/1/1/0.0.0 sdisk CLAIMED DEVICE HP

73.4GST373454LC /dev/dsk/c2t0d0 /dev/rdsk/c2t0d0 可以看到本地只有一个硬盘,大小为 73..4G

2.2 检查系统硬件情况:

2.2.1 指示灯状态

以下以 rp3440, rp4440 为例解释前面板指示灯的具体含义 1、

rp3440 前视图

控制面板:

我们需要留意如图所示的系统 LED 指示灯的状态,在机器运行正常的情况下,系统 LED 是绿色长亮,如果系统 LED 是黄色闪烁状态,表明机器存在一般告警,如果是 红色闪烁状态,表明机器有严重的错误 2、 rp4440 前视图

第二章 9

控制面板:

主要还是观察系统 LED 和温度 LED 的状态,正常应是绿色。 注:除了检查系统 LED 外,机器的所有部件的指示灯也要检查,正常状态

是绿色,如 果发现有黄色,红色或者指示灯不亮的情况,则一般存在硬件故障。

10

HP 小型机巡检

2.2.2 用 ioscan 查看硬件状态

在 ioscan 的输出结果中,查看 S/W State 这一列的状态,正常情况下,硬件的状态应 该是“CLAIMED”,如果发现状态是“NO_HW”或者”UNCLAIMED”, 则表明该硬件 已经无法识别,需要进一步检查。

2.2.3 用 lanscan 命令查看网卡状态

2.2.4 检查磁带机和光驱是否可用(过程略)

2.3 系统日志检查

第二章 11

2.3.1 检查 MP/GSP 卡日志

MP/GSP 卡是 HP 小型机里的一张独立于主机和系统之外的集成卡,这张卡里面有小 型的集成系统,这个系统可以监控和管理主机和系统的运行状况,一般我们可以 通过串口连接的方式访问 MP 卡。

收集 MP 卡日志的方法如下:

第 1 步:首先找到机器 MP 卡上的串口,有的 MP 卡上可能有多个串口,我们需要用到 的串口旁边一般会标注有“local”或者“console”字样,以 RP4440 为例,我们需 要用到的串口就是如图所示最左边的串口:

第 2 步.用串口线连接 MP 卡的串口和我们笔记本(或台式机)的串口

第 3 步.运行笔记本上的超级终端软件,配置如下: ? 8 位,无奇偶校验 ? 9600 波特 ? 无(接收) ? 无(传输) 第 4 步.回车或者按

ctrl-b 看是否已经连接成功,如果连接成功,会提示你输 入用户名和密码,默认的用户名和密码均是 Admin(注意 A 要大写),登陆成 功后,界面如下:

12

HP 小型机巡检

MP MAIN MENU: CO: Console VFP: Virtual Front Panel CM:

Command Menu CL: Console Logs SL: Show Event Logs HE: Main

Menu Help X: Exit Connection

第 5 步.输入 sl 命令收集日志,显示如下:

[mp0015608aca2d] MP>

Event Log Viewer Menu:

Log Name

Entries

% Full

E - System Event 06 32

3%

F - Forward Progress 33

0%

B - Current Boot 06 33

11 %

P - Previous Boot

0

C - Clear All Logs

L - Live Events

Enter menu item or [Ctrl-B] to Quit:

Latest Timestamped Entry Apr 2009 00:33:56 06 Apr 2009

00:33:56 Apr 2009 00:33:5

第 6 步.输入 e,选择 System Event,

Enter menu item or [Ctrl-B] to Quit: e

Log Name

Entries

% Full

Latest Timestamped

Entry

Event Log Navigation Help:

+

View next block (forward in time, e.g. from 3 to 4)

Continue to the next or previous block

D

Dump the entire log

F

First entry

L

Last entry

J

Jump to entry number

H

View mode configuration - Hex

K View mode configuration - Keyword

T

View mode configuration - Text

A

Alert Level Filter options

U

Alert Level Unfiltered

Display this Help menu

Q Ctrl-B

Quit and return to the Event Log Viewer Menu Exit command,

and return to the MP Main Menu

第二章 13

第 7 步,可以选择 a-->3 查看 3 等级以上的日志: MP:SL (+,-,,D,

F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >a a Alert Level

Threshold Filter: 1 : Major Forward Progress 2 : Informational 3 :

Warning 5 : Critical 7 : Fatal Enter alert level threshold or [Q] to

quit filter setup: 3 -> Alert threshold level 3 filter will be applied.

MP:SL (+,-,,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >

# Location|Alert| Encoded Field | Data Field | Keyword /

Timestamp

556

SFW 0 *3 0x648001D200E030A0

MEM_DIMM_HW_DEALLOCATED

08:46:31

555

SFW 0 *3 0x648001D200E03080

MEM_DIMM_HW_DEALLOCATED

08:46:31

554

SFW o *3 0x648001D200E03060

MEM_DIMM_HW_DEALLOCATED

08:46:31

553

SFW o *3 0x648001D200E03040

MEM_DIMM_HW_DEALLOCATED

552

SFW o *3 0x648001D200E03020

MEM_DIMM_HW_DEALLOCATED

FFFFFFFF003BFF74

02

Jun

FFFFFFFF003AFF74

02

Jun

FFFFFFFF002BFF74

02

Jun

FFFFFFFF002AFF74

02

Jun

FFFFFFFF003BFF74

02

Jun

也可以选择 d-->y ,把整个 System Event 日志保存下来:

2010 2010 2010 2010 2010

14

2.3.2

HP 小型机巡检 查看 dmesg 输出

运行命令 dmesg 是一个即简单又快捷的方法来查看系统硬件及文件系统有无报 错。dmesg 的工作原理是直接从系统的缓冲器(buffer)中读取系统最近一段时期内 的硬件状态。 查看 dmesg 的输出时,应着重观察有没有类似”SCSI Reset”, “Disk PowerFailed”, “PV

path …”, “LPMC”, “file system full”等报错信息 。

2.3.3 查看系统启动日志

系统的启动日志是指文件:/etc/ . 可以用 vi 命令进行查看,看/etc/ 日志中有没有”Fail”或”error”;如果 有,就代表系统在启动时相应的启动脚本运行失败。

2.3.4 查看 syslog 日志

syslog 日志所在的路径是:/var/adm/syslog/. 查看

日志中有没有”SCSI Reset”, “Disk Power Failed”,

“PV path…”, “LPMC”, “file system full”, “Fail”, “Error”,

“Warning”等错误信息

2.3.5 查看 event 日志

event 日志所在的路径是:/var/opt/resmon/log/ 通过 event 日志可以查看到硬件的报错信息。

2.3.6 查看 shutdown 日志

shutdown 日志所在的路径是:/etc/shutdownglog shutdowng

日志记录了系统所有停止,重启的时间

2.3.7 查看 crash 日志

进到/var/adm/crash 文件夹,查看系统近期有没有发生过 core

dump

2.4 LVM 相关检查

第二章 15

2.4.1 用 vgdisplay –v 检查 VG 状态

从输出结果中可以查看 VG,LV 和 PV 的状态,VG 和 PV 正常状态是 available,LV

正常状态是 available/sync,也可以从输出中查看 LV 是否做了镜像

例如: # vgdisplay -v --- Volume groups --VG Name VG Write

Acces VG Status s Max LV Cur LV Open LV Max PV Cur PV Act PV

Max PE per PV VGDAPE Size (Mbytes) 16 Total PE Alloc PE Free

PE Total PVG Total Spare PVs Total Spare PVs in use

/dev/vg00

read/write available 255 10 10 16 2 1 4384 2 4374 1836 2538

0 0 0

- Logical volumes ---

LV Name LV Status Current LE LV Size (Mbytes) Allocated PE

Used PV

/dev/vg00/lvol1 available/stale

32 512 64 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvol2 available/stale 8192 512 1024 1

16

LVName

HP 小型机巡检

/dev/vg00/lvol3

LVStatus LV Size (Mbytes) Current LE Allocated PE Used PV

available/stale 1024 64 128 1

LV Name LV Status LV Size (Mbytes) Current LE 64 Allocated

PE Used PV

/dev/vg00/lvol4 available/stale 1024 64 128 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvol5 available/stale 4096 256 512 1

LV Name LV Status LV Size (Mbytes)

/dev/vg00/lvol6 available/stale 4096

Current LE

256

Allocated PE

512

Used PV

1

LV Name LV Status e Used PV 1

/dev/vg00/lvol7 available/stal

LV Size (Mbytes) Current LE Allocated PE Used PV

4096 256 512 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

LVName

/dev/vg00/lvol8

/dev/vg00/lvol_oracle

LV Status LV Size (Mbytes) Current LE Allocated PE Used PV

available/stale 208 13 26 1

LV Name LV Status LV Size (Mbytes) Current LE Allocated PE

Used PV

/dev/vg00/lvorainst available/syncd 2032 127 127 1

--- Physical volumes --PV Name PV Status Total PE Free PE

Autoswitch

/dev/dsk/c2t0d0 available 4374 2538 On

第二章 17

2.4.2 用 bdf 查看 文件系统 的使用情况

用命令 bdf 查看文件系统的使用情况,如果有文件系统的使用率超过 90%,则建议对文

件系统进行清理或者扩大该文件系统

# bdf

Filesystem

Kbytes

used

/dev/vg00/lvol3 1048576

364840

Avail%used Mounted on

678464

35% /

/dev/vg00/lvol1 511672

8254

4 377960

available/stale 4096 256 512

18% /stand

/dev/vg00/lvol8 4194304

817952

3351600

20% /var

/dev/vg00/lvol7 4194304

1420944

2751760

34% /usr

/dev/vg00/lvol4 1048576

857000

190944

82% /tmp

/dev/vg00/lvol6 4194304

1719528

2455456

41% /opt

/dev/vg00/lvol5 4194304

3496

4158168

0% /home

18

HP 小型机巡检

2.5 集群状态的检查

1、用 cmviewcl –v 查看整个集群的运行状态

第二章 19

2、查看群集每个包(package) 日志

包日志所在路径是:/etc/cmcluster/pkgXX/。集群

的每个包(Package)都有自己的运行日志,并且每个包(Package)的实 时日志是保存在这个包所正在运行的主机节点上。我们查看集群的日志主要是看日 志中有没有类似于“Failed”, “Error”等报错信息 3、 检查锁盘标记

发布评论

评论列表 (0)

  1. 暂无评论