备份服务器信息收集

备份服务器信息收集,第1张

收集NBU软件信息 nbsu_info

C:\Program Files\Veritas\NetBackup\bin\support\nbsu.exe -s DEV_scsi_reg -s NBU_nbdb_info -s

收集进程状态信息 NBU_bpps

C:\Program Files\Veritas\NetBackup\bin\bpps

备份存储单元状态 NBU_bpstulist

C:\Program Files\Veritas\netbackup\bin\admincmd\bpstulist -g -U

磁带使用状态    NBU_available_media

C:\Program Files\Veritas\NetBackup\Bin\goodies\available_media -a

客户端信息      NBU_bpplclients

C:\Program Files\Veritas\NetBackup\Bin\admincmd\bpplclients -allunique -U

备份作业检查    NBU_backup_status

C:\Program Files\Veritas\NetBackup\Bin\admincmd\bperror -U -backstat

linux下巡检命令

[root@nbuserver ~]# /usr/openv/netbackup/bin/bpps -a

[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpstulist -L

[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpplclients -allunique -U

[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpdbjobs -L

[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bperror -backstat -hoursago 72 –L

日志文件收集执行命令  /usr/openv/netbackup/bin/support/nbsu -c -t

启动NetBackup图形界面

/usr/openv/netbackup/bin/jnbSA &

可做alias如下所示

oracle@nbumaster:~>cat /etc/bash.bashrc | grep ^alias

alias nbu='/usr/openv/netbackup/bin/jnbSA &'

NetBackup故障后,日志收集

nbumaster:~ # /usr/openv/netbackup/bin/support/nbsu

日志存放点:/usr/openv/netbackup/bin/support/output/nbsu

以及收集如下日志:

3. Display NetBackup status and troubleshooting information or entries from NetBackup error catalog

Unix/Linux

/usr/openv/netbackup/bin/admincmd/bperror -all -hoursago 72 -verbose -U >/tmp/bperror_all.txt

/usr/openv/netbackup/bin/admincmd/bperror -backstat -hoursago 72 -verbose -U >/tmp/bperror_backstat.txt

/usr/openv/netbackup/bin/admincmd/bperror -problems -hoursago 72 -verbose -U >/tmp/bperror_problems.txt

/usr/openv/netbackup/bin/admincmd/bperror -media -hoursago 72 -verbose -U >/tmp/bperror_media.txt

/usr/openv/netbackup/bin/admincmd/bperror -tape -hoursago 72 -verbose -U >/tmp/bperror_tape.txt

3、磁带立即过期

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpexpdate -m media_id -d 0

4、查看所有磁带使用情况,条形码为media id

nbumaster:~ # /usr/openv/netbackup/bin/goodies/available_media

5、查看磁带过期时间

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpmedialist -U

6、查看nbu的版本

nbumaster:~ # cat /usr/openv/netbackup/version

HARDWARE LINUX_SUSE_X86

VERSION NetBackup 7.0.0

RELEASEDATE Thu Jul 08 01:22:07 CDT 2010

BUILDNUMBER 20100707

nbumaster:~ # more /usr/openv/netbackup/bin/version

NetBackup-SuSE2.6.16 7.0.1

7、查看驱动器的状态,是否处于正常的TLD状态还是ACTIVE,或者不正常的AVR状态

nbumaster:~ # /usr/openv/volmgr/bin/vmoprcmd

8、查看驱动器是否需要清洗

nbumaster:~ # /usr/openv/volmgr/bin/tpclean -L

Drive Name              Type      Mount Time  Frequency  Last Cleaned        Comment

**********              ****      **********  *********  ****************    *******

HP.ULTRIUM4-SCSI.000    hcart*    4231.6      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.001    hcart*    798.4      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.002    hcart*    645.0      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.003    hcart*    642.3      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.004    hcart*    2340.8      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.005    hcart*    646.2      0                N/A            NEEDS CLEANING

HP.ULTRIUM4-SCSI.006    hcart*    14.9        0                N/A

HP.ULTRIUM4-SCSI.007    hcart*    17.4        0                N/A

HP.ULTRIUM4-SCSI.008    hcart*    10.0        0                N/A

HP.ULTRIUM4-SCSI.009    hcart*    22.1        0                N/A

9、扫描本机所有的机械手和驱动器

nbumaster:~ #/usr/openv/volmgr/bin/scan

************************************************************

*********************** SDT_TAPE    ************************

*********************** SDT_CHANGER ************************

************************************************************

------------------------------------------------------------

Device Name  : "/dev/sg30"  //机械手

Passthru Name: "/dev/sg30"

Volume Header: ""

Port: -1Bus: -1Target: -1LUN: -1

Inquiry    : "ADIC    Scalar i2000    650Q"

Vendor ID  : "ADIC    "

Product ID : "Scalar i2000    "

Product Rev: "650Q"

Serial Number: "ADIC273100135_LL0"

WWN          : ""

WWN Id Type  : 0

Device Identifier: "ADIC    273100135_LL0          "

Device Type    : SDT_CHANGER  //机械手

NetBackup Robot Type: 8

Removable      : Yes

Device Supports: SCSI-3

Number of Drives : 10

Number of Slots  : 684

Number of Media Access Ports: 24  //10个驱动器

Drive 1 Serial Number      : "HU10159TD2"

Drive 2 Serial Number      : "HU10109851"

Drive 3 Serial Number      : "HU10159TC8"

Drive 4 Serial Number      : "HU10038GVG"

Drive 5 Serial Number      : "HU10109839"

Drive 6 Serial Number      : "HU101098DU"

Drive 7 Serial Number      : "HU10159TCV"

Drive 8 Serial Number      : "HU1010983B"

Drive 9 Serial Number      : "MXP1226LMC"

Drive 10 Serial Number      : "HU10159TAP"

10、手动尝试抓取机械手,可验证机械手是否正常,该操作可在nbu服务未启动时候就可执行

以下表明机械手找不到

nbumaster:/usr/openv/volmgr/misc # /usr/openv/volmgr/bin/robtest

Configured robots with local control supporting test utilities:

  TLD(0)    robotic path = /dev/sg8

Robot Selection

---------------

  1)  TLD 0

  2)  none/quit

Enter choice: 1

Robot selected: TLD(0)  robotic path = /dev/sg8

Invoking robotic test utility:

/usr/openv/volmgr/bin/tldtest -rn 0 -r /dev/sg8

Opening /dev/sg8

Error opening /dev/sg8, No such device or address

Robotic test utility /usr/openv/volmgr/bin/tldtest

returned abnormal exit status (1).

11、查看磁带驱动器及robot(机械手)细节情况

nbumaster:~ # /usr/openv/volmgr/bin/tpconfig -d 亦可使用tpconfig -dl或tpconfig -l,显示的信息是不一样的

Id  DriveName          Type  Residence

      Drive Path                                                      Status

****************************************************************************

0  HP.ULTRIUM4-SCSI.000 hcart  TLD(0)  DRIVE=10

      /dev/nst5                                                        UP

1  HP.ULTRIUM4-SCSI.001 hcart  TLD(0)  DRIVE=9

      /dev/nst6                                                        UP

2  HP.ULTRIUM4-SCSI.002 hcart  TLD(0)  DRIVE=8

      /dev/nst9                                                        UP

Currently defined robotics are:

  TLD(0)    robotic path = /dev/sg30

EMM Server = nbumaster

可使用如下命令查看驱动器和机械手的相关信息

(Display device configuration)

  tpconfig -d

  tpconfig -dl

  tpconfig -l

另/usr/openv/volmgr/bin/tpconfig      提供add ,delete,list NBU可以识别并使用的物理设备,如

机械手/dev/sg30的符号在操作系统更改后,可通过tpconfig来进行更改

12、查看nbu进程情况,一般使用bpps -x

nbumaster:~ # /usr/openv/netbackup/bin/bpps  -列出nbu服务运行的进程

-a  在列表中包括介质管理器进程

-x  在列表中包括介质管理器进程和其他共享进程

13、查看操作系统是否认识到机械手

nbumaster:~ # cat /proc/scsi/scsi  可搜索关键字Medium

Host: scsi1 Channel: 00 Id: 01 Lun: 02

  Vendor: ADIC    Model: Scalar i2000    Rev: 605A

  Type:  Medium Changer                  ANSI SCSI revision: 03

lsscsi和cat /proc/scsi/scsi其实是一样的

nbumaster:~ # lsscsi

[0:0:0:0]    disk    SEAGATE  ST9146803SS      FS62  -

[0:0:1:0]    disk    SEAGATE  ST9146803SS      FS62  -

[0:1:2:0]    disk    LSILOGIC Logical Volume  3000  /dev/sda

[1:0:0:0]    storage QUANTUM  Scalar i6000    650Q  -

[1:0:0:2]    mediumx ADIC    Scalar i2000    650Q  -

14、如何重启nbu服务

正常情况只需要

nbumaster:~ # /usr/openv/netbackup/bin/bp.kill_all

nbumaster:~ # /usr/openv/netbackup/bin/bpps -x

nbumaster:~ # /usr/openv/netbackup/bin/bp.start_all

如果以上重启nbu方式不行,则采用如下方式

How to restart services

On NetBackup Master Server

1) Stop the NetBackup Services.

nbumaster:~ # /usr/openv/netbackup/bin/bp.kill_all

If the NetBackup services did not stop completely,please stop the process by using the kill command.

nbumaster:~ # /usr/openv/netbackup/bin/bpps -x

Remove cache files

nbumaster:~ # cd /usr/openv/var

nbumaster:~ # ls -lh

nbumaster:~ # rm /usr/openv/var/*.ior

nbumaster:~ # rm /usr/openv/var/*.ior.mgr

nbumaster:~ # cd /usr/openv/volmgr/misc 若有lock文件,可删除

nbumaster:~ # ls -lh

2)stop vxpbx services.

nbumaster:~ # /opt/VRTSpbx/bin/vxpbx_exchanged stop

On NetBackup Master Server

1) start the vxpbx Services.

nbumaster:~ # /opt/VRTSpbx/bin/vxpbx_exchanged start

2) art the NetBackup Services.

nbumaster:~ # /usr/openv/netbackup/bin/bp.start_all

15、cannot connect to robotic software daemon报错

这个错误是因为nbu在关闭的时候某些LOCK文件没有被完全删除造成的,可以使用下面的步骤重启后解决

A.      Shut down all the VERITAS NetBackup (tm) daemons:

#/usr/openv/netbackup/bin/goodies/netbackup stop

B.      Verify all NetBackup daemons are down by running the command:

#/usr/openv/netbackup/bin/bpps –a

Do not proceed until all NetBackup processes are down. (Remember to exit from the GUI interface.)if remain process if JAVA REF. you can use the “kill -9” command to kill them.

C.      cd /usr/openv/volmgr/misc/

D.    Delete the lock files (*lock*) that exist in this directory

E.      Restart the NetBackup daemons:

#/usr/openv/netbackup/bin/goodies/netbackup start

16、bpexpdate过期磁带,报”requested media id is in use”错误解决办法

如果你确认这个media并没有在使用,可以手工释放这个media占用的资源

首先使用/usr/openv/netbackup/bin/admincmd/nbrbutil -dump命令得到磁带占用资源的id

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump

Allocation Requests

(AllocationRequestSeq )

MDS allocations in EMM:

        MdsAllocation: allocationKey=91666 jobType=1 mediaKey=4000261 mediaId=YZ5350 driveKey=2000012 driveName=HP.ULTRIUM4-SCSI.004 drivePath=/dev/nst0 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1

        MdsAllocation: allocationKey=91667 jobType=1 mediaKey=4000264 mediaId=YZ5353 driveKey=2000008 driveName=HP.ULTRIUM4-SCSI.000 drivePath=/dev/nst5 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1

nbumaster:~ #

然后使用/usr/openv/netbackup/bin/admincmd/nbrbutil –releaseMDS 即上面的“allocationKey=”后面相应的数值,来释放资源

这样我们便能成功执行bpexpdate命令

17、查询目前有哪些磁带正在被哪个驱动器调用,以及正在运行哪些备份任务

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump

18、列出所有的job的明细

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs

将bpdbjobs输出到/tmp/bpdbjobs.txt文件中

bpdbjobs -file /tmp/bpdbjobs.txt

列出所有作业的摘要,可查看目前正处于ACTIVE的任务有多少个

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs -summary

MASTER SERVER QUEUED REQUEUED ACTIVE SUCCESS PARTSUCC FAILED INCOMP SUSP WAITING_RETRY  TOTAL

nbumaster          0  0      5  1320      0      43      0      0    0  1368

仅供参考

进WIN2008服务器,点击开始,找到控制面板。

点击进入控制面板,找到管理工具。

找到管理工具,点击事件查看器。

进入事件查看器,展开Windows日志,点击系统,右侧会显示出信息。

查看事件查看器的右方,我们会看到属性选项,红框中已经圈出。

点击属性后,我们会看到服务器日志的路径。

7

打开C:\Windows\System32\winevt,再打开Logs文件夹,我们会看到服务器日志。

1. 在服务器的控制台上输入

set config CONSOLE_LOG_ENABLED=1

set config DEBUG_THREADID=1

set config DEBUG_CAPTURE_TIMEOUT=1

set config DEBUG_SHOW_TIMEOUT=1

2 当服务器挂起,在Domino控制台上执行如下命令:

sh server

sh task debug

sh task time

sh user

sh stat

3 用Dos命令手工收集nsd日志,当nsd完成收集后,请在五分钟内执行'dump'命令对所有Domino服务器线程做另一个快照。

下面是如何收集nsd的提示:

I 打开一个dos命令窗口

II 进入domino data目录,例如"cd c:\lotus\domino\"

III 在Domino程序目录下执行nsd,例如"c:\lotus\domino\nsd"

当nsd运行结束,命令行中的提示符会更改为:

nsd>

IV 五分钟后执行dump命令,用来dump线程堆栈。在问题期内至少收集两次dump

V 退出Domino服务器,如果可以,可在Domino控制台输入'q'或者'quit'命令来退出Domino,如果服务器不能正常退出,就需要在"nsd>"提示符下用'kill'这个命令来杀掉所有Domino进程。

4 需要收集的数据有:

- nsd log, 文件名: nsd_<plaftform>_<ServerName>_date@time.log, date/time 应是nsd运行的时刻

- console log, 文件名: console_name_yyyy_mm_dd@hh_mm_ss.log,the date/time 应是服务器最后一次启动的时刻

- SEMDEBUG txt, 文件名: SEMDEBUG_name_yyyy_mm_dd@hh_mm_ss.TXT, the date/time 应是服务器最后一次启动的时刻

上面的文件位于Domino Data目录,IBM_TECHNICAL_SUPPORT 子目录


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/187793.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-30
下一篇2023-03-30

发表评论

登录后才能评论

评论列表(0条)

    保存