C:\Program Files\Veritas\NetBackup\bin\support\nbsu.exe -s DEV_scsi_reg -s NBU_nbdb_info -s
收集进程状态信息 NBU_bpps
C:\Program Files\Veritas\NetBackup\bin\bpps
备份存储单元状态 NBU_bpstulist
C:\Program Files\Veritas\netbackup\bin\admincmd\bpstulist -g -U
磁带使用状态 NBU_available_media
C:\Program Files\Veritas\NetBackup\Bin\goodies\available_media -a
客户端信息 NBU_bpplclients
C:\Program Files\Veritas\NetBackup\Bin\admincmd\bpplclients -allunique -U
备份作业检查 NBU_backup_status
C:\Program Files\Veritas\NetBackup\Bin\admincmd\bperror -U -backstat
linux下巡检命令
[root@nbuserver ~]# /usr/openv/netbackup/bin/bpps -a
[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpstulist -L
[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpplclients -allunique -U
[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bpdbjobs -L
[root@nbuserver ~]# /usr/openv/netbackup/bin/admincmd/bperror -backstat -hoursago 72 –L
日志文件收集执行命令 /usr/openv/netbackup/bin/support/nbsu -c -t
启动NetBackup图形界面
/usr/openv/netbackup/bin/jnbSA &
可做alias如下所示
oracle@nbumaster:~>cat /etc/bash.bashrc | grep ^alias
alias nbu='/usr/openv/netbackup/bin/jnbSA &'
NetBackup故障后,日志收集
nbumaster:~ # /usr/openv/netbackup/bin/support/nbsu
日志存放点:/usr/openv/netbackup/bin/support/output/nbsu
以及收集如下日志:
3. Display NetBackup status and troubleshooting information or entries from NetBackup error catalog
Unix/Linux
/usr/openv/netbackup/bin/admincmd/bperror -all -hoursago 72 -verbose -U >/tmp/bperror_all.txt
/usr/openv/netbackup/bin/admincmd/bperror -backstat -hoursago 72 -verbose -U >/tmp/bperror_backstat.txt
/usr/openv/netbackup/bin/admincmd/bperror -problems -hoursago 72 -verbose -U >/tmp/bperror_problems.txt
/usr/openv/netbackup/bin/admincmd/bperror -media -hoursago 72 -verbose -U >/tmp/bperror_media.txt
/usr/openv/netbackup/bin/admincmd/bperror -tape -hoursago 72 -verbose -U >/tmp/bperror_tape.txt
3、磁带立即过期
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpexpdate -m media_id -d 0
4、查看所有磁带使用情况,条形码为media id
nbumaster:~ # /usr/openv/netbackup/bin/goodies/available_media
5、查看磁带过期时间
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpmedialist -U
6、查看nbu的版本
nbumaster:~ # cat /usr/openv/netbackup/version
HARDWARE LINUX_SUSE_X86
VERSION NetBackup 7.0.0
RELEASEDATE Thu Jul 08 01:22:07 CDT 2010
BUILDNUMBER 20100707
或
nbumaster:~ # more /usr/openv/netbackup/bin/version
NetBackup-SuSE2.6.16 7.0.1
7、查看驱动器的状态,是否处于正常的TLD状态还是ACTIVE,或者不正常的AVR状态
nbumaster:~ # /usr/openv/volmgr/bin/vmoprcmd
8、查看驱动器是否需要清洗
nbumaster:~ # /usr/openv/volmgr/bin/tpclean -L
Drive Name Type Mount Time Frequency Last Cleaned Comment
********** **** ********** ********* **************** *******
HP.ULTRIUM4-SCSI.000 hcart* 4231.6 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.001 hcart* 798.4 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.002 hcart* 645.0 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.003 hcart* 642.3 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.004 hcart* 2340.8 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.005 hcart* 646.2 0 N/A NEEDS CLEANING
HP.ULTRIUM4-SCSI.006 hcart* 14.9 0 N/A
HP.ULTRIUM4-SCSI.007 hcart* 17.4 0 N/A
HP.ULTRIUM4-SCSI.008 hcart* 10.0 0 N/A
HP.ULTRIUM4-SCSI.009 hcart* 22.1 0 N/A
9、扫描本机所有的机械手和驱动器
nbumaster:~ #/usr/openv/volmgr/bin/scan
************************************************************
*********************** SDT_TAPE ************************
*********************** SDT_CHANGER ************************
************************************************************
------------------------------------------------------------
Device Name : "/dev/sg30" //机械手
Passthru Name: "/dev/sg30"
Volume Header: ""
Port: -1Bus: -1Target: -1LUN: -1
Inquiry : "ADIC Scalar i2000 650Q"
Vendor ID : "ADIC "
Product ID : "Scalar i2000 "
Product Rev: "650Q"
Serial Number: "ADIC273100135_LL0"
WWN : ""
WWN Id Type : 0
Device Identifier: "ADIC 273100135_LL0 "
Device Type : SDT_CHANGER //机械手
NetBackup Robot Type: 8
Removable : Yes
Device Supports: SCSI-3
Number of Drives : 10
Number of Slots : 684
Number of Media Access Ports: 24 //10个驱动器
Drive 1 Serial Number : "HU10159TD2"
Drive 2 Serial Number : "HU10109851"
Drive 3 Serial Number : "HU10159TC8"
Drive 4 Serial Number : "HU10038GVG"
Drive 5 Serial Number : "HU10109839"
Drive 6 Serial Number : "HU101098DU"
Drive 7 Serial Number : "HU10159TCV"
Drive 8 Serial Number : "HU1010983B"
Drive 9 Serial Number : "MXP1226LMC"
Drive 10 Serial Number : "HU10159TAP"
10、手动尝试抓取机械手,可验证机械手是否正常,该操作可在nbu服务未启动时候就可执行
以下表明机械手找不到
nbumaster:/usr/openv/volmgr/misc # /usr/openv/volmgr/bin/robtest
Configured robots with local control supporting test utilities:
TLD(0) robotic path = /dev/sg8
Robot Selection
---------------
1) TLD 0
2) none/quit
Enter choice: 1
Robot selected: TLD(0) robotic path = /dev/sg8
Invoking robotic test utility:
/usr/openv/volmgr/bin/tldtest -rn 0 -r /dev/sg8
Opening /dev/sg8
Error opening /dev/sg8, No such device or address
Robotic test utility /usr/openv/volmgr/bin/tldtest
returned abnormal exit status (1).
11、查看磁带驱动器及robot(机械手)细节情况
nbumaster:~ # /usr/openv/volmgr/bin/tpconfig -d 亦可使用tpconfig -dl或tpconfig -l,显示的信息是不一样的
Id DriveName Type Residence
Drive Path Status
****************************************************************************
0 HP.ULTRIUM4-SCSI.000 hcart TLD(0) DRIVE=10
/dev/nst5 UP
1 HP.ULTRIUM4-SCSI.001 hcart TLD(0) DRIVE=9
/dev/nst6 UP
2 HP.ULTRIUM4-SCSI.002 hcart TLD(0) DRIVE=8
/dev/nst9 UP
Currently defined robotics are:
TLD(0) robotic path = /dev/sg30
EMM Server = nbumaster
可使用如下命令查看驱动器和机械手的相关信息
(Display device configuration)
tpconfig -d
tpconfig -dl
tpconfig -l
另/usr/openv/volmgr/bin/tpconfig 提供add ,delete,list NBU可以识别并使用的物理设备,如
机械手/dev/sg30的符号在操作系统更改后,可通过tpconfig来进行更改
12、查看nbu进程情况,一般使用bpps -x
nbumaster:~ # /usr/openv/netbackup/bin/bpps -列出nbu服务运行的进程
-a 在列表中包括介质管理器进程
-x 在列表中包括介质管理器进程和其他共享进程
13、查看操作系统是否认识到机械手
nbumaster:~ # cat /proc/scsi/scsi 可搜索关键字Medium
Host: scsi1 Channel: 00 Id: 01 Lun: 02
Vendor: ADIC Model: Scalar i2000 Rev: 605A
Type: Medium Changer ANSI SCSI revision: 03
lsscsi和cat /proc/scsi/scsi其实是一样的
nbumaster:~ # lsscsi
[0:0:0:0] disk SEAGATE ST9146803SS FS62 -
[0:0:1:0] disk SEAGATE ST9146803SS FS62 -
[0:1:2:0] disk LSILOGIC Logical Volume 3000 /dev/sda
[1:0:0:0] storage QUANTUM Scalar i6000 650Q -
[1:0:0:2] mediumx ADIC Scalar i2000 650Q -
14、如何重启nbu服务
正常情况只需要
nbumaster:~ # /usr/openv/netbackup/bin/bp.kill_all
nbumaster:~ # /usr/openv/netbackup/bin/bpps -x
nbumaster:~ # /usr/openv/netbackup/bin/bp.start_all
如果以上重启nbu方式不行,则采用如下方式
How to restart services
On NetBackup Master Server
1) Stop the NetBackup Services.
nbumaster:~ # /usr/openv/netbackup/bin/bp.kill_all
If the NetBackup services did not stop completely,please stop the process by using the kill command.
nbumaster:~ # /usr/openv/netbackup/bin/bpps -x
Remove cache files
nbumaster:~ # cd /usr/openv/var
nbumaster:~ # ls -lh
nbumaster:~ # rm /usr/openv/var/*.ior
nbumaster:~ # rm /usr/openv/var/*.ior.mgr
nbumaster:~ # cd /usr/openv/volmgr/misc 若有lock文件,可删除
nbumaster:~ # ls -lh
2)stop vxpbx services.
nbumaster:~ # /opt/VRTSpbx/bin/vxpbx_exchanged stop
On NetBackup Master Server
1) start the vxpbx Services.
nbumaster:~ # /opt/VRTSpbx/bin/vxpbx_exchanged start
2) art the NetBackup Services.
nbumaster:~ # /usr/openv/netbackup/bin/bp.start_all
15、cannot connect to robotic software daemon报错
这个错误是因为nbu在关闭的时候某些LOCK文件没有被完全删除造成的,可以使用下面的步骤重启后解决
A. Shut down all the VERITAS NetBackup (tm) daemons:
#/usr/openv/netbackup/bin/goodies/netbackup stop
B. Verify all NetBackup daemons are down by running the command:
#/usr/openv/netbackup/bin/bpps –a
Do not proceed until all NetBackup processes are down. (Remember to exit from the GUI interface.)if remain process if JAVA REF. you can use the “kill -9” command to kill them.
C. cd /usr/openv/volmgr/misc/
D. Delete the lock files (*lock*) that exist in this directory
E. Restart the NetBackup daemons:
#/usr/openv/netbackup/bin/goodies/netbackup start
16、bpexpdate过期磁带,报”requested media id is in use”错误解决办法
如果你确认这个media并没有在使用,可以手工释放这个media占用的资源
首先使用/usr/openv/netbackup/bin/admincmd/nbrbutil -dump命令得到磁带占用资源的id
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump
Allocation Requests
(AllocationRequestSeq )
MDS allocations in EMM:
MdsAllocation: allocationKey=91666 jobType=1 mediaKey=4000261 mediaId=YZ5350 driveKey=2000012 driveName=HP.ULTRIUM4-SCSI.004 drivePath=/dev/nst0 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1
MdsAllocation: allocationKey=91667 jobType=1 mediaKey=4000264 mediaId=YZ5353 driveKey=2000008 driveName=HP.ULTRIUM4-SCSI.000 drivePath=/dev/nst5 stuName=nbumaster-hcart-robot-tld-0 masterServerName=nbumaster mediaServerName=nbumaster ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1
nbumaster:~ #
然后使用/usr/openv/netbackup/bin/admincmd/nbrbutil –releaseMDS 即上面的“allocationKey=”后面相应的数值,来释放资源
这样我们便能成功执行bpexpdate命令
17、查询目前有哪些磁带正在被哪个驱动器调用,以及正在运行哪些备份任务
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump
18、列出所有的job的明细
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs
将bpdbjobs输出到/tmp/bpdbjobs.txt文件中
bpdbjobs -file /tmp/bpdbjobs.txt
列出所有作业的摘要,可查看目前正处于ACTIVE的任务有多少个
nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpdbjobs -summary
MASTER SERVER QUEUED REQUEUED ACTIVE SUCCESS PARTSUCC FAILED INCOMP SUSP WAITING_RETRY TOTAL
nbumaster 0 0 5 1320 0 43 0 0 0 1368
仅供参考
服务器信息:1.机器型号(P/N:)
2.机器序列号(S/N:)
3.Bios 版本
4.是否增加其它设备,如网卡,SCSI 卡,内存,CPU
5.硬盘如何配置,是否做阵列, 阵列级别
6.安装什么操作系统及版本(Winnt 4, Netware, Sco, others)
故障信息
1.在POST时,屏幕显示的异常信息
2.服务器本身指示灯的状态?
3. 报警声和BEEP CODES
4.NOS的事件记录文件?
5. Events Log 文件
确定故障类型和故障现象:
1. 开机无显示;
2.上电自检阶段故障;
3. 安装阶段故障和现象;
4. 操作系统加载失败;
5. 系统运行阶段故障;
如何收集Domino服务器日志在论坛已久,发现用户提交问题,太过于简单,很多就是说明现象,不太便于分析和理解。
来论坛发帖大部分都是Domino管理员和开发者,希望更加细致和专业,同时提高自己分析能力。
以下来自ibm的邮件或者帮助:
1 当Windows平台上服务器挂起(非HTTP)时,收集数据的流程:
1. 在服务器的控制台上输入
set config CONSOLE_LOG_ENABLED=1
set config DEBUG_THREADID=1
set config DEBUG_CAPTURE_TIMEOUT=1
set config DEBUG_SHOW_TIMEOUT=1
2 当服务器挂起,在Domino控制台上执行如下命令:
sh server
sh task debug
sh task time
sh user
sh stat
3 用Dos命令手工收集nsd日志,当nsd完成收集后,请在五分钟内执行'dump'命令对所有Domino服务器线程做另一个快照。
下面是如何收集nsd的提示:
I 打开一个dos命令窗口
II 进入domino data目录,例如"cd c:\lotus\domino\"
III 在Domino程序目录下执行nsd,例如"c:\lotus\domino\nsd"
当nsd运行结束,命令行中的提示符会更改为:
nsd>
IV 五分钟后执行dump命令,用来dump线程堆栈。在问题期内至少收集两次dump
V 退出Domino服务器,如果可以,可在Domino控制台输入'q'或者'quit'命令来退出Domino,如果服务器不能正常退出,就需要在"nsd>"提示符下用'kill'这个命令来杀掉所有Domino进程。
4 需要收集的数据有:
- nsd log, 文件名: nsd_<plaftform>_<ServerName>_date@time.log, date/time 应是nsd运行的时刻
- console log, 文件名: console_name_yyyy_mm_dd@hh_mm_ss.log,the date/time 应是服务器最后一次启动的时刻
- SEMDEBUG txt, 文件名: SEMDEBUG_name_yyyy_mm_dd@hh_mm_ss.TXT, the date/time 应是服务器最后一次启动的时刻
上面的文件位于Domino Data目录,IBM_TECHNICAL_SUPPORT 子目录
2 Lotus Traveller服务器日志收集
收集服务器日志
本主题包含有关收集日志文件和信息以协助 Lotus Notes® Traveler 支持人员解决服务器安装、启动和运行时问题的指示信息。
提高记录级别
执行以下操作,为 Lotus Notes Traveler 服务器任务提高记录级别、增加日志文件大小和最大活动日志文件数。请注意,可能不必增加日志文件大小或最大活动文件数。
在 IBM® Lotus® Domino® Administrator 中,打开 Lotus Notes Traveler 服务器的服务器配置文档。
在文档中单击 Lotus Traveler 选项卡,然后单击编辑服务器。
将记录级别更改为最详细。
将活动日志的最大文件大小更改为所需的最大文件大小。
将最大活动日志文件数更改为所需的最大活动日志数。
保存并关闭服务器文档。
等几分钟让更改生效,然后重现问题。
注: 还可以为每个用户逐个设置记录以节约输入/输出空间和带宽。有关记录命令的详细信息,请参阅控制台命令。
收集日志
以下文件和目录包含记录或配置信息,这些信息在对服务器启动/运行时问题进行故障诊断时很有用。以 Zip 或 tar 格式压缩下面指定的所有文件和目录。当指示目录时,包括整个目录。
\Lotus\Domino\notes.ini
\Lotus\Domino\data\servlets.properties
\Lotus\Domino\data\traveler\cfg\
\Lotus\Domino\data\traveler\logs\
如果问题涉及在创建 \traveler 目录前安装失败,请提供以下临时日志(如果存在):%TEMP%\Idatetime\Windows\NTSInstall.log(例如 C:\Documents and Settings\Administrator\Local Settings\Temp\I1206535899\Windows\NTSInstall.log)。
如果问题涉及 Domino 服务器崩溃,另请提供以下日志:
用于捕获崩溃的 NSD 日志,位于 \Lotus\Domino\data\IBM_TECHNICAL_SUPPORT\NSDdatetime.log 中
Javacore 文件,根据具体安装情况,其位置可能会有不同,但或许能在 \Lotus\Domino\javacore.datetime.txt 中找到
注: 为了不影响性能,在收集日志并解决问题后,建议您将日志级别恢复到原来的设置。
二 以上主要收集的是服务器日志,Notes客户端也是类似
本地存在log.nsf,同时在数据目录下也存在:
data\IBM_TECHNICAL_SUPPORT\
和服务器类似,同样用来分析Notes客户端问题。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)