hrm/server -...
TRANSCRIPT
資料コード : C120-E264-03
HRM/Server 取扱説明書
まえがき 本書の目的 本書は、Solaris™ オペレーティングシステムでの保守作業支援ツールの取扱いについて説明したもの
です。 本書の読者 本書は、本ソフトウェアを導入する管理者を対象としています。 本書の構成 本書の構成と内容は次のとおりです。
第1章 概要 HRMの目的、動作、機能の概要について説明します。
第2章 HRM/Server Solaris OSに導入するHRM/Serverの動作環境、起動と停止方法、HRM/Serverが出力す
るメッセージについて説明します。 登録商標について UNIXは、米国およびその他の国におけるオープングループの登録商標です。 Sun, Solaris, HotJava, SunVTSは、米国およびその他の国における米国Sun Microsystems, Inc.の商
標もしくは登録商標です。 JavaおよびすべてのJava関連の商標およびロゴは、米国およびその他の国における米国Sun Microsystems, Inc.の商標または登録商標です。 FLEXlmは、米国GLOBEtrotter社の米国における登録商標です。 Microsoftは、米国Microsoft Corporationの米国およびその他の国における登録商標です。 Netscape, Netscape Navigator, Netscape Communicationsは、米国Netscape Communications Corporationの商標です。 PostScriptは、Adobe Systems Incorporatedの商標です。 そのほか、本書に記載されている会社名および製品名は、それぞれ各社の商標または登録商標です。 Copyright 1998- Sun Microsystems, Inc. All rights reserved. Copyright 1995- GLOBEtrotter Software, Inc. Copyright 1995- Software Research Associates, Inc. All Rights Reserved.
ii
All Rights Reserved, Copyright © FUJITSU LIMITED 2005 All Rights Reserved, Copyright © PFU LIMITED 2005
本製品は、一般事務用、パーソナル用、家庭用、通常の産業等の一般的用途を想定して開発・設計・製
造されているものであり、原子力施設における核反応制御、航空機自動飛行制御、航空交通管制、大量
輸送システムにおける運行制御、生命維持のための医療用機器、兵器システムにおけるミサイル発射制
御など、極めて高度な安全性が要求され、仮に当該安全性が確保されない場合、直接生命・身体に対す
る重大な危険性を伴う用途(以下「ハイセイフティ用途」という)に使用されるよう開発・設計・製造されたも
のではありません。 お客さまは本製品を必要な安全性を確保する措置を施すことなくハイセイフティ用途に使用しないでくださ
い。また、お客さまがハイセイフティ用途に本製品を使用したことにより発生する、お客様または第三者か
らのいかなる請求または損害賠償に対しても富士通株式会社およびその関連会社は一切責任を負いか
ねます。
富士通株式会社 平成17年1月
iii
All Rights Reserved, Copyright ©富士通株式会社 2003-2005
目次
第1章 概要 ..................................................................................................................................1 1.1 目的 ..................................................................................................................................1 1.2 動作概要 ...........................................................................................................................2 1.3 機能概要 ...........................................................................................................................3
1.3.1 構成情報収集.............................................................................................................4 1.3.2 装置情報の統計 .........................................................................................................4 1.3.3 ログ収集....................................................................................................................4 1.3.4 一括ログ収集.............................................................................................................5 1.3.5 診断 ...........................................................................................................................6 1.3.6 ストレージ結線情報 ..................................................................................................6
第2章 HRM/Server .....................................................................................................................7 2.1 動作環境 ...........................................................................................................................7
2.1.1 ソフトウェア環境 .....................................................................................................7 2.1.2 ハードウェア環境 .....................................................................................................7 2.1.3 動的ディスク資源 .....................................................................................................8 2.1.4 メモリ容量 ................................................................................................................8 2.1.5 スワップ容量.............................................................................................................8 2.1.6 システムへの負荷 .....................................................................................................9
2.2 起動と停止 .......................................................................................................................9 2.2.1 起動のための設定 .....................................................................................................9 2.2.2 起動方法.................................................................................................................. 11 2.2.3 停止方法.................................................................................................................. 11
2.3 メッセージ .....................................................................................................................12 2.3.1 メッセージログに出力するメッセージ ...................................................................12 2.3.2 コンソールまたは起動端末に出力するメッセージ .................................................12
図表目次
- 図 - 図 1 HRMの動作概要 ...........................................................................................................2 図 2 HRM の使用イメージ ..................................................................................................3
iv
第1章 概要
1.1 目的
Hardware Resource Monitor (以降HRM)は、保守作業支援ツールです。 本ツールを導入し稼働状態にしていただくことで、保守員が以下の作業を、より迅速に実
施することができるようになります。 ◆ 構成情報の収集 ◆ 統計情報の収集 ◆ ログ情報の収集 ◆ 稼働中のお客様業務に影響なく診断 これにより、より確実な保守作業とお客様への的確な作業報告が可能となります。。
お客様への御願い
1
本ソフトウェアは、当社技術員の保守専用端末と連携して動作いたします。保守作業時にお客様LANへ
の接続許可をお願いする場合がありますので、ご協力をお願いいたします。
2
1.2 動作概要
HRMは、サーバに常駐して動作するHRM/Server(コンポーネント名:HRM-S, HRMエージェントとも呼ぶ)と、当社技術員が持ち込む保守端末と連携して動作します。 HRM/Serverは、情報収集や装置診断などサーバOS上で実行します。 なお、System Management Console(以降SMC)のあるシステムでは、SMC上のHRM/Serverも連携致
します。 HRM/Serverは、お客様にインストール、起動していただくことで、OS上に常駐して動作します。 HRM/Serverの各機能は、当社技術員が保守端末をLANに接続させていただき操作します。
図 1 HRMの動作概要
*)ESF: Enhanced Support Facility
OS
ハードウェア
ESF(*)
HRM-S
LAN
SN200 PRIMEPOWER
OS
ハードウェア
ESF(*)
HRM-S
連携 連携
PRIMEPOWER
(1)装置構成収集 (2)装置情報の統計 (3)ログ収集 (4)一括ログ収集 (5)診断 (6)ストレージ結線情報
ETERNUS
・装置構成情報表示 ・構成情報比較 ・装置内統計情報表示 ・保守履歴管理 ・保守報告書作成 など
保守端末
3
HRMの各機能は、次のようなイメージで使用します。
図 2 HRM の使用イメージ
1.3 機能概要
ここでは、HRM/Serverで動作する以下の機能について説明します。 (1)構成情報収集 (2)装置情報の統計 (3)ログ収集 (4)一括ログ収集 (5)診断 (6)ストレージ結線情報
保守端末
サーバ群
G
LOG 結果
HRM/Server
情報収集/ 診断実行
サーバ処理の指示 情報表示・比較・保存・印刷 レポート作成
Data
結果
当社技術員が保守作業時に保守端末を接続して
サーバ状態を確認
4
1.3.1 構成情報収集
HRM/Sereverは、ホストのハード構成、ファーム版数、ソフトウェア版数を収集します。 収集契機は、当社技術員が保守作業時に保守端末より指示した時となります。 当社技術員は、収集した構成情報により、装置状態(正常、異常)や構成変化を確認することが出来ま
す。
1.3.2 装置情報の統計
HRM/Serverは、以下の装置情報を定期的に統計します。 No 装置 統計する情報 1 IO-UNIT(SCSI装置) Disk(リトライエラー)
CPU温度 システムセンサー(2箇所)
2 PW250/PW450 環境情報
システム吸気温度
1.3.3 ログ収集
HRM/Serverは、以下のログ情報を収集します。 ファイル名 説明 var/adm/messages メッセージログファイル var/opt/FJSVmadm/log/madmlog マシン管理ログファイル var/opt/FJSVmadm/log/PN00/error.log マシン管理エラーログファイル var/opt/FJSVmadm/log/PN00/pwr.log マシン管理電源ログファイル var/opt/FJSVhwr/scferrlog マシン管理エラーログファイル
(PRIMEPOWER 200,400のみ) var/opt/FJSVhwr/scfpwrlog マシン管理電源ログファイル
(PRIMEPOWER 200,400のみ) ログ情報は、当社技術員が保守作業を実施する際に収集し、保守端末から確認します。
5
1.3.4 一括ログ収集
HRM/Serverは、以下のログ情報を一括して収集します。 ファイル名 説明 var/opt/FJSVhrm/temp/HRM-Snap_temp/vfstab /etc/vfstab var/opt/FJSVhrm/temp/HRM-Snap_temp/showrev-p showrev –p の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/prtdiag-v pritdiag –vの出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/pkginfo-l pkginfo –l の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/df-k df –k の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/prtconf-vp prtconf-vpの出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/ps-ef ps –efの出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/etc_syslog.conf /etc/syslog.conf var/opt/FJSVhrm/temp/HRM-Snap_temp/etc_services /etc/services var/opt/FJSVhrm/temp/HRM-Snap_temp/etc_system /etc/system var/opt/FJSVhrm/data/ HRMのdataディレクトリの内容 var/opt/FJSVhrm/config/ HRMのconfigディレクトリの内容 opt/FJSVhrm/update/ HRMのupdateディレクトリの内容 var/opt/FJSVhrm/log/ HRMのlogディレクトリの内容 var/adm/messages syslogログファイル var/opt/FJSVmadm/log/madmlog マシン管理ログファイル var/opt/FJSVhrm/temp/HRM-Snap_temp/who_rb /usr/bin/who -rb の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/ifconfig_a /usr/sbin/ifconfig -a の出力 var/opt/FJSVhwr/scferrlog マシン管理エラーログファイル
(PRIMEPOWER 200,400のみ) var/opt/FJSVhrm/temp/HRM-Snap_temp/isalist /usr/bin/isalist の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/psrinfo_v /usr/sbin/psrinfo -v の出力 var/opt/FJSVhrm/temp/HRM-Snap_temp/etc_release /etc/release の内容 var/opt/FJSVhrm/temp/HRM-Snap_temp/prstat_c_3_2 /usr/bin/prstat -c 3 2 の内容 var/opt/FJSVcsl/log/trace/messages (※1) SCSマシン管理ログファイル var/opt/FJSVhrm/temp/HRM-Snap_temp/mc_log_view_err.out.PN${PNNO} (※1)
SCSマシン管理エラーログコマンド実
行内容 /opt/FJSVcsl/bin/mc_view_log -ownsc -file LOG -error -pn ${PNNO} ※実装PN全てに発行
var/opt/FJSVhrm/temp/HRM-Snap_temp/mc_log_view_pwr.out.PN${PNNO} (※1)
SCSマシン管理パワーログコマンド実
行内容 /opt/FJSVcsl/bin/mc_view_log/-ownsc -file PWRLOG -pn ${PNNO} ※
実装PN全てに発行 収集契機は、当社技術員が保守作業時に保守端末より指示した時となります。 HRM機能で収集したログ情報は、保守端末へダウンロードします。 ※1) SCSマシン管理に提供されているHRM/serverの場合に収集します。
6
1.3.5 診断
HRM/Serverの診断には、予防保守を目的とし、ユーザ業務と並行して定期的に動作し診断するパトロー
ル診断と、当社技術員が保守作業時に装置交換後の装置正常性確認を目的としたハード診断がありま
す。 パトロール診断の走行設定は、お客様の許可をいただいたうえで、当社技術員が保守作業時に保守端
末より実施します。パトロール診断の結果、装置異常を検出した場合は、メッセージログに記録します。 ハード診断は、当社技術員が保守作業時に保守端末より実施します。ハード診断の結果は、メッセージロ
グには記録しません。
1.3.6 ストレージ結線情報
HRM/Serverは、ストレージ結線情報を採取することができます。 採取契機は、当社技術員が保守作業時に保守端末より指示します。 これにより、当社技術員は、ストレージの結線状態、アクセスパスを確認することができ、結線の正常性も
しくは異常を容易に確認することができます。
7
第2章 HRM/Server
2.1 動作環境
本ソフトウェアを使用する場合には、以下のソフトウェア環境およびハードウェア環境を満たしている必要
があります。
2.1.1 ソフトウェア環境
1)前提基本ソフトウェア
本ソフトウェアを使用する場合、以下の基本ソフトウェアが必要です。 項番 基本ソフトウェア名 備考
1 (日本語)Solaris™ 8 OS (日本語)Solaris™ 9 OS (日本語)Solaris™ 10 OS (※)
(※)ストレージ結線情報機能(SANtoolエー
ジェント)は、動作しません。
2)必須ソフトウェア
ありません。
3)排他ソフトウェア
排他ソフトウェアはありません。
4)特定機能を使用する場合に必要なソフトウェア
必要なソフトウェアはありません。
5)必須パッチ
ありません。
2.1.2 ハードウェア環境
本ソフトウェアを使用する場合、以下のハードウェアが必要です。
1)主記憶
128Mバイト以上(最低)の主記憶容量が必要です。
2)サポートハードウェア
本ソフトウェアがサポートしているハードウェアは、以下のとおりです。 項番 機器名 備考
1 PRIMEPOWER 200/250/400/450/600/650/850/900/1500 いずれかの機種であること。
2 SMC(System Management Console)
3)特定機能を使用する場合に必要なハードウェア
特にありません。
8
2.1.3 動的ディスク資源
本ソフトウェアを以下のユーザ運用で動作させるとき、各ファイルシステムには、インストールに必要な動
的ディスク所要量として以下の表に示すディスク容量が必要です。
項番 ファイルシステム ディスク所容量 (単位:Mバイト)
運用内容
1 /ver/opt/FJSVhrm/temp/ファイルシステム
50 一括ログ生成一時ファイル 構成情報収集一時ファイル
2 /var/opt/FJSVhrm/data/ ファイルシステム
50 HRM/Server データファイル
3 /var/opt/FJSVhrm/logs/ ファイルシステム
100 HRM/Server ログファイル (統計情報、ログ情報など)
2.1.4 メモリ容量
本ソフトウェアを以下の運用で動作させるときに必要なメモリ容量を示します。
項番 メモリ容量 (単位:Mバイト)
運用内容
1 8 制御部のみ動作時
2 10 構成情報収集時以外の機能動作時
3
32 構成情報収集時
2.1.5 スワップ容量
本ソフトウェアを以下の運用で動作させるときに必要なスワップ容量を示します。
項番 スワップ容量 (単位:Mバイト)
運用内容
1 16 制御部のみ動作時
2 20 構成情報収集時以外の機能動作時
3
40 構成情報収集時
9
2.1.6 システムへの負荷
HRM/Serverが起動されることによりシステム常駐し、統計情報の収集やパトロール診断を実施致しま
す。 業務運用中のシステムへの負荷につきましては、以下の通りです。
構成 負荷 測定方法 CPU :1CPU(500MHz) メモリ:256MB
2%未満 sarコマンドにて1分測定時
2.2 起動と停止
2.2.1 起動のための設定
HRM/Server(HRMエージェント)はデフォルトで動作しない設定になっています。故障監視や定期統計収
集を行なったり、HRM/watcher と接続したりするためには HRMエージェントを有効に設定して、起動し
ておく必要があります。 HRMエージェントが無効状態では、システムリブートをしても HRMエージェントは起動しません。また、起
動コマンド /opt/FJSVhrm/bin/hrmstart を実行しても次のエラーが出て起動しません。 # /opt/FJSVhrm/bin/hrmstart HRM agent is disabled. Please set it up using /opt/FJSVhrm/bin/setup.sh HRMを有効にするには、設定ツール /opt/FJSVhrm/bin/setup.sh を実行してください。 以下のようなトップメニューが表示されます。 注意: setup.sh は、日本語EUC が使える環境で実行してください。 # LANG=ja_JP.eucJP export LANG # /opt/FJSVhrm/bin/setup.sh ===== HRM設定メニュー ===== 現在状態: HRMエージェントは無効です。 1 HRMエージェントを有効にする 2 HRMエージェントを無効にする 3 SANtoolを有効にする 4 SANtoolを無効にする 5 SANtoolのIPアドレスを設定する 6 HRM(とSANtool)を起動する 7 HRM(とSANtool)を停止する 8 タイムゾーンチェックの無効化/有効化 9 終了する 番号を選択してください [?,??,q]:
10
■現在状態の表示 タイトルの下に、現在の設定状態を表示します。 メッセージ 説明 HRMエージェントは有効です。 HRMエージェントが有効になっています。 HRMエージェントは無効です。 HRMエージェントが無効になっています。 HRMエージェントを
起動することが出来ません。 有効にするには、メニュー1番を
使ってください。 HRMエージェントは動作中です。 HRMエージェントが動作中(デーモンが走行中)です。
HRM/watcher から接続することが出来ます。 HRMエージェントは動作してません。 HRMエージェントは動作してません。 SANtoolは有効に設定されています。
HRMエージェントを起動すると一緒に起動
します。
SANtoolは有効です。HRMエージェントを起動すると一緒に起
動します。
SANtoolは無効に設定されています。 SANtoolが無効になっています。HRMエージェントを起動しても
SANtoolエージェントは起動しません。 SANtoolエージェントは動作中です。 SANtoolエージェントは動作中です。 SANtoolエージェントは動作してません。 SANtoolエージェントは動作してません。 ■設定変更メニュー 各メニューの番号を入力して、設定を変更します。 1 HRMエージェントを有効にする
HRMエージェントを有効(起動可能)に設定します。 初期状態は無効になっているため、最初にこれ
が必要です。 2 HRMエージェントを無効にする
HRMエージェントを無効(起動不可能)に戻します。 HRMエージェントが動作中のときは実行出来ま
せん。 3 SANtoolを有効にする
SANtool を使う場合は、本メニューで SANtoolを有効にしてください。インストール直後は無効にな
っています。SANtoolが有効な場合、 HRMエージェントの起動と同時に SANtoolエージェントも起
動します。 SANtoolを初めて使う場合は、メニュー5番の IPアドレス設定も行なってください。
4 SANtoolを無効にする SANtoolエージェントを起動しない設定に戻します。 SANtoolエージェントが動作中のときは実行出
来ません。 5 SANtoolのIPアドレスを設定する
SANtoolエージェントが通信に使うIPアドレスを設定します。 HRM/watcher と通信するアドレスを指
定してください。 6 HRM(とSANtool)を起動する
HRMエージェントを(有効なら)起動します。 同時に SANtoolエージェントも(有効なら)起動します。 7 HRM(とSANtool)を停止する
HRMエージェントを停止します。 同時に SANtoolエージェントも停止します。 8 タイムゾーンチェックの無効化/有効化
HRMはデフォルトではタイムゾーンが JST の環境でのみ動作します。 本メニューからこのチェック
の無効化(つまりどのタイムゾーンでも 動作可能)、有効化(JSTでのみ動作可)をトグル変更しま
す。 9 終了する
設定メニューを終了します。
11
2.2.2 起動方法
次の手順で HRM/Server を起動してください。 HRM/Serverを起動する場合は、システムをリブートするか、以下のコマンドを実行してください。 # /opt/FJSVhrm/bin/hrmstart
2.2.3 停止方法
以下のコマンドを実行して HRM/Server を停止してください。 # /opt/FJSVhrm/bin/hrmstop
12
2.3 メッセージ
HRM/Serverが出力するメッセージ及びオペレータの処置は、以下のとおりです。
2.3.1 メッセージログに出力するメッセージ
【メッセージ本文】 hrm scheduler was stopped. 【意味】 HRM の制御プログラムが異常終了しました。 【対処】 HRM/Serverを再起動し、再度異常終了する場合は、富士通の技術員に連絡してください。
2.3.2 コンソールまたは起動端末に出力するメッセージ
【メッセージ本文】 HRM is started. 【意味】 HTM/Serverが起動されました。 【対処】 なし。 【メッセージ本文】 HRM is stopped. 【意味】 HTM/Serverが停止しました。 【対処】 なし。 【メッセージ本文】 Error: HRMpipe "/var/opt/FJSVhrm/hrm_pipe" is not exist. 【意味】 HRM/Serverが通信に使うパイプファイルが見つかりません。 【対処】 HRM/Serverを再インストールしてください。 【メッセージ本文】 Error:HRM: hrmport is not defined in services of tcp. 【意味】 hrmport が /etc/services に定義されていません。 【対処】 /etc/services に hrmport を追加し、HTM/Serverを再起動してください。 【メッセージ本文】 Error:failed to read HRM module list.
filename="/opt/FJSVhrm/config/hrm_modules" 【意味】 hrm_modulesファイルが見つかりませんでした。 【対処】 HRM/Serverを再インストールしてください。 【メッセージ本文】 Error: the specified port is already in use. (port XXXX) 【意味】 hrmport で指定したポートがすでに使われています。 【対処】 hrmportの番号を変更し、HRM/Serverを再起動してください。