イベントタイプ定義およびコンポーネントの正常性

Server Administrator は、イベントの種類を使って特定の重要なコンポーネントに影響するイベントを分類します。コンポーネントステータスに表示される最も一般的な 3 つのイベントの種類は、正常、警告、および重要です。

このヘルプモジュールはイベント タイプ、状態、および重大度を定義します。Server Administrator がイベントの分類やコンポーネントの正常性識別に使用するさまざまな条件については、このヘルプモジュールをお読みください。

イベントの種類と対応する重大性

Server Administrator がコンポーネントの正常性を報告している場合もイベントを分類している場合も、区別できるイベントの属性は次のとおりです:監視されているコンポーネントまたは冗長性、種類、状態、およびコンポーネントが処理しているイベントの重大度。

コンポーネントまたは冗長性

Server Administrator はコンポーネントとその冗長性との両方を、種類、重大度そして状況に応じて分類します。

コンポーネント

システム内のすべてのコンポーネントは、それぞれが何らかの重要な役割を持ったコンポーネントです。Server Administrator などのシステム管理アプリケーションは、特に注意を払う必要のあるいくつかのコンポーネントを選別します。正常なシステムは、システムコンポーネントを適切に動作させるために、特に適切な電圧による安定した電力供給が必要です。電源はシステムの交流(AC)電源スイッチから供給されて、システムの電源装置に送られます。また、システムのコンポーネントのためには、シャーシ内で動作に適切な温度範囲が保たれている必要があります。プログラムを実行しデータを計算するためには、適正に動作するランダムアクセスメモリーが必要です。これらの要件の結果として、電源スイッチ、電源装置、ファン、システムメモリーなどは、Server Administrator がモニタする最も重要なコンポーネントとなります。

冗長性

Server Administrator は冗長コンポーネントの正常性を監視し、冗長性の状態をシステムにレポートします。

ビジネスエンティティまたは組織の目的に対し、システムがどの程度重要かによって、システムコンポーネントのいくつかは計画的な冗長性でシステムにインストールされます。組織の目的に重要となるシステムには、冗長コンポーネントが装備される可能性が高くなります。冗長コンポーネントは、コンパニオンコンポーネントにエラーが発生した場合に、それに取って代わるよう設計されています。冗長性は、シャットダウンやコンポーネントの破損によるダウンタイムからシステムを保護します。

完全冗長 システム全体が完全冗長であるというのは、すべてのデバイスが正常な範囲内で作動していることを意味します。システムに完全冗長のファンが 4 つ必要で、4 つすべてが正常に作動している場合、システムはファンコンポーネントについて完全冗長であるといえます。2 つの主要ファンのうちいずれかが故障しても、それぞれにバックアップがあります。完全冗長の場合、通常の予防メンテナンス以外の処置は必要ありません。
劣化冗長 劣化冗長とは、完全冗長に必要なコンポーネントのいくつかが機能していないことを意味します。システムは稼動していますが、作動しているコンポーネント数が十分でないため、コンポーネントに障害が発生した場合、そのコンポーネントに取って代わるものがありません。たとえば、完全冗長には 4 つのファンが必要で、稼働中のファンのうち 3 つが劣化冗長を示しているとすると、2 つの主要ファンのうち、故障時にバックアップがあるのは 1 台のみとなります。
喪失冗長 喪失冗長とは、システム障害を防ぐ正常なコンポーネントが最小限しかないことを意味します。作動している冗長コンポーネントはありません。完全冗長には 4 つのファンが必要で、正常に作動するファンが 2 つしなかい場合、2 つの主要ファンのいずれかが故障してもバックアップが一切ありません。

タイプ

イベントは種類別に分類されます。イベントの種類の例として、正常、警告、重要があります。

正常 正常なイベントは、コンポーネントがシステムで正常に機能する値の範囲内でコンポーネントが稼動していることを示します。ステータスが正常であるコンポーネントによく使われる別の用語は OK です。コンポーネントが OK の場合、あるいはイベントが正常である場合、システムの操作担当者が対応処置を行う必要はありません。
警告 警告イベントは、管理下コンポーネントの動作が最適ではないが、稼動可能な状態であるときに発生します。警告イベントは、システム操作担当者にいくらかのリードタイムを提供します。警告イベントに対する適切な処置は、さらに調査をして、コンポーネントのメンテナンスをスケジュールすることです。警告はまた、操作担当者にコンポーネントが正常に戻るまでさらに注意することを促します。パワーユーザーおよび管理者は、警告イベントの最小および最大値を定義できます。警告範囲を定義するメリットは、パフォーマンスの劣化兆候が見え始めた稼動コンポーネントに対して、パワーユーザーと管理者が対応する時間を確保できることです。
重要 重要イベントは、コンポーネントが正常な機能範囲外で稼動しているか、またはまったく稼動していないことを示します。まったく稼動していないコンポーネントは、普通、回復不能と呼ばれます。コンポーネントの技術設計や正常な機能性を一番良く知っているのはシステムの製造元であるため、製造元がコンポーネントの重要な範囲を定義します。重要は、警告よりもより緊急性の高い意味合いを持ち、システム操作担当者はこのタイプのコンポーネントパフォーマンス劣化をより深刻に受け止めます。重要または障害が発生しているコンポーネントに適する処置には、システムをすぐにシャットダウンすること、またはコンポーネントをすぐに交換することなどが含まれます。

状態

コンポーネントの状態またはシステム属性には、作動可能、劣化、作動不能があります。

作動可能 作動可能な温度とは、シャーシ内部にある温度プローブの読み取り値が正常な作動範囲内にあることを意味します。
劣化 劣化温度は、シャーシ内部にある温度プローブの読み取り値が、警告に必要な最小と最大稼動温度として定義された警告範囲内であることを意味します。シャーシ内の温度は、正常な最小温度を下回っているか、または正常な最大温度を上回っています。
作動不能 作動不能なコンポーネントまたはコンポーネント属性は、障害または回復不能な範囲でコンポーネントが稼動していることを意味します。温度の例をとると、システムがまだ稼動している場合、今まで温度が正常範囲外であり、システムのサーマルシャットダウンが発生するか、または温度によりシステムコンポーネントが破損または破壊されてしまう原因となり得ます。

重大度

各イベントの種類とコンポーネントの状態は、重大度によって評価されます。イベントの重大度には、情報、マイナー、メジャー、および重要があります。

情報 正常なイベントまたはコンポーネントステータスは、稼動状態にあり、正常なイベントに関連付けられた重大度は情報です。正常なイベントに対して Server Administrator が取る唯一の処置は、情報提供です。Server Administrator は、システム操作担当者にコンポーネントが正常であることを伝えます。
マイナー 警告イベントは、コンポーネントによってマイナーまたは重要のいずれかとなります。たとえば、ファンが冗長したシステムからファンを取り外しても、そのイベントの重大度はマイナーです。
メジャー 警告イベントには、システムへの重大なリスクを示すものもあります。ファンがシステム外に長時間あると、冗長性が失われるためイベントがメジャーとなる場合があります。組織における使命のために冗長性が必要なシステム内で、コンポーネントが長期間不在になると、バックアップのない状態でコンポーネントに障害が発生し、いずれはシステム障害につながる可能性があります。
重要 コンポーネントが障害範囲内にあることを検知するイベントは、重要です。ファン、AC 電源コード、またはメモリーモジュールなどのコンポーネントに障害が発生すると、システムが稼動してデータを保存する機能が脅かされます。

イベントの種類、重大度そして状態の関連性

以下の表は重要コンポーネントに対するイベント例を提供し、イベントの種類、重大度そして状況がどう関連しているかを示します。

メモ: VMware ESXi オペレーティングシステムの制限上、本リリースの Server Administrator ではアラート処置の設定機能は使用できません。
表 1. イベントの種類、重大度そして状態の関連性
コンポーネント イベントまたはアラートの種類 重大度 状態
[AC電源コード ] 正常 情報 作動可能
[AC電源コード ] 障害 重要 劣化
[電源装置 ] 障害 重要 劣化
[冗長性(電源システムに対し) ] 正常 情報 作動可能
[冗長性(電源システムに対し) ] 劣化 マイナー 劣化
[冗長性(電源システムに対し) ] 喪失 メジャー 劣化
[温度 ] 正常 情報 作動可能
[温度 ] 警告 マイナー 劣化
[温度 ] 障害 重要 劣化
[サーマル ] シャットダウン 重要 作動不能