2016年3月28日月曜日

エージェントについて

原文:All About That Agent…

Enterprise Managerではエージェントは大きな役割を持っています。ターゲットから全ての情報を集めてくるほか、管理作業やジョブを実行します。ジョブを実行するにはエージェントはヘルシーな状態でないといけません。この投稿では、エージェントとターゲットがきちんと監視されて情報を送っていることを確かめるためのチェックポイントをいくつか見ていきます。

エージェントページ

エージェントのページで何を見ることができるのでしょうか。個人的には、EM管理者は毎日このページをチェックすべきだと思います。どのターゲットでアップロードが停止しているか、どのエージェントが停止していたり長期間ブラックアウト状態になっているか、把握しておくべきです。「設定」→「Cloud Controlの管理」→「エージェント」から次の画面に行くことができます:

まず、ステータスでフィルタリングすることができます。すべて、起動中、停止中、ブラックアウト中、使用不可、のビューがあります。また、ブロックされているものや校正ミスがあるものも見ることができます。

エージェントはデフォルトでインストール中にセキュア化されます。ですから「セキュア・アップロード」が「いいえ」である場合は再度セキュア化する必要があります。

ここではいろいろなステータスが表示されますが、調査が必要なものとして最もよく見るのは使用不可とブロックです。
agents5
使用不可の場合、診断分析をするための追加アイコンが表示されます。これは使用不可能な理由を判別するために追加のチェックを行います。

「最後の正常なアップロード」ではエージェントとターゲットについていろいろなことがわかります。この列でソートしたときに何ヶ月、何年もアップロードしていないエージェントがあるようだと、もはや誰も気にかけておらず、おそらくエージェントがすでにアンインストールされたものであると考えられます。もしコンタクト先がわからなければ、ブラックアウトにしておくのが良いでしょう。

次の2つの列はよく見落とされているように思います。
1つめは監視中のターゲットの数です。これによりターゲット(ホストとエージェントも含む)がいくつ管理されているかがわかります。どのエージェントも最低3つはあります(エージェント、ホスト、エージェントのOracleホーム)。もし2つか3つしかターゲットのないエージェントがあれば、そのサーバーで何を監視しているのか調べ始めるための大きなきっかけになります。この列が0であれば、何かがなんらかの理由で壊れているのでは、と注意を払うべきでしょう。
メトリックほかのどのターゲットとも同じように、エージェントターゲットについても様々な情報が収集されていることが、「モニタリング」→「すべてのメトリック」メニューからわかります。それぞれのカテゴリで複数のメトリックが収集されています。証明書の有効期限、ディスク使用、メモリ使用、CPU使用などの情報があるのがわかります
カテゴリ名をクリックすると、右側のペインにリアルタイムデータが表示されます。これはメトリック関連のトラブルシューティングをする際にとても役立ちます。最新アップロード時間も見ることができます。メトリックは15分ごとにアップロードされますので、この時間が15-20分以上前であれば、エージェントに何か問題があります。


いくつかとても便利なメトリックがあり、特に「EMD〜」のカテゴリにあるものです。これらのメトリックではエージェント-OMS間の通信(ハートビート、ping、アップロードなど)について情報を得ることができます。皆さんの環境のエージェントで収集されているメトリックを実際に観察してみてください。

レポート

エージェントやその他のターゲットの問題を識別するのに便利な情報パブリッシャレポートがいくつかあります。「エンタープライズ」→「レポート」→「情報パブリッシャ」から、「Enterprise Managerの状態」にあるものから見ていきましょう。

「エージェントのクロック同期オフセット」は、エージェントのシステム時刻がリポジトリのシステム時刻とのずれを、最後のハートビート時のタイムスタンプを元に表示します。EMのいろいろな部分でこのタイムスタンプを使用しているため、数分以上のずれは問題につながる可能性があります。

「不正な状態のエージェント」は過去24時間のメトリックエラー状態、停止状態、保留/不明状態のエージェントを表示します。

「再起動されたエージェント」は、過去24時間に再起動されたエージェントを表示します。もし特定のエージェントが継続的に表示されるようであれば、クラッシュしている可能性があります。

「破損したターゲット」は、先ほど見た情報を別の見方で見るもので、構成ミスがあるものやなんらかの理由で監視されていないターゲットを表示します。定期的にメールで送るように設定しておき、どのターゲットに問題が発生しているか確認するのに使うと良いでしょう。

「データをアップロードしていないターゲット」も、EM管理者は定期的に見ておくべきものです。継続的にアップロードしていないターゲットと、最後のアップロード時間を表示します。

さらに、「ターゲット・ステータス診断レポート」カテゴリにあるレポートは、特定のターゲットの問題を診断するのに役立ちます。エージェントベースのターゲットとは、ホスト、データベース`インスタンス、リスナーなどです。リポジトリに基づくターゲットとはクラスタ、クラスタ・データベース、システム、などです。今後の投稿では、これらのレポートについて掘り下げていきます。

このブログのパート2では、EMDIAGのAGTVFYスクリプトの使い方に目を向けるとともに、エージェントのいくつかのログファイルと一般的なエラーについても見ていきます。お楽しみに!

0 件のコメント:

コメントを投稿