システムの過負荷状態について

ハードウェア処理能力以上の処理を要求された場合、過負荷状態に陥り定常的な処理が滞る場合があります。

システム過負荷の定義

ハードウェアの処理能力以上の処理を要求されたことでソフトウェア処理の停滞が発生した状態を指します。

システム過負荷の解消の検知

過負荷状態に陥るとシステムの処理が停滞するため発生時には検知することができません。そのため、過負荷が解消したときに検知し次のようなログを記録します。

100 Jul  1 12:00:00    warn system polld: overload? (deferred 5.20005sec)
  • この例の場合は直前の5秒強の期間、過負荷状態であったことを示します。
  • ポーリング処理の間隔が一定でなかったとき、過負荷によってシステム処理が停滞していたとみなします。
注: SMFやSACMサービスのWebインタフェースが提供するグラフ表示は単位時間(最短5分)あたりの平均値を用いるため、短時間の高負荷や高トラフィックはグラフ画像から読み取れない場合があります。また、過負荷発生時はグラフデータが送信されず表示が欠損する場合があります。

システム過負荷の原因

システム過負荷は次のような原因で発生することがあります。多くのケースは定常的なトラフィック処理に加え、複合的な要因や突発的な要因により発生するため定量的な閾値の提示は困難です。
  • 大量の暗号処理や経路計算
  • トラフィック過多
  • ソフトウェア不具合

システム過負荷の影響

過負荷状態に陥るとスケジューリングされた処理の遅延が発生するため、一例として次のような影響があります。
  • 定期的な監視パケット送信が遅延する
    • 死活監視機能やVRRPの広告など
  • 受信した監視パケットへの応答が遅延する
    • ping監視やIKE DPDへの応答など
  • 定期的なパケット送信の遅延や不送信
    • SMF Heartbeatなど

結果として現れる事象は状況によって一定ではありません。

また、システム過負荷の原因がトラフィック過多であった場合は処理しきれないパケットが破棄されることがあります。

システム過負荷の予防と対処

既知のソフトウェア不具合による過負荷の発生を避けるため、ファームウェアのリリースノートを確認のうえ最新版を使用してください。

運用上想定されるトラフィックがきっかけで定常的に高負荷となる場合は、上位機種への変更や併設による負荷分散、あるいは使用機能の見直しを検討してください。

意図しない突発的な大トラフィックによって過負荷状態となる場合は、トラフィックの発生元を突き止め解消してください。