「システムはなぜダウンするのか」読了

システムはなぜダウンするのか

システムはなぜダウンするのか

あまり興味がないメインフレーム関連の話題が多かった。
Release It! 本番用ソフトウェア製品の設計とデプロイのためにの方がよかったかも。
以下メモ。

冗長化
  • 負荷分散クラスタ
    • 複数台で分散して処理。1台が故障したら残るサーバでその後の処理を担当。
  • デュプレックス
    • ホットスタンバイ(HAクラスタ)
      • 本番系故障時はアプリを起動した状態の待機系が引き継ぐ。
    • コールドスタンバイ
      • 本番系故障時は待機系をOSから起動して引き継ぐ。
    • ウォームスタンバイ
      • 本番系故障時は待機系のアプリを起動して引き継ぐ。
  • デュアル
    • 複数台が同じ処理を重複して実行。故障時は残りのみで稼働。
スプレッド・ブレイン
ネットワークの異常等のせいで本番系と待機系の間のハートビートのやり取りができなくなり、待機系が本番系が停止したと判断し本番系として起動して2台とも本番系となってしまう現象
スパニング・ツリー
ネットワーク内で通信データが永遠にループし続ける現象を防ぐ機能
ミラーリング(RAID1)
全く同じ内容のデータを2つのディスクに書き込む。
RAID5
データをブロック単位で分割しパリティ・データを付与後、分散して保存。データ消失時は生存しているブロックのパリティ・データからデータを復元。
RAID6
RAID5の弱点である同時故障に2種のパリティ・データを作成し別々のディスクに保存することで対応。