MOテクノロジー

技術をメモしていくブログ

【AWS】2019/08/23 東京リージョン障害の備忘録

AWS東京リージョンでの大規模NW障害、弊社もそれなりに影響を受けた。
ここまでの障害は滅多にないと思うので、備忘として残す。

確認できた症状

  1. ap-northeast-1aに存在するEC2が複数ダウン。
    そのうち本番環境として稼働していたのは2つのサービス。
    ALBで2台構成のマルチAZにしていたので、もう1台のEC2に振り分けられる...はずだったのだが。
    1つのサービスではきちんともう1台に全てのアクセスがいっていたので問題なかった。
    もう1つのサービスでは振り分けられておらず、「504 Bad Gateway」か「Nginxのウェルカムページ」が表示された...なぜや...。
    これは全くの別問題ですね...はい...nginxの設定ファイルに誤りがありました...さーせん。

  2. ALBが500エラーを返す
    同じく本番環境で動いていてマルチAZにしているサービスで、EC2は問題ないのだが、前段のALBがまれに500エラーを返すことがあった。

障害情報まとめ

piyolog.hatenadiary.jp

ALBが500エラーを返す件

blog.hirokiky.org

AWSリソースのステータス

status.aws.amazon.com

AWS公式の声明

aws.amazon.com

クラウドインフラサービスの故障はなかなか防ぎようがないですからなぁ。
考えさせられる1日だった。