【AWS】2019/08/23 東京リージョン障害の備忘録
AWS東京リージョンでの大規模NW障害、弊社もそれなりに影響を受けた。
ここまでの障害は滅多にないと思うので、備忘として残す。
確認できた症状
ap-northeast-1aに存在するEC2が複数ダウン。
そのうち本番環境として稼働していたのは2つのサービス。
ALBで2台構成のマルチAZにしていたので、もう1台のEC2に振り分けられる...はずだったのだが。
1つのサービスではきちんともう1台に全てのアクセスがいっていたので問題なかった。
もう1つのサービスでは振り分けられておらず、「504 Bad Gateway」か「Nginxのウェルカムページ」が表示された...なぜや...。
これは全くの別問題ですね...はい...nginxの設定ファイルに誤りがありました...さーせん。ALBが500エラーを返す
同じく本番環境で動いていてマルチAZにしているサービスで、EC2は問題ないのだが、前段のALBがまれに500エラーを返すことがあった。
障害情報まとめ
ALBが500エラーを返す件
AWSリソースのステータス
AWS公式の声明
クラウドインフラサービスの故障はなかなか防ぎようがないですからなぁ。
考えさせられる1日だった。