ヤフー子会社でホスティングサービスを手がけるファーストサーバは、大規模なサービス障害とデータ消失について中間報告をまとめた。原因はセキュリティ脆弱(ぜいじゃく)性対策のための更新プログラムのミスなどだ。影響は深刻で、一部のデータ復旧を断念する事態となっている。
障害は2012年6月20日に発生した。ファーストサーバは同日17時ごろ、脆弱性対策を特定のサーバー群に実施したが、あらかじめ作成しておいた更新プログラムにミスがあった。さらに事前に行った検証環境での動作確認も不十分で、問題が起こる可能性を見逃していた。
また本番のサーバーと、バックアップのサーバーに同時に脆弱性対策を適用する仕様だったため、本番のサーバーに問題が発生した後、バックアップに切り替えて元の状態に戻せなかった。こうした仕様になっていた理由は、過去に別の問題が起きてバックアップに切り替えた際、脆弱性対策をしていない状態で稼働し続けたことがあったためだという。しかし今回はかえってあだになった。
本記事は、ニフティのニュースサイト「bizmash!」向けに弊社が執筆した記事「ファーストサーバ、障害原因は更新プログラムのミスや確認不足、一部データ復旧を断念」の一部です。全文は、bizmash!のサイトにてお読みください。