by Bethany Drouin

日本では2019年8月23日(金)、Amazonが提供するクラウドサービス「アマゾン・ウェブ・サービス(AWS)」に大規模な障害が発生し、多数のサービスやウェブサイトなどが影響を受けました。これに引き続き、アメリカでも8月31日(土)に同様の障害が発生し、顧客のデータが損失するという事態が発生していることが分かりました。

AWS celebrates Labor Day weekend by roasting customer data in US-East-1 BBQ • The Register

https://www.theregister.co.uk/2019/09/04/aws_power_outage_data_loss/

2019年8月23日にAWSの東京リージョンで発生した障害についてAmazonは、「空調設備の管理システム障害が原因」だと発表。障害発生後の調査により、冗長化されているはずの冷却システムがバグにより正常に作動しなかったためにデータセンターの一部で室温が上昇し、サーバーの停止を招いたことが判明したと報告しています。



これに引き続き、8月31日にもAWSのアメリカ東部(バージニア北部)リージョンで障害が発生。AWSで使用されるクラウドストレージ「Amazon Elastic Block Store(EBS)」のデータが一部損失する被害が発生しました。

AWSを利用していたプログラマーのアンディ・ハント氏は9月4日にTwitterで「AWSで電力障害が発生してEBSサーバーが停止していたことが分かりました」とツイート。ハント氏がEBSに保存していたデータが全て消失したと述べました。



技術系ニュースメディアThe Registerの取材によると、今回の障害は8月31日の4時33分(太平洋標準時)にアメリカ東部リージョンのデータセンターで停電が発生したことが発端だとのこと。停電の発生と同時にバックアップ用の発電機が作動しましたが、1時間30分ほどで発電機が故障。その後の復旧作業により、12時30分にはシステムの99.5%が回復しましたが、残りは回復不能とみて復旧が断念され、EBSに保存されていたデータが消失する事態になったとのことです。

ハント氏はデータのバックアップを取っていたため事なきを得ましたが、「障害発生後のAmazonのサポートは著しく不十分でした」と非難。8月31日に発生した障害についてのAmazonの説明が障害発生から4日後にずれ込んだ点について「率直にいって、これが一番由々しい問題です」と述べています。



ハント氏は「クラウドの正体は、Amazonのデータセンターが位置するレストンの電力不足なPCにすぎません」と述べて、クラウドを過信すべきではないとの教訓を強調しました。