例年「HDD/SSD故障率レポート」を公開していることでも知られるBackblazeが、同社が運用するHDDの総容量から、「そもそも故障率とは何なのか?」「バスタブ曲線とは何なのか?」「HDDは何年間使えるものなのか?」について解説しています。

How Long Do Disk Drives Last?

https://www.backblaze.com/blog/how-long-do-disk-drives-last/

Backblazeは堅牢(けんろう)でスケーラブルながらも低コストというクラウドバックアップおよびストレージサービスを提供する企業で、その公式ページを見ると、50億個のファイルを900ペタバイト(90万テラバイト)も保存しているとアピールされています。

このような容量を確保するため、Backblazeは4TB〜18TBのハードドライブを20万台以上も運用しており、その総容量は2エクサバイト(2000ペタバイト=200万テラバイト)に達しているとのこと。これらのほとんどは60台のハードドライブとブート用ドライブを収容できるストレージサーバーに接続されており、これらのストレージサーバーを20台ごとにまとめて「BackblazeVault」として管理しているそうです。顧客のデータの複製・保存・削除などは、このBackblazeVaultの中で行われています。

Backblazeが運用するハードドライブは全て市販の3.5インチHDDで、製造メーカーごとに分類すると以下の割合となります。なお、HGSTはWestern Digital(WDC)の傘下ですが、以下の円グラフ上では別扱いとなっています。

容量ごとの内訳を見ると、2021年12月時点では12TBが32.7%、14TBが28.5%を占めており、この2種だけで全体の60%を占めている計算です。

今回Backblazeが話題にしているのはこれらのHDD、すなわちHDDは何年使えるものなのか?というものです。当然ながらここでは「運用後10日で壊れた」「1年で壊れた」「10年で壊れた」といった、「期間」の概念が重要なので、Backblazeは期間の要素を持たない「故障率」という単語ではなく、「年間平均故障率」という単語を使用しています。

Backblazeによると、HDDの年間平均故障率というのはおおむね「バスタブ曲線(故障率曲線)」というものに従って推移すると予想されます。機械や装置などの故障は基本的に、初期不良によって生じる「infant mortality failures(初期故障)」、ランダムな理由によって生じる「偶発故障(random failures)」、使用による摩耗によって生じる「wear out failures(摩耗故障)」の3種に分類されます。これらのうち、偶発故障は使用期間によらず一定の確率で生じると考えられますが、初期故障は購入直後に発生する確率が最も高く、摩耗故障は購入してから年数が経ってから発生する確率が上がるため、一般的にトータルの故障率である「Observed failure rate」は以下の青色グラフのような曲線を描きます。これがバスタブ曲線です。

BackblazeがHDDに関する調査を開始した時点では、年間平均故障率はバスタブ曲線に従っていたそうですが、近年では「3年半までは2%以下だが、そこから跳ね上がり、バスダブ曲線の左側が低くなる」という結果が得られることがわかっているとのこと。この曲線の形状について、Backblazeは「むしろ浅い柄杓(ひしゃく)かホッケースティックに見える」と表現しています。

以上のような年間平均故障率から「HDDの生存期間はどれくらいなのか?」をグラフ化すると、以下のようになります。4年目まで使えるHDDは全体の90%ですが、そこから生き残れるHDDの割合はガクッと低下し、6年目まで生き残れるのは全体の65%ほどだそうです。

このグラフが6年で終わっているのは、「6年を超えた場合に信頼できるようなデータは十分集まらなかったため」ですが、Backblazeは既存のグラフから「HDDの生存率が50%を下回るのは、6年9カ月になる」と予測しています。

以上の結果から、「これから購入するHDDはどれくらい持つと想定しておけば良いのか?」という質問に対し、Backblazeは「1日で壊れるか10年持つかはわかりませんが、いずれにせよいつかは必ず壊れるので、最低でも1つ、できれば2つはバックアップを用意する『321ルール』に従いましょう」と締めくくっています。