久幸繙文

HDの寿命とバックアップに最適なメディアの考察

注意

この記事は2007年10月10日に内容(特に各メディアの寿命に関して)を大幅に改訂しました。

何故バックアップが必要なのか

HDDの寿命

何故データのバックアップが必要なのか。その理由は、現在データ記録の主流となっているハードディスクドライブ(HDD)の信頼性壊れたときのリスクに求めることが出来ます。

まず、基本的にHDDは当たり外れの大きいメディアであり、その寿命は環境や元々の品質によって大きく左右され、一概に「○年までは大丈夫」という保証はどこにもありません。6年以上持つ事もあれば、半年足らずで壊れてしまう事もあります(平均的には3〜5年程度のようです)

それどころかHDDの使用頻度と故障率との間には有意な相関性は見られなかったという報告

もあり、HDDの寿命はつまるところ「運」としか言いようがないという諦め声さえ出ています。

加えて、「粗悪な電源、電気ノイズ」や「過度の振動や磁力」、「高すぎる温度」(室温が40度を超えるような部屋では、ケース内の温度が動作保証温度を超す虞があります)と言った使用環境によっても、HDDの寿命へ悪影響を及ぼすと言われていまが、落雷による瞬停や、猛暑による室温上昇など、個人の力で悪い要素を全て排除するのは現実的ではありません。

壊れた時のリスク

当然の話ですが、もしHDDが壊れてしまえば、そのHDD内に記録していた情報は全て消えてしまいますOSの情報ソフトの設定情報なんてものは、少し苦労すればいくらでも再構築が可能ですが、自分で作ったデータだけは二度と元には戻りません。ブックマークリストや、自分で書いたイラスト、住所録等々、消えてしまうと困るものはたくさんHDDに詰まっています。

壊れ方によっては自力で、或いは業者に依頼することでデータを復旧(救出)することも出来なくはありません。が、自力救助の成功率は運のレベルですし、業者への依頼は数万〜数十万レベルの支出を覚悟しなければなりません。おまけにそれでも復旧出来ない事もあります。

二重、三重の維持コストを払ってでもバックアップが重要視されるのは、このように復旧コストがあまりにも高すぎるという背景があるわけです。

何度も言いますが、HDは必ず壊れるものです。それもかなり壊れやすいものです。自分の大切なデータは、必ず二重三重に保存して、どれか一つの不具合が生じてもすぐにコピーし直せるようにしておかなければならないのです。検索サイトgoogleのファイルシステムでは、原則として全てのデータを三重にバックアップしているようです(2003年 gooogle社

バックアップの方法について

バックアップの種類

基本的にバックアップには、次の三つに大別できます。

  • フルバックアップ
  • 差分バックアップ
  • 増分バックアップ

「フルバックアップ」は読んで字の通り、必要なデータをすべてまとめてバックアップします。あとの二つはこのフルバックアップとセットで利用し、「差分バックアップ」は前回フルバックアップしたデータから「新たに作成または追加されたもの」だけをバックアップします。「増分バックアップ」は、前回フルバックアップ分に加えて前回の増分バックアップも含めて「新たに作成または追加されたもの」だけをバックアップします。

もう少しわかりやすく言いますと、

  • あるHDDの中にファイル「X Y Z」があったとします。
  • このファイルのフルバックアップをとると、バックアップファイルAには「X Y Z」が全て記録されます。
  • 数日後、Xを更新した(X')後でまたフルバックアップをとると、Aには「X' Y Z」が上書きで記録されます。
  • 一方、フルバックアップをとらずに、差分バックアップを取ると、Aはそのままで、新しくバックアップファイルBを作り「X'」だけを記録します。Aには「X Y Z」が残ったままです(増分バックアップもこの時点では同じ)
  • さらに数日後、今度は「Y」を更新した(Y')後でまた差分バックアップを取ると、BにはAと比較して更新された「X' Y'」が上書きで記録されます。
  • 一方、増分バックアップを取った場合は、AもBもそのままで、AとBと比較して更新された「Y'」だけを新しくバックアップファイルCを作って記録します。

という形になります。この時、もしファイル「X' Y' Z」を損失してしまった時の復旧は、

  • フルバックアップのみの場合、Aには最新版「X' Y' Z」が記録されていることになり、このAを読み出すだけで済む。
  • 差分バックアップを組み合わせた場合、Aには「X Y Z」が記録されており、最新版「X' Y'」を復旧するためBも読み出す必要があります。
  • 増分バックアップを組み合わせた場合、A B Cの三つのバックアップファイルを読み出さなければなりません。

このように書くと、「ならば常にフルバックアップをし続ければよいのではないか」という疑問を持つでしょうが、実際にやってみると毎回毎回全てのファイルを上書きコピーするのは時間がかかりすぎて非効率という欠点があることを認識するでしょう。

RAID

「バックアップ」と似た概念に「RAID」と呼ばれるものがあります。

RAIDとは、複数のHDDを一つの記憶装置(ドライブ)として仮想的に取り扱うことで、データの安全性を向上させる仕組みです。状況に応じて1〜6までのレベルが定義されており、取り分けデータの複製を完全に同期させるRAID レベル1のことを「ミラーリング」と呼ぶこともあります。

ハードウェア或いはソフトウェアを利用してリアルタイムでデータの安全性が確保出来ると言う点から、近年業務用だけでなく一部のパワーユーザにも普及しつつあります。がしかし、これはあくまでも物理的な消滅(ドライブの故障やクラッシュなどの障碍)に対して有効であっても、論理的な消滅(誤削除、誤上書き、ウィルスによる破壊など)に対しては全く効果がない点に注意しなければなりません。

つまり、RAIDやミラーリングはデータの安全性を高める面では効果的ですが、バックアップを代替するものではなり得ないと言うことです。

バックアップソフト

とまあ、色々と基礎知識や理論がありますが、多くの人はそんな小難しいことは考えずに、バックアップソフトに任せっきりだと思います。

基本的にはそれで問題ないと私も思いますが、ただ、定期的にきちんとバックアップが取れているかバックアップの復旧方法を覚えているかと言う点はチェックしておきましょう。いざというときに設定のミスで復旧できなかった! なんてことにならないように(実話…汗)

バックアップ先について

コストと安全性の問題

自力でするにしてもソフトに頼るとしても、基本的な問題として、バックアップは元のデータが支障なく運用されている限り何の価値も産み出しません。家計における掛け捨ての保険金みたいなものです。ですから、費用をかければかけるだけ安心できますが、その分普段のランニングコスト(維持費)は多くなってしまいます。

一方、バックアップが必要となるのは、データ元が何らかの理由によって消滅してしまった事を意味します。なにやら禅問答みたいですが、要するに、元データと同じ理由でバックアップデータが同時に消滅する可能性を考える必要があると言うことです。

例えば単純にファイルのコピーを取っただけとしましょう。そのコピーは一体どこに保存しますか? もし同じHDDに保存していたところ、そのHDD自体が故障して使えなくなってしまったとしたら? 仮に二つのHDDを用意してバックアップを取っていたとしても、もしそのHDDを設置している部屋に泥棒が入ってHDDを二つとも盗まれてしまったら? ウィルスがホームネットワークに接続されたHDDに同時に感染してしまったら? DVDに焼いたとしても、その家が火事になってしまったら? 等々...

バックアップは、出来るだけ異なる仕組みで、異なる場所へ保存するのが理想とされています。まあ、家が火事になるかもというのは大げさとしても、少なくとも「同じHDD内で複製だけしてOK」というのは、データ保守の観点からお奨めできません。消えたら絶対にまずいデータがあるとすれば、多少の出費はやむを得ないと考えるべきです。

費用をかけ過ぎても、かけなさ過ぎても困るのがバックアップです。今後ますます情報の電子化が進み行く中、このバランス感覚は、より大切な情報リテラシー(能力)の一つとなることでしょう。

バックアップ先のメディアについて

先ほどの費用の話と一部重複しますが、バックアップに用いるメディアについても、少し考える必要があります。

例えば、100GBのデータが詰まったHDDのフルバックアップを取ろうとなると、手軽に導入できるメディアとしては最大の容量を誇るDVD-R(4.7GB)でも21枚必要と言うことになり、およそ現実的ではありません(まあ、次世代DVDが実用的になれば多少状況は改善されますと思いますが)

そうでなくとも、DVDやCDなどは読み書き共に時間がかかり、毎日となるとげんなりします。しかしながら、効率だけを優先してHDDだけとなると、今度は前章のような問題もあります。自分の環境とデータの希少性に合わせて適切な組み合わせを考えていくしかありません。

  • HDDは容量・読み書き速度共に記録媒体としては最高レベルですが、壊れやすいという欠点があります。
  • CDやDVDなどの光学媒体は、HDDよりは堅固で、また上書きできないタイプであれば誤削除やウィルスに対しても有効です。しかし、なんと言っても読み書きに手間がかかるのが難です。
  • MO(光磁気媒体)は記録媒体としては最も堅固ですが、容量・速度、そして費用(ドライブもメディアもやや高め)が問題となります。
  • FD(フロッピー:磁気媒体)は、手軽さと言う意味では最高ですが、ややデータが壊れやすく、容量としはCGや音楽ですらイッパイイッパイという事もあり、1ファイル専用と言った運用にしか使えません。
  • SDなどのメモリカードは、速度としてはHDDをも凌ぎますが、容量当りの単価が高く、また原理上長期間の記憶には不向きです。

以前こちらでは各メディアの平均寿命を紹介していましたが、その後色々な報告書や記事(米国立標準技術研究所(NIST)など)を読む限り、信憑性に欠くと判断して全面的に削除させていただきました

Windowsの標準機能でバックアップを取る方法

ファイルと設定の転送ウィザード

XPで追加された新機能です。

[スタート]→[全てのプログラム]→[アクセサリ]→[システムツール]→[ファイルと設定の転送ウィザード]を起動。後はウィザードに従って選択していけばOK。バックアップを取るときは「転送元の古いコンピュータ」で、ネットワーク経由でHDDに保存する際はその他(例 リムーバブルドライブ、又はネットワークドライブ)」を選択(DVDに焼く場合でも同じ……はず)

転送するデータは「設定のみ」を推奨。かなり高速にバックアップファイルを作成してくれます(まあ、バックアップファイルという表現が正しいのかどうかは分りませんが) 圧縮もされているらしく、メールが山のように溜まっていなければ数十MBもあれば十分でしょう。

この上で、オリジナルデータ(マイドキュメントのファイル)のバックアップを別の手段でとっておきます(増分や差分などを考慮せず一々フルバックアップしてしまうため。設定データは大抵更新されている上ので問題ない)

なお、この方法ではアプリケーションやシステムアップデートのデータは転送されませんので、復元する前にインストール作業を済ませておく必要があります。また、復元時は全てのデータを上書きしてしまうので、あるデータ、ある設定だけを戻したいという希望には応えられません。元々は古いPCから新しいPCへデータを移行する為の機能ですので。

バックアップ機能

Windowsには標準でバックアップ機能がついています。

[スタート]→[全てのプログラム]→[アクセサリ]→[システムツール]→[バックアップ]を起動。後はウィザードに従って選択していけばOK。

「全てのファイル...」は時間がかかりすぎるので、「選択したファイル...」がお奨め。先の「ファイルと設定の転送」を済ませている場合はオリジナルデータが入ったファイル(マイドキュメントなど)を指定。後はバックアップ先とファイル名を指定するだけ。

タスクと組み合わせてバックアップスケジュールを組むことも可能。後で追記します。

久樹の考察

背景

さて、基礎知識は以上として、筆者が今考えているやり方について考察していきます。若干車輪の再発名ではありますが……。

以前筆者は、外付けのHDD(120GB)をバックアップ専用として用意し、Windows標準のバックアップ機能で毎日差分、月一でフルバックアップを取ると言う形を取ってきました。

しかしながら、ここ最近動画を保存するようになったなどの影響でデータ量が急増し、外付けHDD(120GB)がついに満杯になりました(確か1年前まで20%ぐらいしか埋まってなかったんだけどなぁ……)。またバックアップ時間も半日になるなど、月一とは言え流石にしんどくなってきました。

データを三つに分けてみる

このレベルであれば、単純に「1.記録媒体の容量を増やす(1TBぐらい揃えれば当分は大丈夫?)」「2.転送速度を増やす(ネットワーク→eSATAなど)」で解決出来るのですが、何とか工夫してなるべく出費を抑えたいところ。

例えば、データデータと一口に言っても、その全てのデータが毎日フルに利用しているのかと言えば、実際はそんなことありません。筆者の経験上、コンピュータ内のデータは次の三つに分けられると思います。

  • 毎日利用し、頻繁に更新するアクティブデータ(例:ブックマーク、メール)
  • 毎日利用するが、頻繁に更新しないアーカイブデータ(例:音楽)
  • たまに利用、更新も殆どないコレクションデータ(例:DLした動画、旅先で撮った写真など)

これらのファイルは、更新間隔に大きな差があります。更新間隔の長いデータを頻繁にフルバックアップするのはあまり効率的ではありません。となると、更新頻度の低いファイルはなるべく固定的な記録媒体に移すほうが良いのではないかと思います(誤消去などを避ける意味でも有効ですし)

しかし、DVDに焼くとしても、枚数が増えてくると検索効率に響いてきそうで、それが気がかりです。こればかりはやってみないことには分らないので、何とも言えませんが。(棚にきちんと整理してインデックスを作っていれば問題無さそうだけど、そもそもそれを作るのが面倒……)

以降追記予定。

久樹 輝幸