@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「データ保護完全ガイド」を読んだ

データを扱う仕事をしていることもあり、タイトルが気になったので読んでみることにした。

本書の目次は以下。

1章 データへのリスク:我々はなぜバックアップするのか
2章 SLAを決めるまでにすべきこと
3章 バックアップとアーカイブは全く別物
4章 バックアップとリカバリの基本
5章 データ保護にディスクと重複排除を使う
6章 従来型データソース
7章 データベースを保護する
8章 最新のデータソース
9章 バックアップとリカバリソフトウェアの方法
10章 アーカイブソフトウェアの方法
11章 ディザスタリカバリの方法
12章 データ保護ターゲット
13章 商用データ保護製品の課題
14章 従来型データ保護ソリューション
15章 最新データ保護ソリューション
16章 バックアップシステムのリプレースまたはアップグレード

バックアップをする理由なんて考えることなく、なんとなく必要だからという思いだけで取っている気になっていることが多かったと考えさせられた。
本書ではバックアップとアーカイブの違いが紹介されている。僕がやっていたのはバックアップではなく、本書で紹介されているお手軽コピーをやっていたんだなと思い知った。

バックアップとは、オリジナルから離して保存され、オリジナルが何らかの理由で削除または壊れた後に、そのデータを以前の状態に戻すために使われるデータのコピーと紹介されている。
アーカイブとは、離れた場所に保存されたデータのコピーで、参照用コピーとして使われるために作られ、そのデータの出どころを知らなくても、当該データが見つけられるだけの十分なメタデータとともに保存されたものと紹介されている。

また、バックアップの基礎となるべき基本のルールとして 3-2-1ルールが各所で説明されている。
3-2-1ルールとは、少なくともデータの3つのバージョンを2種類のメディアに保存し、そのうちの1つは別なところに置くべきというルール。確実にバックアップからのリカバリができることを考えるとそうなのだろうなと思う。そう考えると、今まで僕がバックアップとして考えていたことはそもそもバックアップするべきものでもなかったなと考えることができた。
リストアを試すことがあたりまえのように紹介されているが、いままでバックアップされているファイルなどでリストア試したことあると聞いたことがあまりなかったので、戻るところまで試すようにちゃんとしようと思った。

面白かったのはバックアップレベルについての話。名前は知っているが、あまり実践したことは無いので再度勉強できて面白かった。また、同じ章にデータ保護システムの設計の際に必要となる指標として目標復旧時間(RTO)、目標復旧時点(RPO) の説明がされている。実績と合わせてこれらの値をシステムにあう値として決めることで、必要なバックアップの要件を決めていくという当たり前のことが紹介されている。しかし、やってないことばかりなのでシステム設計するときには当たり前のことをやっていかないとなと思った。

まとめ

  • バックアップかアーカイブかなんて考えてなかったなと反省した
  • クラウドSaaS、Docker、Kubernetes、IoT についてのデータ保護についても説明があったので再度読み直してみたい
  • そもそもバックアップが必要なのかどうかから見直すことをやってみたい