@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「カオスエンジニアリング」を読んだ

以前に入門と書かれている本を読んでカオスエンジニアリングに興味を持ったので読んでみた。

hihihiroro.hatenablog.com

1章 複雑なシステムとの出会い
2章 複雑なシステムの舵を取る
3章 原則の全体像
4章 Slack の惨劇シアター
5章 Google DiRT : 災害からの復旧テスト
6章 Microsoft における実験の多様化と優先順位づけ
7章 LinkedIn メンバーに対して配慮すること
8章 Capital One におけるカオスエンジニアリングの導入と進化
9章 先見性を生み出す
10章 人間的なカオス
11章 ループの中の人々
12章 実験の選択に関する課題(と、その解決策)
13章 カオスエンジニアリングの費用対効果
14章 オープンな心、オープンな科学、そしてオープンなカオス
15章 カオスの熟成モデル(CMM
16章 継続的ベリフィケーション
17章 サイバーフィジカルで行こう
18章 HOP とカオスエンジニアリングの出会い
19章 データベースにおけるカオスエンジニアリング
20章 セキュリティカオスエンジニアリングの事例
21章 おわりに

カオスエンジニアリングとは、本番稼働中のサービスにあえて擬似的な障害を起こすことで、実際の障害にも耐えられるようにする取り組みのこと。システムの複雑さが増しているが、カオスエンジニアリングによって脆弱性を発見し、顧客に影響を与える前に停止を防ぐことを目的としている。

第Ⅰ部は、舞台準備として複雑なシステムの説明、カオスエンジニアリングの適応についての説明がされている。3章まででカオスエンジニアリングの説明がされ、その後は様々な会社の人たちが実際にカオスエンジニアリングを実践している話が書かれている。実践者が自分たちで試すときの工夫や実体験が書かれているので試してみる手がかりなどについてわかりやすかった。

また、アプリケーションだけではなく組織に対して行っている話などもありどこにでも適応できるんだなと思った。アプリケーション、インフラから適応を勧めていきたいが他にも適応できるところがありそうだからまた、落ち着いたら読み直したいなと思う。

まとめ

  • システムを例にカオスエンジニアリングの原則を読んだ
  • 実践者の実体験や取り組んだ視点を感じれて良かった
  • ツールなどがまだまだ出てきているみたいなので情報収集を引き続き頑張る