@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「運用改善の教科書」を読んだ

運用設計の教科書 を読んでいる最中に出ていることを知って買ってはいたが積読していた。運用は長くやっているので興味のある分野でもあるので読んだ。

運用設計の教科書 のブログはこちら

hihihiroro.hatenablog.com

本書の目次は以下。

1章 運用の変化と運用改善の目的
2章 運用ルールを見直す
3章 運用を分析して改善する
4章 自動化とツール
5章 クラウドサービス運用に必要なこと
6章 運用に置ける情報セキュリティ対応
7章 運用チームに求められるスキル
8章 運用改善が評価される組織づくり
Appendix1 運用改善と心理的安全性
Appendix2 運用のアウトソース
Appendix3 参考資料

前半では改善の進め方を、後半では改善するために必要な要素について説明されている。
1賞から3章までが前半になっている。この中では運用改善は生産性の向上が目的で、運用改善のゴールとして継続的に運用改善ができる組織ができることと説明されている。
システムだけで運用を考えるのではなく、サービス全体をまとめて考えて運用することが推奨されていて、なるほどと思った。運用作業でシステム単体に影響があるものはやっていても少なく、そのシステムが使われるサービス全体の一部としてのルール・ライフサイクルを考えるのは大事だなと思った。
3章では具体的な運用改善のススメ方について解説されている。改善をするべきものはなにかを見える化する方法や、そもそも可視化をどこまで行うべきかの考え方が紹介されていた。このあたりについては感覚で行っていることが多かったが本書で紹介されているCOBIT 成熟度モデルやITIL の継続的サービス改善などを1度読んでみようと思った。ちなみに本書ではCOBIT 成熟モデルの3 → 4 へ向けての改善方法が解説されているらしい。

・COBIT 成熟度モデル

0.プロセス不在
1.個別対応
2.再現性はあるが直感的
3.定められたプロセス
4.管理測定が可能
5.最適化

ITIL の7ステップの改善プロセス

1.改善のためのアプローチ決定
2.測定すべきデータと手法決定
3.データの収集
4.データ処理
5.情報とデータの分析
6.情報の提示と活用
7.改善活動の実践

4章以降は改善のために必要な要素がいくつか紹介されている。
自動化の一部としてCI/CD、IaC、LCDP/RPA について紹介されている。自動化をした方が良いが自動化した際に運用に与える影響について説明されている。IaC の節ではIaC を行った際のメリット・デメリットも紹介されている。ここで紹介されているデメリットについては余り問題視せずにやって良いのではと思っている。作業した人が間違った記載をしていた手順書や、何も説明のない煩雑なサーバなどを運用してきた身としては少しの面倒事は我慢してでもやったほうが後々楽だろうと思っている。
オンプレだけではなくクラウドSaaS での運用についても説明されている。気にするところが変わったり、自分でいじれなくなるところがあったりするがオンプレ→クラウドについてはあまり心配することは無いのではないかと思っている*1
運用を行う上でのセキュリティについても触れられている。守らなければいけないものの選定、セキュリティの意識する箇所などについて説明されている。そして、セキュリティインシデントが起きてしまった際の報告についても説明されている。セキュリティについては以前違う本で入門書を読んだのでもう少し詳しいものを読み進めなければいけないなと思った。

今回気になっていた7章のスキルについては以下の3つのスキルについて説明されていた。

  1. テクニカルスキル
  2. ヒューマンスキル
  3. コンセプチュアルスキル

テクニカルスキルは業務を行う上で必要な知識や熟練度、ヒューマンスキルは人間関係を円滑にするための対人関係能力、コンセプチュアルスキルは複雑な事象を概念化して本質を把握する能力と紹介されている。これらはカッツモデルからの参照となっていた。経営者、マネジメント者、作業者によって必要となる割合は違うがどこの層でもそれぞれのスキルが必要だというのがそうだなと納得した。本書ではそれぞれのスキルの概要が紹介されている。僕にはどれも足りてないから1個1個順番に取得するように頑張らなきゃなと思った。
ちなみにスキル分類表はコチラからダウンロードができるようだ。

8章では運用改善が評価されるためにはということが書かれている。確かに、運用をしている人たちと話をすると評価されていないと思うや大事に思われてないといった意見を言い合うことが多い。このへんは適宜上司と話し合うしか無いのかなと思っている。コストが減りましたなどわかりやすく成果が出るものは評価されるのだろうが、今動いているシステムを止めないためのEOSL 対応や少しづつの自動化などは評価されにくいのだろう。今動いているものを止めることなく動かし続けるというのはすごいことなんだぞといつも思ってはいる。

まとめ

  • 運用改善がうまくすすまないのは運用設計がちゃんとされてないからかなと思った
  • 評価されるようなことを行っていきたい
  • スキルの取得を頑張ろう

*1:クラウドに対する知識の勉強は必須だが