@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「機械学習システムデザイン」を読んだ

データを集めるだけ以外の仕事もしないとなと思って色々と読んで見ている。

目次は以下。

1章 機械学習システムの概要
2章 機械学習システム設計の概要
3章 データエンジニアリングの基礎知識
4章 訓練データ
5章 特徴エンジニアリング
6章 モデル開発とオフライン評価
7章 モデルのデプロイと予測サービス
8章 データ分布のシフトと監視
9章 実現場での継続学習とテスト
10章 MLOpsにおけるインフラとツール
11章 機械学習の人的側面
付録A 機械学習システムを外部に提供する

まず初めに、本当に機械学習が必要なのかを考え直すところから書いてあるのは納得感があった。
ただ、機械学習を使うとなった時に機械学習の実装に向けて考慮すべきことが網羅的に記されていた。
データエンジニアリングの基礎、特徴エンジニアリング、モデル開発、オフライン評価、データの分布シフトと監視、継続学習、テストなど、機械学習システムのライフサイクル全体にわたるトピックを網羅している。

レビューなどで話を聞くことなどはあるが詳しくわかってない単語などについても再確認できたので学びになったのはとても良かった。MLOps と叫んでプロジェクトをすすめていこうするとぶつかるであろう問題や対応方法などについて体系的に学ぶこともできたので少しずつやってみたい人たちと協働してみたい。

まとめ

  • 機械学習については詳しくなれないけど共通の認識として知っておきたいと思う
  • 評価やテストについて興味があるので再度詳しく学んでみたい
  • 2年ほど経っているので今のシステムについても勉強したい