@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「Apache Kafkaをはじめる」を読んだ

大量のデータを扱うや分散処理を作ろうと思うとメッセージングを使うことが多い。
その中でもKafka を使うことがあったので勉強してみようと思って読んでみた。

目次は以下。

第1章 Kafka 概要
第2章 Kafka はじめの一歩
第3章 Producer アプリケーション
第4章 Consumer アプリケーション
第5章 トランザクションによる堅牢なアプリケーションの構築
第6章 Kafka Connect によるデータパイプライン
第7章 Kafka Streams によるストリーム処理
付録A Kafka クラスタの構築オプション

概要でKafka の構成と用語についての基本的な知識を仕入れることができる。
ただ、もっと詳しく知りたかったのはあるので他の本を読んで知識を得ておこうとは思う。構築については最近はマネージドサービスがたくさんあるので自分でやることは少なくなるだろうが、トラブル対応などについては結局必要になるだろうから学んで試してみたい。

3章以降ではサンプルコードがふんだんに書かれながらアプリケーションを試してみることができるようになっていた。Producer、Consumer と単純に繋いでみることからストリーム処理についてまであった。配信品質についてなども試すことができたので色々とテストをすることができた。

今後大規模なシステムを考えるときにはKafka、Spark はなんとなく使うだろうなという気持ちがある。
この辺りについては今後も勉強していこうと思う。

まとめ

  • 薄い本なのですぐに読める
  • Kafka については一定の知識があることが前提となっているかな
  • Kafka を使った何かを作成しようとするための知識を得るには良かった