@hihihiroroのLog

ダラダラと。本ブログは、個人の意見であり、所属会社とは関係がありません。

「クラウドネイティブ時代のデータ基盤設計」を読んだ

続きものとして読んだ。

以前の内容はこちら。

hihihiroro.hatenablog.com

hihihiroro.hatenablog.com

本書の目次は以下。

第1章 データベースのクラウド移行
 1-1 加速する DB のクラウド移行 基盤と運用に5つのコスト削減策
 1-2 データベースのクラウド移行体制 DBA や DA の役割を知る
 1-3 コストと納期を守る 成功率を上げる見積もり手法
 1-4 クラウド移行で発生するギャップ インフラ構成要素別の注意点
 1-5 要件で異なるデータの移行方式 効率アップの鍵はツール選択
 1-6 DB に伴うアプリケーション移行 どのような修正が発生するか
第2章 データ基盤構築の実際
 2-1 DX におけるデータ基盤の主流に クラウドネイティブとは何か
 2-2 4つの要件で欲しいデータを探す 活用に不可欠なデータカタログ
 2-3 データカタログの代表的機能を提供 Lake Formation と Purview
 2-4 データ連携をローコードで実装 Oracle Integration Cloud
 2-5 「NewSQL」の Cloud Spanner PostgreSQL 互換性を備える
 2-6 既存Oracle DB の移行先 大規模データに向く ExaDB-D
 2-7 Aurora にSQL Server の機能 Babelfish をクラウド移行に活用
 2-8 「データクラウド」の Snowflake 他の DWHサービスと何が違うのか

オンプレで動かしていたものをクラウドにリフトするのではなく、クラウド上で動かすことを前提に設計、運用をすることがメインで書かれている。クラウド上で動かすことでデータ量について考えることやホストについて考えることはへるのでやることが少なくなることはある。その代わり、誰でも構築が可能になることでデータを見つけることの大変さや、他サービスとの容易な連携を考えていくことが重要となってくる。

クラウド移行することにより、現状の役割がどう変わるかについていくつか記載がされている。また、現状からクラウドに移行する際の対応方法として、データ量やダウンタイム時間によってどうするか考えるべきことが違うことはその通りだなと思った。これといった唯一解がないのだから、条件に合わせて考える必要がある。

第2章ではクラウド上のいくつかのサービスが紹介されている。
データカタログシステムとしていくつか紹介されているが、複数のサービスから登録できるものが便利だろうなとは思う。ただし、分析が始まっている状態であればだれかがデータの場所や情報について知っているので急いで作る必要があるか考える必要があると思う。スケールするためには必要だろう。触ってみようとは思うが慎重に選んでもいきたいところ。
また最後のところではSnowflake が紹介されている。実はいまだにSnowflake の良いところや使うべきところが分かっていないところがある。ぜひこのあたりを一緒に調べてくれる人や教えてくれる人を探してる。他のサービスでもできることが増えてきているのでSnowflake だからこそのものを探してみたい。

まとめ

  • 薄い本なので時間を書けずに読める。1章は読んでおいても面白いかも
  • Oracle の話が多い気がする。やはりオンプレからだとそうなるのかな
  • 触ってないものがやはりいくつかあるので触ってみる時間を取りたい