こちらのイベントに参加してきたので、会の様子と感想を書いていこうと思います。
会の概要
以下、イベントページから引用です。
データの管理は複雑であり、数多くの技術的な課題、ドメイン特性、体制、戦略に応じた基盤の構築が必要となります。このような複雑性があるためデータマネジメントチーム自体のマネジメントは難しく組織として運営するノウハウは貴重です。このイベントでは、データマネジメントのエキスパートたちが集まり、チームの組成、推進方法、目標設定などの課題とその解決策について発表します。データマネジメントチームが発足したばかりの事例から大規模なデータマネジメントチームの事例まで揃っており、多くの方が参考になる事例発表になると思います。ぜひご参加ください。
会の様子
講演1〜属人化からデータマネジメントをチームで実行するまでの道のり〜
最初に前側さんから、スタートアップで0からデータマネジメントチームを立ち上げた話を聴いていきました。
最初に、データマネジメントをスタートアップのコンテキストで成功させるために必要だと考えている4条件に関して説明がありました。
- 事業の成長
- データマネジメントを事業戦略にアラインさせる
- 全社のデータマネジメントをするための関係者への推進力
- 理想を体現できる採用
が前側さんは必要だと考えているそうです。
次に、具体的に前側さんがチーム立ち上げの際にやったことの説明がありました。以下、その内容を箇条書きで説明していきます。
- チームの羅針盤づくり(DMBOKや現状とありたい姿とのGap分析を行い、羅針盤をつくった)
- 採用(リファラル採用を活用して、2名体制からどんどん拡大)
- プロダクト展開(マルチプロダクト展開などの考慮)
- ステークホルダーマネジメント(1企業との関係性が重要なプロダクトであるという特性があったため、Ops職との役割分担を実施)
講演2〜DMBOKを参考にしたデータマネジメントの取り組み〜
続いて土川さんから、DMBOKを活用してデータマネジメントを実施した話の紹介がありました。
DMBOKはデータマネジメントの知識領域が体系化されているものである一方で、取り掛かる優先順位づけが難しいため、DMBOKピラミッドを参考に最初はデータマネジメントの取り組みを進めたそうです。
しかし実際はそんなに綺麗には進まなかったということで、フェーズ3程度かと思いきやデータパイプラインの増加によって障害が多発する現状があり、まずはデータ品質における取り組みを行ったということです。
具体的には、データ品質の適時性を高めるための取り組みを行ったそうで、SLI/SLA/SLOを定義しながら取り組みを進めたそうです。(SLAなどを決める際には、ユーザー側からではなくデータ基盤側から考えるようにする)
講演3〜データ活用推進のためのデータ基盤チームの取り組み〜
続いて、折島さんから、SanSanのデータ基盤チームの具体的な取り組みに関して話がありました。
データ基盤構築に関してはベストプラクティスの充実などを背景に構築が容易になっているため、データから価値を生み出すための道具としてのデータ基盤を作ることに集中したほうがよいと考えているそうです。
そのような考え方を踏まえて、SanSanでは、立ち上げ→拡大→未来とフェーズ分けをしているそうで、現在は拡大の時期にいるということでした。
拡大の時期は、連携データの拡大/技術的負債の返済/メンバー増員/データ活用支援から支えていくスタイルにシフト/利用者を研究員やデータアナリストから全社的に展開、などの仕事をしているそうで、「データを使って5分で意思決定できる世界」というビジョンステートメントのもと、OKRを運用しているそうです。
OKRのKey Resultとしては、「データ活用支援の成功事例を5つ作る」「問い合わせに24時間以内に回答できた割合を80%以上とする」を設定しているということでした。
将来的には、スケーラブルなデータ基盤にシフトするとともに、データ基盤の肥大化が発生化しないようにしていくことなどを目論んでいるそうです。
講演4〜Analytics Engineeringチームの目標管理〜
最後にNagaiさんから、プロジェクトに対する目標設定の話がありました。
Nagaiさんの所属していたプロジェクトでは、「SQLが書けなくてもデータ分析ができるようにする」ことを目標とし、最初はLookerの利用者数をKPIと設定していたそうです。
KPIを設定したことで、一時的にLookerが利用されても継続が難しいことなどがはっきりと分かる一方で、「実際に役に立っているか?」の定性的な分析もしているそうで、定量/定性両面から、モニタリングと方向修正を繰り返しているということでした。
また、こういった目標設定を行っているのは、「成果は会社の外にある」という難しい問題に向き合うことを意図しているということで、成果にいたるストーリーを描いた上で途中地点をKPIとして設定することを心がけているという話もありました。
最後に目標設定のアンチパターンに関して話がありました。Nagaiさんは、アンチパターンの一つとして客観的に測れる成果に注目した結果コスト削減に行き着くことをアンチパターンだと考えているということでした。
パネルディスカッション
講演の後はパネルディスカッションがありました。以下、内容を箇条書きかつ常体で記載していきます。
生成AI時代にデータマネジメントチームができることはあるか?データマネジメントチームの仕事はどのように変わるか?
- 生成AIに読み込ませるためのデータ整備が広がっていくのではないか?と思っている
- 短期的にはクエリ書くのをサポートしてもらったりとかはできると思う
- SQLを書かなくても分析できるようになっていくとは思う
- 倫理規定の重要性がより高まると思っている
- 社外向けのデータ活用やデータ読み込みにすでに利用している
複数事業を展開している企業におけるデータマネジメントに必要なポイントと難しい点を教えてほしい
- データモデルが複数になりがちなのは難しい
- 複数プロダクトがあるため、立ち上げの段階で一定の品質担保が必要になってくる
- データ標準を定義した結果、色々な人に使ってもらうためには使えるデータ基盤だと認知して貰う必要があることが難しい
会全体を通した感想
DMBOKの存在は知らなかったので、どういったものかを知れるとともに具体的な活用事例も聞くことができたのは非常によかったです。
複数事業を立ち上げた中でデータモデルをどのように定義していくのか?というのはスピード感と標準化の両立がたしかにかなり難しいなあと思いながら聴いていました。