天の月

ソフトウェア開発をしていく上での悩み, 考えたこと, 学びを書いてきます(たまに関係ない雑記も)

開発エンジニアから DevOps エンジニアへ ! ~ SLO ってなんだ ?に参加してきた

aws-dev-live-show.connpass.com

以下のイベントに参加してきたので、会の様子と感想を書いていこうと思います。

会の様子

開発エンジニアからDevOpsエンジニアへ興味が移った理由

直近はフルスタックエンジニアなど幅広い範囲を担当しているエンジニアの需要が高まっていることと、ビジネス書でもアジャイル開発が取り上げられるようになっていることから、DevOpsへの興味が支援しているクライアントでも湧いているというお話がありました。

また、クラウドサービスの登場でインフラの民主化が起きたことで、技術的にも組織的にもDevOpsが実践できる土台が構築されたのも大きいということでした。

SLI/SLO

はじめに、SLOサービスレベル目標の書籍を参照して、SLI/SLO/エラーバジェットの紹介がありました。具体的には、

  • SLI…メトリクスで特定される計測値
  • SLO…目指すべきSLIに対する目標値
  • エラーバジェット…SLIがSLOに対してどういう影響を及ぼしたのかを計測する手段

という定義の紹介や、SLI/SLOは定期的にアセスメントしていく必要があるというお話がありました。

サービスを提供している以上、ユーザーが正常に使える状態を定義しておく必要があり、その目標の一つとしてSLI/SLOが重要であるという話がありました。

概念自体は昔からある一方で、サービスがSNSで簡単に評価されるようになった直近では、満足できなかったシステムの悪評はあっという間に流布されてしまうため、直近注目を集めている概念だと考えているということです。

何からはじめるとよいのか?

システムと体制の両面からアプローチが必要だということでした。

アプローチの内容としては、サービスが動いているかの外形監視からスタートした後、リアルユーザーモニタリングをしていくのが重要だというお話がありました。メトリクスとしては、すでにとっている数値(status)の中で特にユーザーに近いところから使っていけると良いのではないかということです。(ただし、ストアの評価点数やユーザーの満足度などといった定性評価が絡むようなメトリクスは運用が難しい点に注意)

全体を通した感想

メトリクスの例として定性評価が絡むようなものをSLI/SLOの運用に組み込んだ話は、初めて聞いたので面白かったです。

DevOpsエンジニアの話の部分は今ひとつ普通のエンジニアや会で言葉として出ていたフルスタックエンジニアとの定義の違いが分からなかったので、もう少し話を聞けると個人的には嬉しかったです。