Metricsは、システムや業務の状態を数値で表し、変化を追えるようにした指標です。たとえば処理件数、エラー率、遅延時間、売上などを継続的に観測し、改善や意思決定につなげます。単なる数字の集計ではなく、目的に沿って定義された「測り方」だと捉えると理解しやすいでしょう。
実務では、Metricsの定義が曖昧だと部署や担当者によって数字の意味が変わり、比較や検証ができなくなります。分母と分子、集計タイミング、単位、対象範囲、欠損の扱いまで決めておくと、同じ指標を安定して追える状態です。どのデータソースから生成し、どの計算式で算出するかを固定して、変更は変更管理として扱う流れが基本になります。
運用では、平均値だけでなくp95やp99などの分位点も見て、たまに起きる詰まりを拾う設計が現実的です。目標値(SLO)とアラート条件を結び付け、異常が出たときに原因をたどれるログやトレースとセットで整えると復旧が早くなります。活動量だけを追う指標は形骸化しやすいので、成果や品質に結び付くMetricsを選ぶ姿勢が重要です。

