ワークロードは、システムが処理する仕事の種類と量、要求される性能をまとめた概念です。APIリクエスト、バッチ集計、機械学習の学習など、対象によって負荷のかかり方が変わります。
クラウドやデータ基盤では、CPU・メモリ・I/O・ネットワーク、クエリ数や同時実行数などでワークロードを捉えます。同じ処理量でも、ピークの偏りやデータスキューがあると待ち行列が伸び、遅延や失敗が増えやすいです。
運用では、想定ワークロードを前提にSLOと容量を決め、監視指標とアラート条件を結び付けておくと判断が速くなります。リリースやデータ増加でワークロードが変わるため、定期的に計測し、スケール設定やクエリ最適化を更新するのが現実的でしょう。

