電子機器において世界シェアトップの一部上場メーカーで、2000人ほどの従業員様を抱える企業様の在宅勤務(テレワーク)分析をご支援させて頂きました。日本のメーカー企業様の中でもトップクラスのデータの利活用を進められています。
今回、全国的に新型コロナウィルスによるテレワーク・在宅勤務になったことを受け、迅速に組織や従業員の状況を把握しようとされたIT部のみなさまにインタビューしましたので、ご覧ください。
今回はアンケート結果を当社が受け取ってから、分析企画、分析、ダッシュボード構築、レポートまでが1週間という超短納期でした。そのため、アンケート結果を機械学習とそのビジュアライズによって分析することで、短時間でアンケート結果の勘所をつかみ、ダッシュボードを作成することを実施しました。結果として、アンケートの実施から改善施策検討までのリードタイムを大幅に削減することができ、高い評価を得ることが出来ました。
1.テレワークに関するアンケートを、機械学習を利用して素早くビジュアライズする
今回のコロナウィルス問題で従業員のみなさまの働き方が大きく変化しました。従業員の状況をサーベイという形で即座に知ることで、できる限り早くに従業員のストレスや状況を把握し人事施策に結びつけるためです。
当社は、在宅勤務(テレワーク)アンケート分析にいち早く取り組む同社IT部さまのデータ分析をご支援させていただきました。
- 機械学習とSHAPを用いたデータビジュアライズ
- テレワークを続けたい人はどのような人か?の探索
- テレワークの効率が良かった人はどのような人か?の探索
機械学習とSHAPを用いたデータビジュアライズ
今回はSHAPという機械学習の結果を説明するアルゴリズムを用いてアンケートの分析を行います。SHAPのsummary_plot関数は、どの説明変数が目的変数に対してどのように寄与したのかをビジュアライズしてくれます。
まずはこのビジュアライズ結果の読み方から説明します。以下の画像はSHAPの公式がサンプルとして公開しているボストンの住宅価格予測問題のsummary_plotの結果です。
SHAPのsummary_plotの読み方としては次の通りです。
- 縦軸:上から順に、目的変数に対する寄与の大きさ
- 横軸:左側は目的変数に対して負の寄与、右側は正の寄与
- 色:青は小さな値、赤は大きな値
これらを組み合わせることで、次のような読み方が出来るようになります。
- 色がくっきり分かれていて、左右に大きく散らばってるのであれば強い相関がある説明変数である
- 青が左側、赤が右側なら正の相関
- 赤が左側、青が右側なら負の相関
これをもとに、上記のグラフを読み解くと次のようなことが読み取れます。
- LSTAT(地域の低所得者の割合)が大きいと、住宅価格は下がる
- RM(住居の平均部屋数)が大きいと。住宅価格は上がる
- CRIM(地域の犯罪発生率)が大きいと、住宅価格は下がる
- NOX(NOx 酸化窒素濃度)が大きいと、住宅価格は下がる
- DIS(ボストン雇用センターまでの距離)が小さいと、住宅価格は下がる
- PTRATIO(教師一人当たりの学生数)が大きいと、住宅価格は下がる
このように、SHAPのsummary_plotを用いると、機械学習の結果を視覚的に解釈することができます。
今回のアンケート分析では、「新型コロナウィルスの問題が収束した後もテレワークを継続したいか(5段階評価)」「テレワーク効率は従来のオフィス勤務より良かったか(5段階評価)」という質問を目的変数にとり、各種質問項目の他、社員の年齢性別や職位、未成年の家族有無、通勤時間等のパラメータを説明変数として、LightGBMを用いて学習を行い、学習結果のモデルをSHAPを用いて可視化することで、結果を解釈していきます。
どのような人が、今後もテレワークを続けたいのか
「新型コロナウィルスの問題が収束した後もテレワークを継続したいか(5段階評価)」という項目を目的変数とし、その他を説明変数として、LightGBMで回帰モデルを作成し、SHAPのsummary_plotで可視化したものが以下になります(詳細な質問項目についてはモザイクをかけて伏せています)。
- 「テレワーク効率は従来のオフィス勤務より良かったか(5段階評価)」という項目に、ポジティブな人は、テレワークの継続に対してポジティブ
- 「通勤による疲労やまわりの雑音から解放されたことにより集中力が増し、仕事の質が向上した」という質問項目にチェックを付けた人は、テレワークの継続に対してポジティブ
- 年齢が若い人ほど、テレワークの継続に対してポジティブ
- 通勤時間が長い人ほど、テレワークの継続に対してポジティブ
- 未成年の家族を持つ人ほど、テレワークの継続に対してポジティブ
以上の結果から、テレワークの継続に対する考えには、テレワークの効率が強く影響していることが分かりました。また、通勤に関する回答も強く寄与しており、通勤に関してストレスを感じている社員も多いようです。
年齢が若い人ほどテレワークを継続したいというのは、テレワークを利用するためのPC環境に対する慣れの問題が影響していると考えられます。
加えて、未成年の家族を持つ人ほど、テレワークの継続に対してポジティブというのはさもありなんといったところです。
テレワークの業務効率は何によって影響されるのか
ではこの次には、テレワークの業務効率を目的変数とし、テレワークの継続に対する質問項目を削除し、残りを説明変数とすることで、何がテレワークの効率に寄与したのかを探っていきます(詳細な質問項目についてはモザイクをかけて伏せています)。
- 「通勤による疲労やまわりの雑音から解放されたことにより集中力が増し、仕事の質が向上した」という質問項目にチェックを付けた人は、テレワークの効率に対してポジティブ
- 「家の執務環境が整っていないために、腰痛等に悩まされることになった」と回答した人は、テレワークの効率にネガティブ
- 年齢が若い人ほど、テレワークの効率に対してポジティブ
- 未成年の家族を持つ人ほど、テレワークの効率に対してネガティブ
- 通勤時間の長さは、テレワークの効率に対して影響しない(大きく散らばっているものの、赤と青が入り混じっている)
以上から、通勤をストレスだと感じている社員が多くいることや、通勤によって無為に消費されている時間が減り相対的に業務効率が改善したと答えていることが考えられます。
その一方で社員の通勤時間そのものはテレワークの効率に寄与していないため、通勤時間が長い人に向けて何らかの施策を考えることは早計であることが分かります。
年齢が若い人ほどテレワークの効率が良かったというのは、前述のとおりテレワークを利用するためのPC環境に対する慣れの問題が影響していると考えられます。
このほかにも、未成年の家族の有無は、テレワークの継続にはポジティブですが、テレワークの効率にはネガティブに働いています。
これは子供の面倒は見たいが、子供の世話でテレワークの効率が落ちてしまっていることを意味します。これは新型コロナの影響で学校が閉鎖されているため仕方ないのかもしれません。
また、腰痛に関する質問は、数ある質問項目の一つに過ぎず、これが上位に食い込むことはアンケート設計時には想定していない事でした。
こういったものをサッと見つけ出せるのも、機械学習を用いたアンケート分析の面白いところです。
以上のアンケート分析から、次のような施策の実施が考えられます(実際には詳細なデータを用いて、もっと多くの施策提案をしています)。
- 時差出勤により通勤ラッシュを回避し、通勤によるストレスを軽減する
- 会社の徒歩圏内に引っ越すことに対する家賃補助
- テレワークを行う人には、家庭での執務環境を整えるための家具の購入補助(交通費補助相当をテレワークの設備投資に充ててよいとする)
- ベビーシッターの法人契約の検討
このように機械学習のビジュアライズを用いてアンケートを分析することで、手動でのデータマイニングにかかっていた時間を大幅に削減し、短時間でデータ分析を行うことができました。
2. 機械学習のデータをBIでビジュアライズする
今回はBIソフトウェアの一つであるTableauを使ってビジュアライゼーションを行いました。データを見て理解し、探索のためのフィルター、パラメーターを設定し今後もIT部のみなさまがご自身で探索・分析できるような実装を行なっています。今回のアンケートは個人の特性や環境による影響が大きく、部署間や性別間、世代間の平均だけを比較をしてもあまり意味がないデータの分布をしているため、データの解釈にも注意が必要です。そのため、Tableauでの集計・可視化だけでなく、SHAPの可視化結果を一緒に見ることで、誤った解釈をしてしまうことを抑制することができました。これにより、さらに示唆が深まり、且つ組織内部での説明や展開もしやすくなりました。
3. クライアントインタビュー
同社のIT部部長様に、当社のご支援、取り組んで良かったことをお聞きしました。お客様の声をそのまま掲載いたします。
今回の分析結果や解釈はいかがでしたでしたでしょうか。
データの関係が見えたり、可視化できたのは非常に良かった。
相関分析を見える形、ビジュアル化できたのはやはりとても良かったです。IT部と人事部でのプロジェクトだったのですが、見える形にしたからこそ議論できたと思います。
このデータのビジュアル化を見てすぐに、テレワークにおける「動機付け/衛生要因」という、大昔の理論を思い出しました。
今まではアンケートをとっても、せいぜいExcelでグラフ化して、「はい/いいえ」の比率を示すぐらいでしたがこの相関関係が明確にイメージできることで、より具体的かつ詳細な施策立案につながります。
今回は結果を出すまでに時間がなかったということもあり、ある程度、分析になりうるであろうアンケートを弊社で作成したのちに、データだけ分析していただきました。しかし、今回のゴールイメージがあれば、次回は設問ももう少し工夫できたのではなかろうかと思います。
これから人事のデータ活用やアンケート分析に取り組もうとされる方にアドバイスはありますか?
機動的なデータ分析にはデータ整備は必須です。
人事関連のデータ活用、アンケート分析には常に「忖度」というインビジブルなものをどう排除するかという課題がつきまといます。
これを排除するためにはたとえばMicrosoft Formsなどのクイックなソリューションを使い、素早くアンケートを実施し短い回答期間で一気に集計をかけること、あらかじめ人事DBなどで、人に関するプロパティ情報を整理した状態で保持しておき、多軸で分析することが重要であると思います。
4.おわりに
今回は在宅勤務(テレワーク)のアンケート分析の事例をご紹介しました。
人事施策においてより具体的かつ詳細な施策立案、解像度の高いアクションを企画するのは、データを使うのが近道である場合が多いです。一方で、データにならない部分を考えながら解釈するのもさらに重要です。
日本でもトップクラスのデジタル化を推進されていらっしゃるメーカー様のご支援が出来、光栄でした。今後もご支援を続けてまいります。