Google Cloud Professional Data Engineer試験(以下PDE)は、データエンジニアリング・分析に関わるGoogle Cloudのプロダクト知識を網羅的に問う試験です。公式ドキュメントでは当該業務経験3年以上の方の受験が推奨されています。
私は1年ほどデータビズラボでコンサルタントとしてデータ分析のプロジェクトに関わってきました。その中で、エンジニアとのコミュニケーションの解像度を上げ、プロジェクトをより高度・効率的に進めるために、本資格の取得を目指しました。結果として、エンジニア経験ほぼ0の状態から1.5ヶ月の独学で一発合格することができました。
PDEの学習を進める中で、私のような非エンジニアの方の合格体験記が見つからず、学習方法について非常に試行錯誤しました。よって、私と同じように、非エンジニアでPDE取得を目指している方に向けて学習方法を共有したい!という思いでこの記事を書くことに決めました。
結論から言うと、非エンジニアのPDE学習において一番大切なことは、わからない用語を他人に説明できるレベルに理解しながら学習を進めるということです。以下では、その詳細な方法も含めて私がPDE合格に向けて行った学習について解説しています。
本資格の勉強をしたことで、コンサルタントとしても以下のメリットを感じています。
- クラウド特有の用語に関する知識を身につけることができ、エンジニアとの会話の解像度が上がった
- Google Cloudの導入を検討しているクライアントに対し、Google Cloudのデータ基盤のベストプラクティスを回答できる
データ分析のプロジェクトは、データアナリスト、データサイエンティスト、データエンジニアなどスペシャリストが分業制で業務を行っている場合がほとんどです。しかし、担当者間のコミュニケーションの難しさがプロジェクトにおける課題になっていることが多々見受けられます。データエンジニアだけではなくデータアナリストやデータサイエンティストも本資格合格を目指すことで、担当プロジェクトをより高度に・効率的に進めることができます。
本記事では、データアナリストのようなエンジニア経験が少ない方でも1.5ヶ月でPDEに合格する方法をお伝えします。
目次
1. Google Cloud Professional Data Engineer(PDE)とは?
PDE試験の基本概要・特徴を以下で解説していきます。
1.1 データ分析を行うにあたりGoogle Cloudにて活用できるプロダクトの知見を問う試験
上の図はGoogle Cloud認定資格の一覧です。難易度別に、基礎、アソシエイト、プロフェッショナルとランク付けされています。PDEはプロフェッショナルに分類されており、公式ガイドには資格取得のための推奨経験として3年以上の業界経験とGoogle Cloudを使用した1年以上の経験と記載があります。
参考:Professional Data Engineer公式ガイド
しかし、受験自体に必須条件はないため、誰でも受験可能です。私自身もエンジニア経験がほとんど無い中で合格することが出来ました。学習次第では誰にも合格の可能性がある試験だと言うことができます。
1.2 出題項目
試験に出題される項目としては、公式ドキュメントに以下のように記載があります。
参考:https://cloud.google.com/certification/guides/data-engineer?hl=ja
1,データ処理システムの設計
2,データ処理システムの構築、運用
3, 機械学習モデルの運用
4, ソリューションの品質保証
1.3 公式には非公開だがおおよそ正答率7割程度がボーダーライン
試験問題は50問であり、合格には一般的に7割程度が必要なのではないか言われています。私自身、試験本番の出来としても、35〜40問程度は自信を持って正解を選ぶことができたかな?という感触で合格することが出来ました。
模擬試験などで7割は正解を選べることを学習の目標として進めるのが良いと思います。
1.3 受験料は200ドルで有効期限は2年間
受験料は$200です。やや高額ですが、私は当社の資格支援制度で受験できたのでよかったです。
また、資格の有効期限は合格した試験日から2年間と定められています。資格更新をするためには再認定試験を受験する必要があります。
クラウド技術は日々著しく発展しており、日々新たな技術やサービスが展開されています。一度資格を取得したからといってその知識でいつまでも十分なわけではなく、新たなプロダクトやサービスについての学習を続ける必要があります。そういった観点から、資格の有効期限が2年と言うのは理にかなっており、私も学習を続けようと考えています。
2. PDEを取得して感じたメリット
私がPDE取得後に感じたメリットについてお伝えします。
2.1 コミュニケーションコストが削減され・重要な議題を考えることにより多くの時間を割くことができる
要件に応じたプロダクト選定のための調査や社内MTGの時間が減り、より重要な議題へ時間を割けるなどプロジェクトを効率的に進めることができるようになりました。
最適なプロダクトの提案において、以前までは、クライアントからヒアリングした要件を一度社内へ持ち帰り、社内MTGや調査を経てクライアントへのアーキテクチャ・プロダクトの提案をする、という流れがほとんどでした。本資格の学習を通して、基本的なGoogle Cloudアーキテクチャを理解することができました。それにより、要件次第では即座にアーキテクチャのベストプラクティスを回答することができ、プロジェクトをよりスムーズに進められるようになりました。
Google Cloudを活用しているがどのデータベースを使うべきかわからないクライアントに対し、以下の表を活用して、適切な質問をし、その場で最適なプロダクトを提案することができるようになりました。
2.2 エンジニアとのコミュニケーションの解像度が上がった
こちらは副次的な効果なのですが、エンジニアとの会話がより具体的になり、プロジェクトを効率的に進められている実感があります。
学習を通し、わからない単語などを徹底的に調べながら学習を進めたため、一般的なクラウドの用語についてもかなり理解を深めることができました。例えば、サービスごとの責任共有モデルについても理解できたことで、運用におけるエンジニアへの想定依頼事項をスピーディに整理することができました。
3. 非エンジニアがPDE合格のために行った学習方法
エンジニア経験がない人でも1.5ヶ月で合格するためには、公式模擬試験→講座→模試というロードマップで進めていきます。下記ではそれぞれの過程で意識すべきポイントを解説していきます。
3.1 公式の模擬試験で形式に慣れる(3h)
Googleが公式で模擬試験を公開していますので、問題形式や難易度を知るために受験しましょう。Googleが公式で出していることもあり、実際の試験とほとんど一緒の形式・難易度でした。したがって、学習のスタートにはこちらを受験し、形式を知ることが最適です。
Data Engineer 模擬試験
受験にはGoogleアカウントが必要です。Google Cloudの個人利用の際にも利用でき、何かと便利なので持っていない人はこのタイミングで以下リンクからGoogleアカウントを作成することをお勧めします。
Google アカウントの作成
https://accounts.google.com/signup/v2/webcreateaccount?flowName=GlifWebSignIn&flowEntry=SignUp
Googleアカウントでのログイン後、氏名や所属会社などを登録すると模擬試験を受験することができます。
用語が理解できないこと、正解が少ないことは全く問題ではありません。目的は、試験の形式や難易度を知ることです。私自身、最初に本試験を受けた時は25問中7問という正答数でした。
模擬試験後の復習では、公式ドキュメントを元に不正解選択肢の内容まで理解できるところまで調べましょう。私はわからなかった箇所をノートにまとめて移動時間などに復習していました。
3.2 Google公式の講座で網羅的知識を得る(20h)
公式の模擬試験で問題形式に慣れた後は、Courseraで提供されているGoogle公式講座を受講しましょう。下記リンクから、「無料で登録 xx月oo日から開講」のボタンを押すことで登録画面に移ります。全6コースありますが、全て受けることをお勧めします。
Google Cloud 認定資格の取得準備:クラウドデータエンジニア プロフェッショナル認定証
https://jp.coursera.org/professional-certificates/gcp-data-engineering
本講座はストレージやデータベースなどのユースケースがプロダクトごとに体型的に説明されており、Google Cloudのデータ分析関連プロダクトを網羅的に理解できます。また、本資格はGoogleが主催しているため、”Googleが考える”ベストプラクティスを身につけることができます。このような理由で、他の講座よりもGoogleが公式で提供しているCourseraの講座が最適です。
音声は英語ですが、日本語の字幕も自然で理解に困るようなことはありません。
注意点としては、Courseraの登録にクレジットカードの登録が必要となり、無料期間以降(私の時は7日間)は料金が発生するので、課金を避けたい方は無料期間内に受講し終えましょう。私は、正月休みの3日ほどで受講し終えました。
ここでも、要点をノートに整理しました。後で述べるUdemyなどでの模試の復習でも、本講座でとったノートを見直しなら学習することで、理解をより強固にすることができました。
以下のような整理図などは現在の業務でも活用しています。
講座数は多いですが、”Lab introduction”という名の実装体験は試験にはあまり寄与しないので、資格取得を第一に考えている人は飛ばして構わないでしょう。ただし、Google Cloudを実際に活用する上では知識だけでなく実装経験も重要なので、時間に余裕のある人は””Lab introduction””まで受講し、理解をより深いものにしましょう。
3.3 Udemyなどを活用し、模試を解きまくる(40h〜)
Couseraの講座にて網羅的な知識を身につけることができた後は、「模擬試験を解いて公式ドキュメントで復習する」のサイクルをひたすら繰り返しましょう。
実際に私は下記の模擬試験集を4周しました。私は会社の福利厚生により、無料で受講しました。購入される方はUdemyが頻繁に行っているセールの時期を狙って購入することをお勧めします。(セール期間中であれば¥2,400→¥1,600程度で購入できるようです。)
【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集
https://www.udemy.com/course/google-cloud-professional-data-engineer-s/
正誤に関わらず、問題文・選択肢中にわからない用語がなくなるまでで公式ドキュメントを読みました。基準としては、用語の意味を他人に説明できるレベルと考えましょう。また、要点は以下のようにノートに整理し、移動時間などに復習しました。模試一回分を解いて復習するのに最初は4時間程かかりました。2周目以降は2時間ほどで復習までできるようになりました。振り返ると、40時間程度”模試を解いて復習する”というサイクルに費やしていました。大変でしたが、これによりクラウド用語などの理解も深まり、この過程で得たものが実際の業務では一番活きているのではないかと思っています。
上記が私自身の経験をもとにした合格までのロードマップですが、最重要ポイントをまとめると以下の3つです。
- 公式ドキュメントを読む際は、調べたい箇所に加え、派生する内容まで目を通す。
- IT用語などわからない用語は都度調べて、学習した内容は大雑把でなく100%理解できるようにする。
- あくまで資格取得を目的にしているので、できるだけ短期間(長くとも2ヶ月以内)で上記を行う。
4. まとめ
Google Professional Data EngineerはGoogle認定資格の中でプロフェッショナルの難易度に設定されていますが、学習次第ではエンジニア経験の少ないデータアナリストのような方でも合格可能です。また、資格取得することでデータエンジニアやITインフラ担当者とより解像度の高いコミュニケーションを行うことができ、データ分析プロジェクトが非常に捗るはずです。
ぜひ、皆さんも合格に向けて勉強を始めてみませんか。
コメント