Google Cloud Professional Data Engineer認定資格取得のための対策を紹介!

データ活用・DXに欠かせないデータ基盤。ブレインパッドには、クラウドプラットフォームの知識・スキルを深化させるべく、Google Cloud 、AWS、Microsoft Azure、Snowflakeの4つのクラウドプラットフォームチームから成る「クロスファンクショナルチーム(CFT)」があります。今回は当社のデータエンジニアが、Google Cloud Professional Data Engineer 認定資格を取得した経験談を紹介します。


こんにちは。データエンジニアリング本部 アナリティクスエンジニアリング部(以下AE部)の塩谷です。

2022年5月に Google Cloud 認定資格のProfessional Data Engineer(以下PDE)を受験し認定資格を取得したので、試験の概要と対策をご紹介します!


みなさん、クラウドの認定資格を受験されたことはあるでしょうか?
すでに複数の資格を持ってるっていう強者もいると思いますが、クラウドに興味があり受けてみたいと思いつつも、なかなか重い腰が上がらないという人も多いのではと思います。

僕もブレインパッド に入社するまで、業務でも Google Cloud を使っていて認定資格があるのも知っていましたが、受験費用が高いし、勉強して落ちたらショックだし、業務が忙しいのに受かるかわからない受験のストレスはつらいなーと思って、なかなか挑戦できませんでした。


ですが、今回受験してみて、しっかり準備すれば問題なく合格するものだと感じました!

この記事を読んで、少しでもストレスなく認定試験の受験に挑戦したり、「これだったら合格できそうだから受けてみるか」って思っていただけると嬉しいです。

PDEって何?

試験対策をご紹介する前に、今回僕が取得したPDE(Professional Data Engineer)資格を知らない方向けに説明します。

ざっくり言うとデータ処理システムの設計、構築、モニタリングなどに有効な Google Cloud のサービスについての知識が問われる資格です。
(かなりざっくり言っているので詳しくは公式ページを見てください。)
データ処理システムというとストレージ、データベース、データウェアハウス、ETLツールなどが連想されますね。
PDEを取得するとこれらのデータ処理に関わる Google Cloud のサービスに詳しくなります。

具体的な Google Cloud のサービスで言うと
●データウェアハウス - BigQuery
●データベース - Cloud SQL, Cloud Spanner, Bigtableなど
●データ処理 - Dataflow
●ワークフロー - Cloud Composer
●メッセージング - Cloud Pub/Sub
などです。
上記が全てではありませんが、このような Google Cloud のサービスに加えて機械学習のサービスを使った問題が出題されます。

問題は4択の単一選択または複数選択で出題されます。主観ですが、勉強しない状態で問題見ると難しく感じる内容でした。問題が気になる方はこちらから模擬試験を受けることができるので、一度見てみると良いかと思います。

PDEを取得すると何がいいの?

そんなPDEですが、取得するメリットは何でしょうか?

まず、クラウド認定資格を取得するメリットは何かと言うと、1つはそのクラウドの該当分野について詳しくなることです。業務でクラウドサービスを使う場合、選択肢やサービスの特徴を理解していれば正しい選定、実装ができます。

メリットのもう1つはクラウドの需要が年々高まっているのは明らかなので、スキルを証明できる認定資格はキャリアアップに繋がります。

ただ、時間をかけて学習するならその中でも需要が高いもしくは伸びている分野に挑戦したいですよね?

PDEの対象になっているデータエンジニアリングの需要は急速に伸びています。

こちらの記事(datanami 2020年2月12日記事)によると、データエンジニアという職種はテクノロジー関連の職業で最も需要の成長率が大きいと発表しています。

Interest in the position has been burbling for years, as organizations discover data engineers are they key personnel for unlocking the value of their data.

(データエンジニアは、データの価値を引き出すための重要な人材であることを企業が認識し、このポジションへの関心がここ数年高まっています。[ datanami 2020年2月12日記事より引用 ])


データエンジニアリングの需要成長は、海外だけではありません。
国内でも同じように需要は伸びています。

データ活用のPoCだけではなくデータ処理システムの実装や、分析PoC後の業務利用体験を増やすという需要は、ブレインパッドでも年々増えています。僕が所属しているAE部は、この需要に対応するため約2年前に設立された部です。(AE部の設立の経緯や活動については、こちらの記事をぜひご一読ください。)

PDEの資格を取得すると、今需要が伸びているデータエンジニアリングの分野を、業務に使える具体的なサービスを通じて学べます。業務でデータ活用に関わる、もしくは興味があるなら是非取得しておくべきですね!

試験対策

さて、本ブログの本題、試験対策についてです。

僕が行った勉強方法を詳しくご紹介します。

1 パートナー認定資格のキックスタート

まず最初に、 Google Cloud がパートナー向けに実施している学習プログラムを受講しました。
具体的な内容は
Google Cloud のサービスについての解説の動画視聴
Qwicklabs でのハンズオン
でした。
以下のページの『プログラムの概要』に書かれている内容で、6週間で完了するプログラムになっています。
partneronair.withgoogle.com


実際にやってみた感想は、動画視聴については問題に出題されるサービスの概要を知ることができたくらいでした。実際に触ってみないと、やはり詳細はわからないなという印象です。

Qwicklabs は Google Cloud を実際に触りながらの学習なので、体験としてはよかったです。ただ、コードやSQLは全てコピペなので各サービスについて深く学べたという印象はなかったです。
これらのサービスを深く学ぶためには、自分でコードを書き構築していくことが一番身につくなと思いました。

一通り全て完了しましたが、このプログラムを受講しただけでは、おそらく合格していなかっただろうと思います。

2 模擬試験

試験合格の対策という意味では、間違いなくこちらが最も重要でした。

僕の場合はudemyで模擬試験集が販売されているので、こちらのコースを購入しました。
【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集

この問題集は試験と同じ50問の問題が3セット収録されていて、各問題には解説がついています。

これらの問題を1回だけ行っても覚えられないなと思ったので、この3セットの模擬試験を3回ずつ行いました。その記録の一部がこちらです。

1回目の正答率は、だいたい5割くらいです。1回の結果だと正答率6割に届いていないので、試験には落ちていますね。1回目は、間違えた箇所を重点的に解説を読みました。
2回目は、7割〜8割ほどになりました。同じ問題なんだから解けて当然ということもありますが、実際はなかなか覚えられないものもあります。2回行うことで苦手な問題が、明確になりました。
3回目は、9割以上の正答率です。もはやアンケートに答えるくらいの勢いで解けました。(笑)

ここまで完了した後に受験を申し込んだところ、予約できた受験日まで1週間ほど空いてしまったためもう1つudemyのコースを受講してみました。
GCP Professional Data Engineer Practice Test

こちらはさらに問題数が多いもので、1つ目の模擬試験よりさらに広範囲の問題をカバーできました。もう模擬試験は慣れたものなので、スラスラ解くことができ各試験を2回ずつ行いました。

学習時間

50問の模擬試験を計8セットを複数回行ったので、かなりの時間がかかったんじゃないかと思われるかもしれませんが、それほど負担ではありません。
慣れてくると、50問が20〜30分ほどで回答できることと、udemyはスマホアプリもあるので学習自体は通勤時間でほぼ完結します。
さらにやっていくうちに正答率が上がることが楽しくなってくるので、苦なく学習することができました。

試験当日

準備はしたものの認定試験が初めてなので多少緊張して臨みましたが、いざ受けてみると模擬試験で試験の形式にはかなり慣れていたので順調に進めました。
いつも通り回答していくと試験時間は2時間ですが30分程で終わり、その場で暫定合格の結果が出ました。準備をしていたため、安心して受験することができました。

結論

合格のためには模擬試験が一番有効でした。
もちろん Google Cloud が提供している動画の視聴やQwicklabsのハンズオンはビジュアルで学習できるので有効ですが、合格のためであれば模擬試験が重要だと思います。

自社の先輩方に聞いたり他の記事を見てみると、模擬試験以外の問題も出題されたという声も聞くので、今回たまたま僕の受けた試験が模擬試験に近かったということもありえます。
ただ、問題の形式に慣れるためということと、ある程度の問題は模擬試験と同じ内容が出る傾向にあるので、模擬試験をやり込むのは有効と言えそうです。

今後の展望

認定試験に合格するという意味では模擬試験は有効でしたが、あくまで試験対策だと思います。
業務に使えるよう深くスキルを習得するためには、実際に Google Cloud 上でデモ環境を作ってみるのが一番いいと感じました。
今回の受験でいくつかのサービスに興味が出てきたので、例えば提供されているデモデータを使って
Cloud Pub/Sub => Dataflow => BigQuery
での分析基盤を作るなど、試験で出ていた内容を再現してみるのは楽しそうだなと思っています。

まとめ

最後まで読んでいただき、ありがとうございました。
「今後の展望」で記載した通り、この認定試験が次のステップアップの入り口にもなるので、少しでも受験に興味を持っていただけると嬉しいです。


ブレインパッドには、入社後のスキルアップを支援する仕組みも充実しています。
ブレインパッドでは新卒採用・中途採用共にまだまだ仲間を募集しています。
ご興味のある方は、是非採用サイトをご覧ください!

www.brainpad.co.jp