「2024年版【GCP資格 PDE試験の勉強】: Apache Beamを用いたCloud Pub/SubデータのBigQueryエンリッチメント」

GCP PDE問題文
- 難解な表現での再記述
問題の解説
解決手順の説明
各用語の説明

2024年版、GCP資格 PDE試験の「Apache Beamを用いたCloud Pub/SubデータのBigQueryエンリッチメント」に関する練習問題を勉強していきましょう。平易な問題文 → 実践的な問題文 → 問題の解き方・解説 → 用語説明の順番で効率的に学べます。

なお、GCP資格のPDE練習問題を一気に勉強したい方は、下記リンクでまとめて学習できます。
「2024年版【GCP資格 PDE試験の練習問題】なんと5時間で学べる！」

GCP PDE問題文

「私たちのチームは、Cloud Pub/Subから送られてくるデータをBigQueryで分析するために、Apache Beamを使用したデータパイプラインを設計しています。このパイプラインは、受信データをBigQueryの静的参照データでエンリッチし、エンリッチされたデータをBigQueryに保存する必要があります。これを効率的に行うためには、どのジョブタイプとトランスフォームを使用すべきでしょうか？」

難解な表現での再記述

（GCPのPDE試験問題のような難解な表現での出題文。内容は上記問題文と同じ）
「Cloud Pub/Subからのデータストリームを受け取り、Apache Beamを用いてこれらのデータをBigQueryの静的参照データセットを使ってエンリッチするデータパイプラインの設計に取り組んでいます。このプロセスでは、エンリッチされたデータをBigQueryに書き込む必要があります。このタスクに最適なジョブタイプとトランスフォームの選択は何ですか？」