「2024年版【GCP資格 PDE試験の勉強】: オンプレミスからCloud Dataprocへの効率的な移行戦略」

2024年版【GCP資格の勉強 PDE編】

2024年版、GCP資格 PDE試験の「オンプレミスからCloud Dataprocへの効率的な移行戦略」に関する練習問題を勉強していきましょう。平易な問題文 → 実践的な問題文 → 問題の解き方・解説 → 用語説明の順番で効率的に学べます。

なお、GCP資格のPDE練習問題を一気に勉強したい方は、下記リンクでまとめて学習できます。
2024年版【GCP資格 PDE試験の練習問題】なんと5時間で学べる!

GCP PDE問題文

「オンプレミスのApache HadoopをGoogle Cloudに移行したいと考えています。長時間のバッチジョブを効率的に処理し、コストを抑えつつフォールト・トレラントな環境を構築したいです。どのようなアプローチを取るべきでしょうか?」

難解な表現での再記述

(GCPのPDE試験問題のような難解な表現での出題文。内容は上記問題文と同じ)
「現在運用中のオンプレミスのApache HadoopシステムをGoogle Cloudへ移行する計画を立てています。この移行は、長時間のバッチ処理を可能な限りフォールト・トレラントでコスト効率よく行うことが求められています。マネージドサービスの使用を希望しているこのケースで、どのようなクラウドデプロイメント戦略を選択するべきですか?」

問題の解説

  • オンプレミスからGoogle Cloudへの移行には、Apache Spark/Hadoopクラスタを実行するためのCloud Dataprocの利用が推奨されています。
  • 長時間のバッチジョブとコスト効率を考慮して、HDDパーシステントディスクを使用し、一部のワーカーをプリエンプト可能にすることでコストを抑制できます。

解決手順の説明

  • Cloud Dataprocクラスタをデプロイし、HDDパーシステントディスクと50%のプリエンプト可能なワーカーを使用します。
  • データをCloud Storageに保存し、スクリプトの参照先をhdfs://からgs://に変更して、クラウド環境に最適化します。
  • これにより、コスト効率の高いフォールト・トレラントなクラウド環境を実現できます。

各用語の説明

  • Cloud Dataproc: Google Cloud上で動作するマネージドHadoopおよびSparkクラスタを提供するサービス。
  • HDDパーシステントディスク: ハードディスクドライブベースのデータストレージ。
  • プリエンプト可能なワーカー: コスト効率のために中断される可能性があるインスタンス。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA