2024年版【GCP資格の勉強 PDE編】BigQueryのサイジングとは?

2024年版【GCP資格の勉強 PDE編】

2024年版【GCP資格の勉強 PDE編】BigQueryのサイジングとは?について解説します。
(★注意:GCP資格 Professional Data Engineer(PDE)試験の公式テキスト・問題集などを元に独自にまとめたものです)

BigQueryのサイジングに関する考慮事項は、主に次のように分類されます。

オンデマンドとBigQuery Reservations

スロット数

  • オンデマンド: 最大2000スロットまで。
  • BigQuery Reservations: 定常的に2000スロットを超える場合に適しています。

同時実行クエリ数

  • オンデマンド: デフォルトでは100まで(申請により上限を超えることが可能)。
  • クエリあたりのスロット数が減る可能性があります。
  • デフォルトではinteractiveモードですが、batchモードに変更してクエリをキューイングできます。

ストレージ

  • Colossus(Googleの分散ファイルストレージ)を使用。
  • SSDとHDDの組み合わせ。
  • ファイルはチャンクに分割され、複数のサーバーに分散保存。
  • データの耐久性とディスクI/Oのスケーリングを確保。
  • ユーザー側でのサイジング管理は不要です。

その他のサイジング項目

目標値の列、クエリの実行時間、同時実行クエリ数、待機クエリ数、コストなどを考慮する必要があります。

サイジング監視

  • BigQueryカスタムコスト管理: プロジェクトまたはユーザー毎の1日あたりのクエリ上限コストを設定可能。
  • Cloud Monitoringの予算アラート: 予算オーバーを回避するためのアラート機能。

【練習問題】BigQueryのサイジング


質問 1: BigQueryのオンデマンドモデルにおける最大スロット数はいくつですか?

A) 500スロット
B) 1000スロット
C) 1500スロット
D) 2000スロット

正解: D) 2000スロット


質問 2: BigQuery Reservationsを使用する主な利点は何ですか?

A) クエリの実行時間を短縮できる。
B) 定常的に多くのスロットを使用する場合、コストを節約できる。
C) ストレージ容量を自動的にスケーリングできる。
D) 一日あたりのクエリ実行回数を制限できる。

正解: B) 定常的に多くのスロットを使用する場合、コストを節約できる。


質問 3: BigQueryでサイジング監視に使用されるツールはどれですか?

A) BigQuery Data Transfer Service
B) BigQueryカスタムコスト管理
C) Cloud SQL
D) Google Cloud Storage

正解: B) BigQueryカスタムコスト管理


これらの問題は、BigQueryのサイジングに関する基本的な理解を確認するためのもので、GCP資格 Professional Data Engineer(PDE)試験のスタイルに沿った形式で作成されています。

まとめ

BigQueryのサイジングのポイントは、BigQueryの性能最適化とコスト管理に大きく関わっています。特にBigQuery Reservationsの利用は、高頻度または高容量のクエリが発生する環境でのコスト効率とパフォーマンスのバランスを考慮する際に重要です。

また、最新の情報や特定の要件に合わせたサイジングの詳細については、Google Cloudの公式ドキュメントや最新のリリース情報を参照することが推奨されます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA