2024年版【GCP資格の勉強 PDE編】DWHの機能要件と非機能要件とは?

2024年版【GCP資格の勉強 PDE編】

2024年版【GCP資格の勉強 PDE編】DWHの機能要件と非機能要件とは?について解説します。
(★注意:GCP資格 Professional Data Engineer(PDE)試験の公式テキスト・問題集などを元に独自にまとめたものです)

GCPのProfessional Data Engineer(PDE)試験では、データウェアハウス(DWH)の機能要件と非機能要件の理解が重要です。ここでは、特にBigQueryを例に挙げて、それぞれの要件について説明します。

そもそも機能要件と非機能要件とは?

機能要件と非機能要件は、ソフトウェアやシステムを開発する際に定義される、二つの重要な種類の要件です。機能要件と非機能要件を分かりやすく説明すると、以下のようになります。

機能要件(Functional Requirements)

  • 定義: 機能要件は、ソフトウェアやシステムが「何をするか」に関する要件です。つまり、ソフトウェアが実行する具体的な動作やタスク、機能に関することを指します。
  • : 例えば、オンラインショッピングアプリの場合、商品を検索する機能、カートに商品を追加する機能、オンラインでの支払い処理を行う機能などが機能要件に該当します。
  • 目的: これらはソフトウェアがユーザーの要求やビジネスの必要性を満たすために必要な機能を定義するために使用されます。

非機能要件(Non-Functional Requirements)

  • 定義: 非機能要件は、ソフトウェアやシステムが「どのように動作するか」に関する要件です。これはソフトウェアの性能、信頼性、使いやすさなどの品質に関連する特性を指します。
  • : 同じオンラインショッピングアプリで考えると、ページの読み込み速度、サーバーの稼働時間(可用性)、データのセキュリティ、ユーザーインターフェースの使いやすさなどが非機能要件に該当します。
  • 目的: 非機能要件は、ソフトウェアが効率的、信頼性が高く、ユーザーにとって使いやすいようにするために重要です。

機能要件は「ソフトウェアが何をするのか」を、非機能要件は「ソフトウェアがどのようにそれをするのか」を示します。機能要件はソフトウェアの「機能」に焦点を当て、非機能要件はソフトウェアの「品質」に焦点を当てています。両方の要件は、成功するソフトウェアやシステムを開発するために重要です。

BigQueryにおけるデータウェアハウス(DWH)の機能要件

  • SQLによる集計、加工: BigQueryはSQLに準拠しており、複雑なデータの集計や加工を行うことができます。
  • BIツールとの接続: BigQueryは多くのBIツールとの接続が可能で、データの可視化や分析に利用できます。
  • データの取込、取り出し: BigQueryはデータの取込み(ロード)やエクスポートが容易で、さまざまなデータソースからのデータ統合をサポートします。
  • データの保存、ディスクの拡張性: BigQueryは大規模なデータセットの保存に対応し、必要に応じてディスク容量を拡張できます。

BigQueryにおけるデータウェアハウス(DWH)の非機能要件

  • 性能: BigQueryは高速なクエリ実行、並列クエリのスケーラビリティ、I/Oのスケーラビリティを提供します。
  • 可用性: BigQueryは99.99%の高可用性を提供し、自動的にマルチリージョンでのレプリケーションを行います。インメモリシャッフルにより、ゾーンレベルの障害が発生してもサービスの影響がほとんどなく、クエリの実行が可能です。
  • セキュリティ: BigQueryは高度なセキュリティ機能を提供し、データの保護とアクセス制御を実現します。
  • メンテナンス、バージョンアップ: BigQueryでは、使用されていないワーカーにローリングアップデートを行うため、アップデートによるダウンタイムがほとんどありません。スケーリング操作にもダウンタイムが発生しません。
  • Disaster Recovery: BigQueryはCloud Storageと連携し、他リージョンでのデータ保護が可能です。データセットのコピーにはBigQuery DTS、Cloud Storage間のデータのコピーにはCloud Storage Transfer Serviceを利用します。
  • スロットスケジューリング: BigQueryのスロットスケジューリングは、CPU、物理I/O、論理I/Oのリソースを動的に割り当てます。スロットスケジューリングにより、複数のクエリが並列で処理される場合でも、効率的にリソースが配分され、長期待機時間が発生しません。

【練習問題】BigQueryにおけるデータウェアハウス(DWH)の機能要件と非機能要件


質問 1: BigQueryの機能要件に関して正しい記述はどれですか?

A) BigQueryはSQLをサポートしていないため、データの集計や加工はできない。
B) BigQueryはBIツールとの接続が不可能である。
C) BigQueryはデータの取込みやエクスポートが容易であり、さまざまなデータソースからのデータ統合をサポートする。
D) BigQueryではデータの保存に限界があり、大規模なデータセットは扱えない。

正解: C) BigQueryはデータの取込みやエクスポートが容易であり、さまざまなデータソースからのデータ統合をサポートする。


質問 2: BigQueryの非機能要件について正しい説明を選んでください。

A) BigQueryは高速なクエリ実行とスケーラビリティを提供する。
B) BigQueryの可用性は低く、頻繁にサービスがダウンする。
C) BigQueryにはセキュリティ機能がなく、データ保護が不十分である。
D) BigQueryはメンテナンス中に長時間のダウンタイムが発生する。

正解: A) BigQueryは高速なクエリ実行とスケーラビリティを提供する。


質問 3: BigQueryでのディザスタリカバリー(災害復旧)に関する記述として最も適切なものはどれですか?

A) BigQueryは他リージョンでのデータ保護が不可能である。
B) BigQueryはCloud Storageと連携し、他リージョンでのデータ保護が可能である。
C) BigQueryでは、データセットのバックアップは手動で行う必要がある。
D) BigQueryは災害復旧の機能を提供していない。

正解: B) BigQueryはCloud Storageと連携し、他リージョンでのデータ保護が可能である。


これらの問題は、BigQueryにおけるDWH(データウェアハウス)の機能要件と非機能要件に関する基本的な理解を確認するためのもので、GCP資格 Professional Data Engineer(PDE)試験のスタイルに沿った形式で作成されています。

まとめ

BigQueryは、高度な機能要件を満たしつつ、高い性能、可用性、セキュリティを提供するデータウェアハウスサービスです。BigQueryの特徴は、データ駆動型の意思決定を強力にサポートします。BigQueryにおけるデータウェアハウス(DWH)の機能要件と非機能要件は、ビッグデータを取り扱う際の重要な考慮点であり、PDE試験においてもその理解が求められます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA