2024年版、GCP資格 PDE試験の「BigQueryの非正規化データ構造のメリット」に関する練習問題を勉強していきましょう。平易な問題文 → 実践的な問題文 → 問題の解き方・解説 → 用語説明の順番で効率的に学べます。
なお、GCP資格のPDE練習問題を一気に勉強したい方は、下記リンクでまとめて学習できます。
「2024年版【GCP資格 PDE試験の練習問題】なんと5時間で学べる!」
GCP PDE問題文
「BigQueryで非正規化されたデータ構造を使用すると、クエリの速度が向上する理由は?」
難解な表現での再記述
(GCPのPDE試験問題のような難解な表現での出題文。内容は上記問題文と同じ)
「BigQueryで非正規化されたデータ構造を使用すると、クエリの処理速度が向上する。これは、非正規化によってクエリの処理範囲が小さくなるためである。正規化されたデータ構造では、関連するデータが複数のテーブルに分散されているため、クエリの処理範囲が広くなり、処理速度が低下する可能性がある。」
問題の解説
BigQueryでは、正規化されたデータ構造と非正規化されたデータ構造のどちらを使用しても、データは同じストレージに保存されます。ただし、クエリの処理速度は、データ構造によって大きく異なる場合があります。
正規化されたデータ構造では、関連するデータが複数のテーブルに分散されています。これにより、データの可読性が向上しますが、クエリの処理範囲が広くなり、処理速度が低下する可能性があります。
非正規化されたデータ構造では、関連するデータが1つのテーブルにまとめられています。これにより、クエリの処理範囲が小さくなり、処理速度が向上する可能性があります。
具体的には、以下の理由が挙げられます。
* クエリの実行に必要な行数が少なくなる
正規化されたデータ構造では、関連するデータを複数のテーブルに分散するため、クエリの実行に必要な行数が多くなります。一方、非正規化されたデータ構造では、関連するデータを1つのテーブルにまとめるため、クエリの実行に必要な行数が少なくなります。
* JOIN処理が不要になる
正規化されたデータ構造では、関連するデータを複数のテーブルに分散するため、JOIN処理が必要になる場合があります。一方、非正規化されたデータ構造では、関連するデータを1つのテーブルにまとめるため、JOIN処理が不要になる場合があります。
* インデックスの効率が高まる
インデックスは、クエリの処理速度を向上させるために使用されます。正規化されたデータ構造では、関連するデータを複数のテーブルに分散するため、インデックスの効率が低下する場合があります。一方、非正規化されたデータ構造では、関連するデータを1つのテーブルにまとめるため、インデックスの効率が高まります。
解決手順の説明
BigQueryで非正規化されたデータ構造を使用する場合は、以下の点に注意が必要です。
* データの冗長性が発生する
非正規化されたデータ構造では、関連するデータを1つのテーブルにまとめるため、データの冗長性が発生する可能性があります。
* データの管理が複雑になる
非正規化されたデータ構造では、関連するデータが1つのテーブルにまとめられるため、データの管理が複雑になる可能性があります。
各用語の説明
* 非正規化: データベースの設計において、関連するデータを複数のテーブルに分散せず、1つのテーブルにまとめること。
* 正規化: データベースの設計において、関連するデータを複数のテーブルに分散すること。
▼AIを使った副業・起業アイデアを紹介♪