2024年版【GCP資格の勉強 PDE編】BigQueryのタイムトラベル機能とは?について解説します。
(★注意:GCP資格 Professional Data Engineer(PDE)試験の公式テキスト・問題集などを元に独自にまとめたものです)
BigQueryのタイムトラベル機能は、データのバックアップとリストアを容易にするための強力なツールです。以下にその主な特徴をまとめます。
タイムトラベル機能の概要
- 目的: ミスオペレーションや誤ったデータ操作が発生した場合、テーブルを過去の状態に戻すことが可能。
- 期間: テーブルは最大7日間の期間にわたって、任意のタイムスタンプの状態に戻せます。ただし、テーブルが削除された場合は2日間のみです。
- 利用方法: `SELECT`句内に`FOR SYSTEM TIME AS OF`を使用して、特定の時点のデータをクエリします。
- トランザクションログ: トランザクションログはサポートされておらず、これはBigQueryがサーバーレスサービスとしての運用を目指しているためです。
- コスト: 増分ストレージの費用は無料ですが、テーブルを永続化したバックアップを明示的に作成する場合は追加コストが発生します。
バックアップとリストアの実践
- バックアップ: 明示的なバックアップを取るには、特定のタイムスタンプでテーブルのスナップショットを作成し、それを別のテーブルとして保存します。
- リストア: タイムトラベル機能を使用して、特定の時点のデータを取得し、必要に応じて新しいテーブルに保存することで、データのリストアを実現します。
利用シナリオ
- データ回復: 誤ってデータを削除または更新した場合に、過去の状態に戻すことができます。
- データ分析: 特定の時点のデータを分析するために、過去の状態を照会できます。
【練習問題】BigQueryのタイムトラベル機能
質問 1: BigQueryのタイムトラベル機能を使用して、テーブルを過去の状態に戻すことが可能な最大期間はどれくらいですか?
A) 24時間
B) 48時間
C) 7日間
D) 14日間
正解: C) 7日間
質問 2: BigQueryでテーブルが削除された後、タイムトラベル機能を使用してデータをリストアすることができる期間はどれくらいですか?
A) 24時間
B) 48時間
C) 7日間
D) 14日間
正解: B) 48時間
質問 3: BigQueryのタイムトラベル機能を使用する際、データを特定の時点の状態に戻すためにどのSQLキーワードを使用しますか?
A) BACKUP AS OF
B) RESTORE TO
C) FOR SYSTEM TIME AS OF
D) REVERT TO
正解: C) FOR SYSTEM TIME AS OF
これらの問題は、BigQueryのタイムトラベル機能に関する基本的な理解を確認するためのもので、GCP資格 Professional Data Engineer(PDE)試験のスタイルに沿った形式で作成されています。
まとめ
BigQueryのタイムトラベル機能は、データのバックアップとリストアにおいてとても有用ですが、7日間(または削除後2日間)の制限があるため、長期間のデータ保持が必要な場合は別途バックアップ戦略を考慮する必要があります。
また、BigQueryのバックアップとリストアに関する最新の情報は、Google Cloudの公式ドキュメントで確認することが重要です。
▼AIを使った副業・起業アイデアを紹介♪