2024年版、GCP資格 PDE試験の「効率的な大規模時系列データベースの選択」に関する練習問題を勉強していきましょう。平易な問題文 → 実践的な問題文 → 問題の解き方・解説 → 用語説明の順番で効率的に学べます。
なお、GCP資格のPDE練習問題を一気に勉強したい方は、下記リンクでまとめて学習できます。
「2024年版【GCP資格 PDE試験の練習問題】なんと5時間で学べる!」
GCP PDE問題文
「あなたは何百万台ものコンピュータのCPUとメモリ使用量を時系列で保存するデータベースサービスを選ぶ必要があります。このデータは毎秒保存される予定です。アナリストはこのデータベースでリアルタイムのアドホック分析を行いたいと考えていますが、クエリの実行ごとに課金されることは避けたいです。また、将来的にデータセットを拡張できるようなスキーマデザインを採用したいと考えています。どのデータベースとデータモデルが適しているでしょうか?」
難解な表現での再記述
(GCPのPDE試験問題のような難解な表現での出題文。内容は上記問題文と同じ)
「Google Cloud上で、何百万台ものコンピュータのCPUとメモリ使用量を時系列で保存し、1秒ごとに更新されるデータベースを設計する場合、どのデータベースサービスとデータモデルを選択すべきですか?アナリストはリアルタイムでアドホック分析を行い、同時に将来のデータセット拡張の可能性を保持しつつ、クエリごとの課金を避けたいと考えています。」
問題の解説
- 大量の時系列データを保存し、リアルタイムのアドホック分析を行うためのデータベースサービス選択が必要です。
- 毎秒更新されるデータに対応できるスケーラビリティと効率的なクエリ性能が求められます。
- クエリの実行ごとの課金を避けることが望まれています。
解決手順の説明
- Cloud Bigtableを選択することが適切です。これはフルマネージドなNoSQLデータベースで、時系列データの保存に適しています。
- Cloud Bigtableは、キーに時間を設定し、Key-Valueライクなテーブル構成にすることで、効率的なクエリ走査を可能にします。
- カラム数が多くならないように設計することで、クエリのパフォーマンスを維持できます。
各用語の説明
- Cloud Bigtable: Google Cloud上で提供されるフルマネージドなNoSQLデータベースサービス。
- 時系列データ: 時間に沿って測定されたデータの系列。
- Key-Valueテーブル: キーと値のペアを格納するデータベースの形式。
IT起業家
▼AIを使った副業・起業アイデアを紹介♪