トレーニングコース

From Data to Insights with Google Cloud Platform

  • 2日間
  • 有料

*このコースは現在準備中です。開催が決定次第ご案内させていただきます。

トレーニング概要

ペタバイト級のデータに数秒でクエリを実行し、処理を行う方法を知りたい、あるいはデータの増大に合わせて自動的にスケーリングされるデータ分析について興味があるなら、データ分析コースをぜひ受講してください。

本コースは 2 日間のクラスルーム トレーニングであり、Google Cloud Platform を使用したデータの分析と可視化によって有用な情報を抽出する方法を学習します。 本コースには、参加者が多様な Google BigQuery データセットを使い、有用な情報の探索、掘り起こし、読み込み、可視化、抽出を行うインタラクティブなシナリオとハンズオンラボが用意されています。本コースでは、データの読み込み、クエリの実行、スキーマのモデル化、パフォーマンスの最適化、クエリの料金、データの可視化を扱います。

対象者

このクラスは、次のような方を対象としています。

  • データ アナリスト、ビジネス アナリスト、ビジネス インテリジェンス プロフェッショナル
  • データ アナリストと連携して、Google Cloud Platform にスケーラブルなデータ ソリューションを構築しようとしているクラウド データ エンジニア

前提条件

このコースを最大限に活用するには、次の条件を満たしている必要があります。

  • ANSI SQL の基本的なスキル (参照)

目標

このコースでは、次のスキルについて学習します。

  • Google Cloud Platform で分析と可視化のツールを使用して、データから有用な情報を抽出する
  • Google BigQuery を使用して、データセットに対しインタラクティブにクエリを実行する
  • 大規模なデータの読み込み、クリーニング、変換を行う
  • Google Data Studio やその他のサードパーティのプラットフォームを使用してデータを可視化する
  • 探索的分析と説明的分析の違いを認識し、それぞれのアプローチを使用する場面を区別する
  • 新しいデータセットを探索し、隠れた情報を迅速かつ効果的に見つけ出す
  • データモデル、およびクエリの料金とパフォーマンスを最適化する

当日必要なもの

  • 最新版の Chrome がインストールされた PC
    ※Chrome以外のブラウザの場合、動作しない場合があります。

コースの概要

このコースには、講義、デモ、ハンズオンラボが含まれています。

  • モジュール 1: Google Cloud Platform 上のデータの概要

  • 過去と現在: クラウドでのスケーラブルなデータ分析

  • 取り上げるトピック
    • データ アナリストが直面している分析の課題を明らかにする
    • オンプレミスとクラウドのビッグデータを比較する
    • クラウドでの分析を通して変革した企業の実際のユースケースから学ぶ
    • Google Cloud Platform プロジェクトの基本操作
    • ラボ: Google Cloud Platform の初歩
  • モジュール 2: ビッグデータ ツールの概要

  • データ アナリストとしてのスキルセットに磨きをかける

  • 取り上げるトピック
    • データ アナリストのタスクと課題、Google Cloud Platform データツールの概要を学ぶ
    • デモ: Google BigQuery で 100 億のレコードを分析する
    • Google BigQuery の 9 つの基本機能を確認する
    • アナリスト用、データ サイエンティスト用、データ エンジニア用の GCP ツールを比較する
    • ラボ: Google BigQuery でデータセットを探索する
  • モジュール 3: SQL を使用したデータの探索

  • Google BigQuery に慣れて、SQL のベスト プラクティスを学ぶ

  • 取り上げるトピック
    • 一般的なデータ探索手法を比較する
    • 高品質の標準 SQL のコーディング方法を学ぶ
    • Google BigQuery 一般公開データセットを探索する
    • 可視化のプレビュー: Google Data Studio
    • ラボ: SQL の一般的なエラーのトラブルシューティング
  • モジュール 4: Google BigQuery の料金体系

  • Google BigQuery のストレージとクエリの費用を計算する

  • 取り上げるトピック
    • BigQuery ジョブの概要
    • BigQuery の料金: ストレージ、クエリ、ストリーミングの費用
    • 費用を考慮してクエリを最適化する
    • ラボ: Google BigQuery の料金を計算する
  • モジュール 5: データのクリーニングと変換

  • 生データをクリーンで高機能なデータセットにまとめる

  • 取り上げるトピック
    • データセットの整合性を確保するための 5 つの原則を確認する
    • データセットの分布形と歪度を明らかにする
    • SQL を使用してデータのクリーニングと変換を行う
    • 新しい UI を使用してデータのクリーニングと変換を行う: Cloud Dataprep の概要
    • ラボ: Cloud Dataprep を使用してデータの探索とシェイプを行う
  • モジュール 6: データの保存とエクスポート

  • 新しいテーブルを作成し、結果をエクスポートする

  • 取り上げるトピック
    • 永続テーブルと一時テーブルを比較する
    • クエリ結果を保存してエクスポートする
    • パフォーマンスのプレビュー: クエリ キャッシュ
    • ラボ: 永続テーブルを新規作成する
  • モジュール 7: Google BigQuery への新しいデータセットの取り込み

  • データをクラウドに取り込む

  • 取り上げるトピック
    • 外部データソースからクエリを実行する
    • データの取り込みで問題が発生しないようにする
    • 新しいデータを永続テーブルに取り込む
    • ストリーミング挿入について学ぶ
    • ラボ: 新しいデータセットに対してデータの取り込みとクエリを実行する
  • モジュール 8: データの可視化

  • 可視化を通して効果的にデータを探索し解釈する

  • 取り上げるトピック
    • データ可視化の原則の概要
    • 探索的分析と説明的分析のアプローチを比較する
    • デモ: Google Data Studio の UI
    • Google Data Studio を Google BigQuery に接続する
    • ラボ: Google Data Studio でデータセットを探索する
  • モジュール 9: データセットの結合と統合

  • データセットにデータをさらに組み入れて機能を充実させる

  • 取り上げるトピック
    • 過去のデータテーブルを UNION で結合する
    • テーブル ワイルドカードを使用して結合を簡単にする方法を学ぶ
    • データスキーマの復習: データを複数のテーブルにリンクさせる
    • JOIN の例と問題の概要
    • ラボ: JOIN と UNION を使用して複数のテーブルを結合する
  • モジュール 10: 高度な関数と句

  • Google BigQuery を使用した高度なクエリ記述の詳細を学ぶ

  • 取り上げるトピック
    • SQL CASE ステートメントの復習
    • 分析ウィンドウ関数の概要
    • 一方向のフィールド暗号化でデータを保護する
    • 効果的なサブクエリと CTE の作成について学ぶ
    • SQL と JavaScript の UDF を比較する
    • ラボ: 高度な SQL 関数を使用して分析情報を得る
  • モジュール 11: スキーマの設計とネストされたデータ構造

  • Google BigQuery でスケールを考慮してデータセットをモデル化する

  • 取り上げるトピック
    • Google BigQuery と従来の RDBMS データ アーキテクチャを比較する
    • 正規化と非正規化: パフォーマンスのトレードオフ
    • スキーマの復習: 良い例、悪い例、ダメな例
    • Google BigQuery 内の配列とネストされたデータ
    • ラボ: ネストされたデータと繰り返しデータにクエリを実行する
  • モジュール 12: Google Data Studio を使用した可視化の強化

  • パーフェクトなダッシュボードを作成する

  • 取り上げるトピック
    • CASE ステートメントと計算フィールドを作成する
    • キャッシュを考慮してパフォーマンス上の問題を回避する
    • ダッシュボードの共有とデータアクセス上の問題について学ぶ
  • モジュール 13: パフォーマンスの最適化

  • クエリのパフォーマンス上の問題のトラブルシューティングと解決

  • 取り上げるトピック
    • Google BigQuery のパフォーマンス上の問題を回避する
    • データにホットスポットが生じないようにする
    • クエリ説明マップを使用してパフォーマンス上の問題を診断する
    • ラボ: クエリのパフォーマンスの最適化とトラブルシューティング
  • モジュール 14: 詳細な分析情報

  • データ サイエンティストのように有用な情報を検討、分析、共有する

  • 取り上げるトピック
    • Cloud Datalab の概要
    • Cloud Datalab ノートブックとセル
    • Cloud Datalab を使用する利点
  • モジュール 15: データアクセス

  • クラウドの最優先課題はデータのセキュリティ

  • 取り上げるトピック
    • IAM と BigQuery データセットの役割を比較する
    • アクセス上の問題を回避する
    • メンバー、役割、組織、アカウント管理、サービス アカウントの復習

受講料

¥200,000(税抜)

開講スケジュール

*このコースは現在準備中です。開催が決定次第ご案内させていただきます。

TEL. 03-5840-8815 03-5840-8815 平日 10:00~19:00