BigQueryのデータ構造理解

BigQueryで取得しているGA4のデータがどういった構造で確認されているのかを理解しましょう。

データの中身を確認する

1つのプロジェクト(blog-ga4)に対して、1つのデータセット「analytics_XXXXXXX」が作成され、その中に「日ごと」でテーブルが作成されデータが記録されていきます。

ページ上部のタブ「スキーマ」を押すと取得出来ているフィールド名が確認できます。

取得している主なフィールド名は以下の通り。

フィールド名取得データ
deviceデバイス情報
device.advertising_id広告IDまたはIDFA
user_first_touch_timestamp初回接触時にタイムスタンプ
user_id設定している場合は会員ID
user_pseudo_idユーザーのCookieID(基本はこれを使ってユーザーを特定)
user_properties.valueユーザーのプロパティ値
user_ltvユーザーのライフタイムバリューに関する情報
traffic_sourceトラフィックのソースに関する情報
geo.country国情報
event_timestampイベント発生時にタイムスタンプ
event_previous_timestamp直前のイベントタイムスタンプ
event_nameイベントの名称
event_paramsイベントのパラメータ値
ecommerceEコマース関連の情報
Items商品関連の情報
web_infoホスト名・ブラウザ等の情報

詳細は以下ヘルプをご覧ください。

「プレビュー」のタブを押すと、サンプルデータを見ることができます。

各行の4列目に取得しているイベント名が確認できます。

event_paramasにある「v」をクリックすると、該当イベントに紐付いたイベントパラメータを確認できます。

このような形でイベントパラメータはイベント内にネストされた状態になります。

このテーブルからデータを集計して取得するには「クエリ」を書く必要があります。ページ上部にある「クエリ」の文字列を押すと、クエリを作成する画面が表示されます。

クエリの書き方や考え方については「クエリの書き方(準備中)」をご覧ください。

参考になりましたか?