[Looker Studio] REGEXP_EXTRACT関数の使い方と活用例 | 計算フィールド

[Looker Studio] REGEXP_EXTRACT関数の使い方と活用例 | 計算フィールド

この記事では、Looker StudioおけるREGEXP_EXTRACT関数の使い方とその具体的な活用例についてわかりやすく解説します。Looker Studioで利用できる関数を活用して、データを加工しデータを可視化しましょう。

GA4(Googleアナリティクス4)やサーチコンソールのデータ加工についてはBig Queryを利用しなくても計算フィールドでできることも多いです。またREGEXP_EXTRACT関数は正規表現を使う関数ですが、GA4とLooker Studioにおいては正規表現を使うことでデータの可視化や分析できることが大きく拡がります。具体的な活用例についてはコネクタを利用したGA4のデータをもとにして解説しますのでぜひご活用ください。

Looker Studioの計算フィールドとは?

Looker Studioの計算フィールドは、既存の項目をもとに演算子(足し算・引き算・掛け算・割り算など)、関数や正規表現を使って、独自の項目を作成し、レポートに使える便利な機能です。

インハウスプラスでは、この記事でご紹介する関数以外にもLooker Studioの計算フィールドで使える関数をひとつずつ分かりやすく事例付きで解説しています。Looker Studioの関数ブログ一覧に随時アップしていますので、ぜひご覧ください。

またLooker Studioの基本的な使い方は、「Looker Studioの使い方」を参考にしてください。Looker Studioは無料でさまざまなデータソースと接続し分かりやすいレポートが作成できるとても便利なツールなので、積極的に活用していきましょう。

↑ページのトップに戻る

REGEXP_EXTRACT関数とは

REGEXP_EXTRACT関数は、あるテキストフィールドの中から正規表現を使った特定の文字列パターンに最初に一致する部分文字列を抽出するための関数です。指定した文字列パターンが複数存在する場合は前に存在する文字列パターンが抽出されますのでご注意ください。

構文

REGEXP_EXTRACT関数の構文は以下の通りです。

REGEXP_EXTRACT("抽出したい文字列が含まれるテキスト","正規表現を利用した文字列")

  • "抽出したい文字列が含まれるフィールド"には特定の文字列パターンが含まれているかを判定するテキストフィールドを指定します。
  • "正規表現を利用した文字列"には抽出したい文字列を正規表現を使って指定します。

正規表現とは

正規表現とは文字列内の特定のパターンを記述するための特殊な文字列です。正規表現を利用することで以下のような文字列を指定することができます。

  • 「あ」からはじまる5文字の文字列を正規表現で表すと ^あ.{4}$
  • ハイフンを含む3桁の数字と4桁の数字を正規表現で表すと ^\d{3}-\d{4}$
  • 最後が「あ」で終わる文字列を正規表現で表すと .*あ$

このように特定の文字列ではなく文字列のパターンを指定することができるため指定できる文字列の自由度が高いことが特徴です。例えば”東京”と”東京都”の2つの文字列があった時に、通常の検索のように”東京都”という指定では”東京”が検索されることはないですが、正規表現を利用することでどちらも検索されるようにできます。

※正規表現の詳しい記述方法については公式ヘルプのLooker Studio の正規表現をご覧ください。

↑ページのトップに戻る

REGEXP_EXTRACT関数の使い方

REGEXP_CONTAINS関数を使用するためには、Looker Studioで計算フィールドを作成する必要があります。計算フィールドの作成方法にはデータソースの計算フィールドとグラフ固有の計算フィールドの2種類があります。この記事ではデータソースの計算フィールドで作成しますが、それぞれの違いの詳細についてはデータソースの計算フィールドとグラフ固有の計算フィールドの違いをご覧ください。

利用例:Looker StudioでGA4のページURLから第二階層の文字列を抽出する

今回は、URLのディレクトリから第二階層のみを抽出してページをカテゴライズしやすいようにしてみましょう。

なお、https://inhouse-plus.jp/reporting/dataportal-templates/のURLの場合、階層構造は以下の表のようになり、第二階層は「reporting」の部分となります。

階層URL例
第一階層inhouse-plus.jp
第二階層reporting
第三階層dataportal-templates

まず以下のように計算フィールドを設定します。

Looker StudioでREGEXP_EXTRACT関数を使って第二階層のディレクトリを抽出する設定
引用:Looker Studio

①フィールド名:任意のフィールド名を入力してください。

②計算式:REGEXP_EXTRACT(ページ ロケーション,'^https://[^/]+/[^/]+/([^/]+)/')

この正規表現はhttps://ではじまるURLの第二階層のディレクトリを指定します。

③保存:入力が完了したら保存をクリックします。

以下のように第二階層というフィールドができました。

Looker StudioでREGEXP_EXTRACT関数を使って第二階層のディレクトリを抽出する指標
引用:Looker Studio

続いて先ほど作成したフィールドがレポートで利用できるようになっているので表に追加していきます。以下のようにディメンションに第二階層を追加します。

Looker StudioでREGEXP_EXTRACT関数を使って第二階層のディレクトリを可視化する
引用:Looker Studio

このように第二階層別の表示回数を可視化することができました。

今回は指標に表示回数を利用しましたが、セッション数やユーザー数を利用する場合は注意が必要です。ディメンションは第二階層でグループ化されていてもセッション数やユーザー数はユニーク化されていません。

例えば、

  • https://function.com/abc/123/xの表示回数が10、ユーザー数が8
  • https://function.com/abc/123/yの表示回数が5、ユーザー数が5

というアクセスデータがあった際に第二階層123の表示回数は2つを足して15でよいですが、ユーザー数は同じように足して13とはならないケースがあります。それは同じユーザーがどちらのページもアクセスしていた場合です。2人のユーザーが2つのページにどちらもアクセスしていた場合は第二階層123の表示回数は15、ユーザー数は11となります。しかし今回の利用例であげたREGEXP_EXTRACT関数を使った第二階層ではセッション数やユーザー数がユニーク化されずに単純に合計された値13が表示されるので利用するシーンや指標に注意しましょう。

セッション数やユーザー数がユニーク化されたページに階層ごとの数値を見たい場合はGoogleタグマネージャーを利用してコンテンツグループの設定が必要になります。

※関連公式ヘルプ:[GA4] コンテンツ グループを作成する

↑ページのトップに戻る

関連するLooker Studio公式ドキュメント

Looker Studio公式ヘルプ:計算フィールドについて

Looker Studio公式ヘルプ:関数リスト

↑ページのトップに戻る

導入社数2,000社突破!Looker Studioをフル活用するならインハウスプラス

インハウスプラスでは、さまざまなニーズに応えるカスタマイズ可能なLooker Studioレポートテンプレートを提供しています。これらのテンプレートを活用することで、既製のテンプレートをベースに必要な部分のみをカスタマイズするだけで、ゼロからレポートを作成するよりもはるかに短時間で高品質なレポートが作成できます。

GA4・サーチコンソール・Google広告レポートは買い切りプラン

買い切りプランは、2,000社以上が利用するインハウスプラスの中でも特に人気のプランです。GA4、サーチコンソール、Google広告に対応し、一度の購入でサイト数無制限でレポートが作成可能です。レポートはコピーするだけで数分で完成し、カスタマイズも自由に行えます。また、Googleアナリティクスの専門家の小川卓さんが顧問として参画しており、GA4の仕様変更時にはテンプレートを随時アップデートしていますので、ずっと安心してご利用いただけます。

GA4レポートを自動化(61ページ)

【買い切り版】GA4 月次レポートテンプレート for Looker Studio(4007)

GA4 月次レポートテンプレート for Looker Studio(4007)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

SEO報告用レポート(19ページ)

【買い切り版】SEO月次レポートテンプレート for Looker Studio(4011)

SEO月次レポートテンプレート for Looker Studio(4011)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

Google広告レポート(20ページ)

【買い切り版】Google広告レポートテンプレート for Looker Studio(4003)

Google広告レポートテンプレート for Looker Studio(4003)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

買い切りプランで使えるすべてのレポートテンプレートをみる >

Web広告・SNSレポートはサブスクリプションプラン

サブスクリプションプランは、初期設定不要で月額4,980円から、Web広告やSNSレポートをLooker Studioで自動化できる非常にお得なプランです。お客様の作業は、インハウスプラスに対象アカウントの閲覧権限を付与するだけで、1営業日以内に完成したレポートが届き、その後は毎日自動でデータが更新されます。レポートの内容もお客様側で自由にカスタマイズ可能で、分からないことがあれば無料のテクニカルサポートにいつでも相談できます。

※通常Web広告やSNSレポートをLooker Studioで自動化するには、データ取得・更新のためのシステム開発(媒体APIを利用したデータ取得やBigQueryなどのデータベースの保守運用)が必要です

Web広告横断レポート(33媒体対応)

【サブスク版】Web広告横断レポートテンプレート for Looker Studio(0009)

Web広告横断レポート for Looker Studio(0009)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

Facebook広告レポート(12ページ)

【サブスク版】Facebook/Instagram広告レポートテンプレート for Looker Studio(0002)

Facebook広告レポート for Looker Studio(0002)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

Instagramレポート(32ページ)

【サブスク版】Instagramインサイトレポート横型テンプレート for Looker Studio(0010)

Instagramインサイトレポート for Looker Studio(0010)

demo-icon デモレポートURLを開く

detail-icon レポートの詳細を見る

サブスクリプションプランで使えるすべてのレポートテンプレートをみる >

カスタムダッシュボード開発やテクニカルサポートもお任せください

レポートテンプレートの提供に加えて、各企業のニーズに合わせて要件定義から実装までを手掛けるカスタマイズ開発や、スポットで気軽にプロフェッショナルに相談できるテクニカルサポートなどの「Looker Studioのデータ活用支援サービス」も提供しています。

小川卓さんをはじめとする経験豊富なスペシャリストがサポートいたしますので、ぜひお気軽にお問い合わせフォームからご相談ください。

↑ページのトップに戻る