[Looker Studio] REGEXP_EXTRACT関数の使い方と活用例 | 計算フィールド
この記事では、Looker StudioおけるREGEXP_EXTRACT関数の使い方とその具体的な活用例についてわかりやすく解説します。Looker Studioで利用できる関数を活用して、データを加工しデータを可視化しましょう。
GA4(Googleアナリティクス4)やサーチコンソールのデータ加工についてはBig Queryを利用しなくても計算フィールドでできることも多いです。またREGEXP_EXTRACT関数は正規表現を使う関数ですが、GA4とLooker Studioにおいては正規表現を使うことでデータの可視化や分析できることが大きく拡がります。具体的な活用例についてはコネクタを利用したGA4のデータをもとにして解説しますのでぜひご活用ください。
Contents
Looker Studioの計算フィールドとは?
Looker Studioの計算フィールドは、既存の項目をもとに演算子(足し算・引き算・掛け算・割り算など)、関数や正規表現を使って、独自の項目を作成し、レポートに使える便利な機能です。
インハウスプラスでは、この記事でご紹介する関数以外にもLooker Studioの計算フィールドで使える関数をひとつずつ分かりやすく事例付きで解説しています。Looker Studioの関数ブログ一覧に随時アップしていますので、ぜひご覧ください。
またLooker Studioの基本的な使い方は、「Looker Studioの使い方」を参考にしてください。Looker Studioは無料でさまざまなデータソースと接続し分かりやすいレポートが作成できるとても便利なツールなので、積極的に活用していきましょう。
REGEXP_EXTRACT関数とは
REGEXP_EXTRACT関数は、あるテキストフィールドの中から正規表現を使った特定の文字列パターンに最初に一致する部分文字列を抽出するための関数です。指定した文字列パターンが複数存在する場合は前に存在する文字列パターンが抽出されますのでご注意ください。
構文
REGEXP_EXTRACT関数の構文は以下の通りです。
REGEXP_EXTRACT("抽出したい文字列が含まれるテキスト","正規表現を利用した文字列")
"抽出したい文字列が含まれるフィールド"
には特定の文字列パターンが含まれているかを判定するテキストフィールドを指定します。"正規表現を利用した文字列"
には抽出したい文字列を正規表現を使って指定します。
正規表現とは
正規表現とは文字列内の特定のパターンを記述するための特殊な文字列です。正規表現を利用することで以下のような文字列を指定することができます。
- 「あ」からはじまる5文字の文字列を正規表現で表すと
^あ.{4}$
- ハイフンを含む3桁の数字と4桁の数字を正規表現で表すと
^\d{3}-\d{4}$
- 最後が「あ」で終わる文字列を正規表現で表すと
.*あ$
このように特定の文字列ではなく文字列のパターンを指定することができるため指定できる文字列の自由度が高いことが特徴です。例えば”東京”と”東京都”の2つの文字列があった時に、通常の検索のように”東京都”という指定では”東京”が検索されることはないですが、正規表現を利用することでどちらも検索されるようにできます。
※正規表現の詳しい記述方法については公式ヘルプのLooker Studio の正規表現をご覧ください。
REGEXP_EXTRACT関数の使い方
REGEXP_CONTAINS関数を使用するためには、Looker Studioで計算フィールドを作成する必要があります。計算フィールドの作成方法にはデータソースの計算フィールドとグラフ固有の計算フィールドの2種類があります。この記事ではデータソースの計算フィールドで作成しますが、それぞれの違いの詳細についてはデータソースの計算フィールドとグラフ固有の計算フィールドの違いをご覧ください。
利用例:Looker StudioでGA4のページURLから第二階層の文字列を抽出する
今回は、URLのディレクトリから第二階層のみを抽出してページをカテゴライズしやすいようにしてみましょう。
なお、https://inhouse-plus.jp/reporting/dataportal-templates/のURLの場合、階層構造は以下の表のようになり、第二階層は「reporting」の部分となります。
階層 | URL例 |
---|---|
第一階層 | inhouse-plus.jp |
第二階層 | reporting |
第三階層 | dataportal-templates |
まず以下のように計算フィールドを設定します。
①フィールド名:任意のフィールド名を入力してください。
②計算式:REGEXP_EXTRACT(ページ ロケーション,'^https://[^/]+/[^/]+/([^/]+)/')
この正規表現はhttps://ではじまるURLの第二階層のディレクトリを指定します。
③保存:入力が完了したら保存をクリックします。
以下のように第二階層というフィールドができました。
続いて先ほど作成したフィールドがレポートで利用できるようになっているので表に追加していきます。以下のようにディメンションに第二階層を追加します。
このように第二階層別の表示回数を可視化することができました。
今回は指標に表示回数を利用しましたが、セッション数やユーザー数を利用する場合は注意が必要です。ディメンションは第二階層でグループ化されていてもセッション数やユーザー数はユニーク化されていません。
例えば、
- https://function.com/abc/123/xの表示回数が10、ユーザー数が8
- https://function.com/abc/123/yの表示回数が5、ユーザー数が5
というアクセスデータがあった際に第二階層123の表示回数は2つを足して15でよいですが、ユーザー数は同じように足して13とはならないケースがあります。それは同じユーザーがどちらのページもアクセスしていた場合です。2人のユーザーが2つのページにどちらもアクセスしていた場合は第二階層123の表示回数は15、ユーザー数は11となります。しかし今回の利用例であげたREGEXP_EXTRACT関数を使った第二階層ではセッション数やユーザー数がユニーク化されずに単純に合計された値13が表示されるので利用するシーンや指標に注意しましょう。
セッション数やユーザー数がユニーク化されたページに階層ごとの数値を見たい場合はGoogleタグマネージャーを利用してコンテンツグループの設定が必要になります。
※関連公式ヘルプ:[GA4] コンテンツ グループを作成する
関連するLooker Studio公式ドキュメント
Looker Studio公式ヘルプ:計算フィールドについて
Looker Studio公式ヘルプ:関数リスト
導入社数2,000社突破!Looker Studioをフル活用するならインハウスプラス
インハウスプラスでは、さまざまなニーズに応えるカスタマイズ可能なLooker Studioレポートテンプレートを提供しています。これらのテンプレートを活用することで、既製のテンプレートをベースに必要な部分のみをカスタマイズするだけで、ゼロからレポートを作成するよりもはるかに短時間で高品質なレポートが作成できます。
GA4・サーチコンソール・Google広告レポートは買い切りプラン
買い切りプランは、2,000社以上が利用するインハウスプラスの中でも特に人気のプランです。GA4、サーチコンソール、Google広告に対応し、一度の購入でサイト数無制限でレポートが作成可能です。レポートはコピーするだけで数分で完成し、カスタマイズも自由に行えます。また、Googleアナリティクスの専門家の小川卓さんが顧問として参画しており、GA4の仕様変更時にはテンプレートを随時アップデートしていますので、ずっと安心してご利用いただけます。
買い切りプランで使えるすべてのレポートテンプレートをみる >
Web広告・SNSレポートはサブスクリプションプラン
サブスクリプションプランは、初期設定不要で月額4,980円から、Web広告やSNSレポートをLooker Studioで自動化できる非常にお得なプランです。お客様の作業は、インハウスプラスに対象アカウントの閲覧権限を付与するだけで、1営業日以内に完成したレポートが届き、その後は毎日自動でデータが更新されます。レポートの内容もお客様側で自由にカスタマイズ可能で、分からないことがあれば無料のテクニカルサポートにいつでも相談できます。
※通常Web広告やSNSレポートをLooker Studioで自動化するには、データ取得・更新のためのシステム開発(媒体APIを利用したデータ取得やBigQueryなどのデータベースの保守運用)が必要です
サブスクリプションプランで使えるすべてのレポートテンプレートをみる >
Looker Studioを使ったカスタマイズ開発もお任せください
インハウスプラスでは、テンプレートの提供に加えて、各企業様のニーズに合わせて要件定義からシステム実装までを手掛けるカスタマイズ開発を多数行っております。一般的なレポートツールでは対応できない要件のものも、高機能かつ無料のLooker Studioをフル活用することで、既存のシステム開発会社やBI開発会社よりも圧倒的にリーズナブルな料金で対応可能です。まずはお気軽にお問い合わせフォームからご相談ください。
様々なデータソースに対応
- GA4
- サーチコンソール
- Web広告(33種類以上に対応)
- InstagramやFacebookインサイトなどのソーシャルメディア
- Googleビジネスプロフィール(MEO)
- SalesforceなどのSFAやCRMツール
- ECカートシステム
- その他基幹データなど多数
多くの開発実績があります
- Webメディア運営企業様向けWeb記事の売上貢献度を可視化するコンテンツ管理ダッシュボード
- 事業会社向け自社モバイルアプリの経営・ビジネス管理ダッシュボード
- BtoB企業向けWeb広告とSalesforceを統合したマーケティングROI管理ダッシュボード(チャネル別のリード獲得単価、商談単価、受注単価、ROASをリアルタイムで可視化)
- 広告代理店向けWeb広告のクライアント報告用自社オリジナルレポート
- 単品通販企業向けWeb広告とカートシステムを統合したマーケティングROI管理ダッシュボード(チャネル別のLTVやROASを可視化)
など多数
DeNAのデジタルマーケティング責任者として年間450億円を超えるECプラットフォームのマーケティングを担当。2014年に独立し、上場企業から資金調達後のスタートアップまで様々な企業のデジタルマーケティングのプロジェクトに関わり見識を広げた後、2018年3月に株式会社CALLOSUMを創業。