リフトの確実性について

リフトの確実性は、ブランド効果測定のみで利用可能で、効果測定の結果について信頼性を把握するのに重要な指標です。リフトの確実性は、測定されたブランドリフトが偶然ではなくキャンペーンに起因する可能性を示します。

このページの内容

仕組み
ブランド効果測定の確実性のレベルについて
リフトの確実性の解釈方法
よくある質問

仕組み

リフトの確実性は「1 - p 値」として計算され、効果測定の結果の「統計的有意性」または「信頼度」と呼ばれることもあります。p 値は、広告の効果が低かった場合、測定されたブランドリフトの結果が得られる確率はどれくらいかを示します。つまり、確実性が高い（p 値が低い）場合、結果が単に偶然であった可能性は低くなり、広告によって生じたブランドリフトである可能性が強くなります。

ブランド効果測定の確実性のレベルについて

Google では確実性の高い（90%）ブランドリフトを検出するため、できるだけ多くの回答を収集することに努めていますが、確実性の低い結果であっても広告に関する意思決定を行う際に参考となる場合があります。Google 広告アカウントでは、すべての効果測定において確実性が 70% を超えるブランドリフトとその確実性がレポートされます。確実性が 70% を下回る場合、その測定結果は統計的に有意とは言えず信頼性に欠けるため、レポートされません。

注: リフトの確実性は、一部のアカウントでのみご利用いただけます。アカウントでこの指標が利用できない場合は、確実性が高い（90% 超）結果のみが表示されます。リフトの確実性を使用できるのはブランド効果測定のみであり、検索数やコンバージョンリフトの測定結果はリフトの確実性が高い（90% 超）場合にのみ共有されます。

リフトの確実性の結果を解釈し、活用する方法

次の表は、リフトの確実性に基づいて効果測定の結果をどのように解釈できるかについての一般的なガイダンスを示しています。なお、わかりやすくするため、リフトの確実性は 5% 単位で切り捨てられます。以下の表は参考としてご利用ください。結果の解釈は、お客様のビジネスニーズおよびリスク許容度に基づいて行うことをおすすめします。

リフトの確実性	解釈
≥90%	高い信頼度 - 偶然による可能性が低く、最も信頼性の高い結果です。広告による効果があったことを強く裏付けるデータであるため、この結果に基づいて広告に関する判断を下すことができます。
85%	中程度の信頼度 - ノイズの影響を受けている可能性がいくらか存在します。傾向分析やリスクの低い意思決定に使用することをおすすめします。
80%
75%	低い信頼度 - 偶然によるものであって、広告のパフォーマンスを正確に反映した結果ではない可能性があります。信頼度の低い結果は、傾向分析やリスクが非常に低い意思決定に使用することをおすすめします。重要な決定を下す場合は、再測定を行って、アンケートの回答をさらに収集し、確実性を高めることができます。
70%
「ブランドリフトの検出なし」	信頼できない結果 - 確実性が 70% を下回る結果は、ブランドリフトを十分に裏付けるものとはならないため、Google 広告では「ブランドリフトの検出なし」と報告されます。

ブランド効果測定では 90% という高い確実性でブランドリフトを検出することを目標としています。とはいえ、それより確実性の低い結果を表示しても測定結果の品質が下がることはなく、お客様は通常確認できないデータポイントを取得できます。

確実性の低い結果について

確実性が低いとは、必ずしも広告の効果が低いことを意味するわけではありません。確実性の低い結果からも、さらに検証すべき有用な情報が得られる場合があります。リフトの確実性が低いということは、ブランドリフトの測定時に十分な信頼性を確保できなかったことを意味します。原因としては、アンケートの回答数が少なかったか、ブランドリフトが低いことが考えられます。

アンケートの回答数が少ない: アンケートの回答数が少ない（4,100 件未満）と、測定精度が低下し、リフトの確実性も低下する可能性が高くなります。特に、測定結果を年齢、性別、キャンペーンなどで分類すると、セグメントあたりの回答数が少なくなります。再測定を行えば、アンケートの回答数を増やすことができます
絶対的ブランドリフトが低い: ブランドリフトが 2% を下回ると、高い確実性を確保することは難しくなります。ただし、絶対的ブランドリフトが低くても、必ずしも広告のパフォーマンスが低いことを意味するわけではありません。絶対的ブランドリフトが低いキャンペーンでも、効果があったユーザーあたりの費用（CPLU）で優れた成果を上げる場合があります。

リフトの確実性が異なるセグメントを比較する

セグメント（たとえば年齢層）によって、リフトの確実性は異なる場合があります。前述のとおり、リフトの確実性が最も高いセグメントが最も成果の高いセグメントであるとは限りません。

セグメントを比較する際は「絶対的ブランドリフト」または CPLU を使用することをおすすめします（「効果があったユーザー」は使用しないでください）。もう一つ留意すべき点として、多くの場合、ブランドリフトのパフォーマンスはセグメント間で似通っているため（信頼区間の重複が多いため）、最も成果の高いセグメントを明確に特定することは困難になります。成果の高いセグメントを重視してキャンペーンを最適化したい場合は、一般的な判断として、絶対的ブランドリフトが最も高い（または CPLU が最も低い）セグメントを選択することが推奨されます。ただし、リフトの確実性が低いほど、測定されたパフォーマンスはノイズによるものである可能性が高くなります。パフォーマンスに大差のないセグメントが複数ある場合は、リスクを最小限に抑えるために、最も確実性が高いセグメントを選択することをおすすめします。高い成果を上げているセグメントの特定方法がわからない場合は、アカウント担当者にご相談ください。

信頼区間と信頼度について

通常、広告のブランドリフトについて言及する場合は、広告に起因している可能性の高いブランドリフトの「推定値」を指します。ただし Google 広告では、すべてのブランド効果測定の指標で信頼区間を確認することができます。信頼区間とは、高い確率で結果が含まれていると推定される範囲です。この範囲は上限と下限（ブランドリフトが実際に取り得る可能性のある最高値と最低値）によって定義されます。ブランド効果測定の結果では、80% の両側信頼区間が使用されます。これは、実際のブランドリフトが下限と上限の間にある確率が 80% であることを意味します。また、ブランドリフトが下限よりも大きい確率が 90% であるということでもあります。

例: 相対的リフトの推定値が 35% であるとします。一方で、信頼区間が 30% から 40% である場合、実際のブランドリフトが下限 30% と上限 40% の間に存在する確率は 80% であることを意味します。言い換えると、ブランドリフトが 30%（下限）を超える確率は 90% であるということになります。

リフトの確実性が 90% 未満の場合、信頼区間の下限は 0 より小さくなります。これは、ブランドリフトが正の値であったことを 90% 以上の確実性で保証できないためです。

よくある質問

リフトの確実性の下限を指定することはできますか？

お客様が指定することはできません。確実性が 70% を超える結果はすべて表示されます。下限を高く設定したい場合（80% など）は、その下限に達していない結果をすべて破棄してください。70% 未満の下限を設定することはできません。

リフトの確実性を高めるにはどうすればよいですか？

リフトの確実性は、測定の精度に依存します。測定精度を高めるには、次の方法があります。

再測定を行って、アンケートの回収率を高めます。
広告想起または認知度を測定して、確実性の高いブランドリフトを検出できる確率を判断します。
ブランドリフトが高い広告キャンペーンを選択するには、アカウントマネージャーにご相談ください。

リフトの確実性の算出方法について教えてください。

測定調査には常にある程度偶然に左右される部分があり、それがデータの変動につながる可能性があります。これは「ランダムな測定ノイズ」と呼ばれます。このランダムノイズにより、実際には広告がブランド効果を高めていないにもかかわらず、ブランド効果測定でプラスのブランドリフトが検出されることがあります。p 値は、広告がブランドリフトを発生させていない場合に、測定されたブランドリフトがノイズによるものである可能性を数値で表したものです。p 値が非常に低い場合、測定されたブランドリフトがランダムなノイズの結果である可能性は非常に低くなり、逆にそのブランドリフトが広告キャンペーンに起因していることが確実となります。

リフトの確実性は「1 - p 値」として計算され、パーセンテージで表されます。この数値が大きいほど（つまり p 値が小さいほど）、広告によってブランド効果が得られたという確実性が大きくなります。

例 1: 広告の絶対的リフトが 5%、p 値が 0.01 の場合: 5% のブランドリフトがランダムな測定ノイズによるものである確率が 1% であることを意味します。つまり、広告がブランドリフトを発生させた確実性は 99% と高くなります。

例 2: 広告の絶対的リフトが 5%、p 値が 0.35 の場合: 5% のブランドリフトがランダムな測定ノイズによるものである確率が 35% であることを意味します。この場合、確実性は 65% と低いため、広告による効果であることを示す十分な信頼できる証拠とはなりません。

セグメントでリフトの確実性が低くなるのはなぜですか？

キャンペーンなどのセグメントごとにデータを分割すると、各セグメントには測定データのサブセットのみが含まれることになります。調査全体と比較して個々のセグメントの回答数は少なくなるため、高い確実性でブランドリフトを検出することは難しくなります。あるセグメントのリーチが他のセグメントより大きい場合（たとえば、他のキャンペーンより多くの予算がある場合）、そのセグメントが得る回答数は多くなり、そのセグメントのブランドリフトは小さくても、リフトの確実性は高くなる可能性があります。リーチの小さいセグメントでブランドリフトを検出するのは非常に困難です。

セグメントの確実性はどこで確認できますか？

ブランドリフトのレポートでグラフの下にある表を開くと、リフトの確実性など、ブランド効果測定のすべての指標を確認できます。

信頼区間はどこで確認できますか？

信頼区間はブランドリフトのグラフに含まれています。表のブランドリフトの測定結果にカーソルを合わせると、信頼区間が表示されます。グラフでは、測定値の不確実度を確認できます。また、セグメントを比較する際に、その 2 つのセグメントの信頼区間が重複しているかどうかも簡単にチェックできます。重複する部分が大きいほど、そのセグメントがもう一方のセグメントよりも優れた成果を上げているという確実性は低くなります。すべてのグラフで信頼区間は 0 でカットされていますが、表のブランドリフトの測定結果にカーソルを合わせると正確な値を確認できます。

この情報は役に立ちましたか？

改善できる点がありましたらお聞かせください。