こんにちは。構造計画研究所の山崎です。
最近、統計を扱った書籍が話題を集めたり、雑誌で統計学の特集が組まれたり、統計学がちょっとしたブームになっています。
この統計学ブームの背景には、統計学を駆使したデータ分析が経営・マーケティング戦略立案に役立つと認識されはじめたことがあるのではないかと考えられます。
統計学における重要な話の1つに「擬似相関」という概念がありますが、皆さんはご存知でしょうか?
擬似相関とは、ある要素とある要素の間に一見相関関係があるようにみえて、実はその相関関係が別の要素によるものであり、もとの要素間には本来相関関係がない、というものです。
アイスクリームの売上とプールの溺死事故の関係を例にとって考えてみましょう。
アイスクリームの売上が最も高い時期にプールでの溺死事故も最も多くなりますが、アイスクリームが溺死増加の原因というわけではありません。
このアイスクリームと溺死事故の関係が擬似相関で、その見かけの相関の背後には「猛暑」という要素が存在しています。
この例のようにはっきりとわかる擬似相関であれば、これを本来の相関と取り違えることはほとんどありませんが、擬似相関かどうかわかりにくいケースもあります。
マーケティングの現場にありそうな状況を例にとって、再度考えてみましょう。
あなたはある企業のデータ分析担当者だとします。
ある事業部Aでは、顧客に対して、過去に何度かDMを送っていました。
そこで「DMの受け取り回数」と「購買額」に着目し、その関係を調べたところ、正の相関が観測されました。
このとき「DMがきっかけで顧客の購買行動がもたらされた」と結論してよいでしょうか?
慎重になったあなたが事業部Aに出向いて情報を集めたところ、実は顧客一律にDMを送付していたわけではなく、所得の多い顧客に優先してDMを送付していたことが判明しました。
ということは、高所得者の「DMの受け取り回数」が多いということになり、「DMの受け取り回数」が「購買額」に影響する真の原因とは言い切れません。
「所得額」が「購買額」に影響する真の原因である可能性もあるからです。
上記の例のように、一見本当の相関があるようにみえても「精査すると実は擬似相関だった」ということもあり得ます。
擬似相関を本当の相関と取り違えてしまえば、誤った情報に基づき判断することになり、間違った意思決定を下してしまうリスクも高まるため、注意が必要です。
本日は統計学の「擬似相関」について取り上げました。
統計学には他にも日常生活や日々の業務に役立つ概念がたくさんありますので、このコラムで随時紹介していきたいと思います。
ここまでお読みくださりありがとうございました。