第66回コラム
データ解析のコツ
創造技術専攻 井ノ上 寛人助教
これまでの研究活動を通じて、実に様々な分野の方と共同研究を行う機会がありました。また、分析したデータも、質問紙を用いた主観評価実験の結果や視線の軌跡(眼球運動)、中小企業の財務諸表など、多岐に渡ります。これらの経験から、本コラムでは、データ解析によって有益な情報を得るためのコツについて、簡単な私見を述べたいと思います。
データ解析の結果から得られる基本情報は、
(1)何かと何かの間に、関係がある/ない、
(2)何かと何かの間に、差異がある/ない、
といった内容になります。
例えば、商品Aと商品Bは同時に購入されるとか、商品Cの販売量は、他の商品と比べて少ないが、特定の客層に繰り返し購入されるといった情報は、商品の陳列パタンや棚に出す量の調整など、販売の仕方に応用できるため、マーケティング担当者にとって有益なものといえます。しかし、新店舗の企画担当者にとって有益な情報は、自社で取り扱う商品の差異ではなく、競合他社と比較した際の差別化要因かもしれません。前者の例では、自社内に蓄積されたデータを分析対象としますが、後者の例では、競合他社のデータも必要となります。
データ解析の担当者の頭を悩ませる状況、第1位は、「何のために分析するのか」という目的が曖昧で、「とりあえずこのデータを分析してくれないか」と依頼されるケースだと思います。ある事柄を仮説検証的に分析するにしても、探索的に分析するにしても、比較対象としたいデータがなければ、価値のある結論を得ることは困難となります。
では、データ解析の担当者の頭を悩ませる状況、第2位は何かというと、収集したデータに対する専門知識が十分でない上、その分野の専門家から協力を得られない場合だと思います。ここでいう専門知識とは、データ解析の手法に関するものではなく、分析対象とする現象やデータの性質のことを指しています。例えば、借金に関するデータを質問紙調査で収集する場合は、回答拒否(欠損値)が生じたり、見栄が反映されたりするため、それらの性質を予め予測した上で、何らかの対策や前処理を検討しておく必要があります。
また、好みなどを調査する場合は、個人差がランダムに分布すると仮定できず、寧ろ、個人差そのものが重要な分析対象になることもあります。分析者自身がその分野の専門家であれば、明確な目的を持って必要なデータを収集し、適切な解析手法を選択できますが、そうでない場合は、専門家と協議しないと、データの収集方法に基づく性質などを見落とすことがあり得ます。データ解析もチーム活動が重要であり、前述した「とりあえずこのデータを分析してくれないか」という依頼は、この意味でも困りものといえます。
反対に、「具体的にどのようなことが分かれば有益なのか」、「データをどのように収集する/収集したのか」といったことをチームで事前に協議しておくと、データ解析の結果から価値のある結論を得やすいのではないでしょうか。端的にいえば,データ解析を依頼するときは、丸投げしないで一緒に考察を深めていきましょう、ということです。これは、データ解析を依頼するときのコツであり、きっとあなたの回りにいるデータ解析担当者からのお願いでもあると思います。