今日は、Webマーケター兼データ分析官の杉山がお送りします。
この1年、様々な場面でデータを触る仕事をしていて、感じたお話をしようと思います。
どんなに高級な数学的手法や、優れたデータ分析を行っても、それじゃ何にもならないなと感じたというお話です。
僕はもともと大学院で数学を研究していました。わざわざPhDまで取ってから新卒(?)としてこの会社に来て1年、心からそう感じているのだから、面白いものです。
結論から話しますと、データ分析は、人間が行う意思決定に供する目的で行う場合、その意思決定に役に立つものでなければならないということです。
もっというと、その文脈において、データ分析は意思決定のためのいちツールであって、万能な解決策を与えるものではないということです。
であるので、データの分析結果が出たあと、それを見て頭で考える必要があるし、逆に、データの分析結果は、解釈可能で、まともに考える材料になる必要があるということです。
今日はこの話をしようと思います。
そもそも、データ分析は何のためにするのでしょうか。ビジネスで行われている行為(手段)には、必ずそれを行う目的があるはずです。
データ分析は、ざっくりいうと、「意思決定に使う材料を提供する」ために行われると思います。
意思決定の部分を大きく分類すると、その意思決定を人間が行うのか、計算機が行うのかの2通りがあると考えています。
前者が昔からよく行われているデータ分析で、後者がAIに当たります。
yentaで使われているレコメンドロジックは後者のAIなのですが、僕が普段やっている分析(Greenの各種分析と、wevoxのアンケートデータの分析)は前者に当たります。
今日お話するのは、前者の、人間の意思決定をサポートするデータ分析についてです。
(後者については、解釈可能性の重要度は前者より劣る等、あれこれ違うところがあると思います。今回はその話はなしにしましょう。)
なにやら数学博士が会社に入ってきたぞ!ということで、入社前後から、あれこれデータ分析の依頼を受けていました。
そこでのやり取りは、こんな感じでした。
依頼主「◎を増やしたいんだけど、△、□、×のどの要素が大事かな?」
僕「重回帰分析かけたら偏回帰係数が1.2、0.3、23でした。最初の2つは有意水準5%で優位です」
依頼主「???」
僕「あ、えっと、△を1増やすと◎が1.2増えて、□を1増やすと◎が0.3増えるってことです。×の場合は、◎との関係性はあるかどうか分かりません」
依頼主「?????」
僕「?????」
笑わないでほしいのですが、これで僕は依頼された分析をちゃんとやったつもりでいました。
その後も、このデータの分析結果が数学的にどういう意味を持つかについて説明してみたり、そもそも重回帰分析が何をしているのかを説明してみたり、そんなことをしていました。
長らく働いていて僕は、自分が暗黙のうちに仮定しているものがあり、そしてそれが間違っていることに気づきました。
その仮定とは、
ある正しいモデルが存在し、それに正しいデータを与えて得られた分析結果を見、それに従った意思決定を行うのが最良である。
というものです。
この観点に立つと、そもそも、「この分析に使っているモデルは考慮できている変数が足りないから実際の意思決定には使えないな」と思ってしまい、断言を避けがちになり、「このモデルは完璧じゃないからこれに従ってもうまくいくとは限らないよ」とか言っちゃったりします。
また、逆に分析に自身がある場合、「このモデルが結構正しいんだから、出たデータの通りにやればいいじゃん」と思った末、相手がモデルの結果をうまく解釈してくれない場合には、どういうロジックを組んで計算しているかとか、どういう理由で数学的に正当かと説明しにかかったりしてしまいます。
つまりちょっと前の僕です。
まぁこういう態度だったので、所謂、「頭はいいけど仕事しづらいし使えないやつ」だったんだろうなぁとか思ったりするわけです。黒歴史ですね!
今にして思えば、これでは、依頼されたものに対する回答として噛み合っていません。
この例の場合、依頼主はそもそも、「どの要素が大事か」と聞いています。つまり、何を注視すべきか、何に注力すべきか、その手の意思決定をしたい場面において、データ分析の力を借りようとしていたのだと思います。
であれば、いまの僕なら、このように答えます。
依頼主「◎を増やしたいんだけど、△、□、×のどの要素が大事かな?」
僕「分析してみた結果、△と□を増やすと効果がありそうで、×はそこまででもないらしいです。分析上はそういう結果が出たのですが、実務上の肌感と合いますか?」
結局のところ欲しいのは、データ分析という観点で物事を見ると、どのような意見になり得るのか、それはなぜかです。実際の意思決定は、いろんな観点から物事を見て、総合的に判断する事になります。ですので、1つのデータ分析を行い、その結果に従うなんてありえません。判断材料としてみている観点の1つにデータ分析を加える。これが関の山だし、これ以上を求めるべきでもないと思っています。
上記のような返答からディスカッションをはじめて、解釈可能で納得感のある理解に至ったり、至れなかったり。データ分析官は、そういうことをすればいいと思っています。
さてさて。
ここまでがーっと語ってきましたが、僕が最初に書いた:
- データ分析は、人間が行う意思決定に供する目的で行う場合、その意思決定に役に立つものでなければならない
- その文脈において、データ分析は意思決定のためのいちツールであって、万能な解決策を与えるものではない
- データの分析結果が出たあと、それを見て頭で考える必要があるし、逆に、データの分析結果は、解釈可能で、まともに考える材料になる必要がある
と考えているのは上記のような理由があってのことです。
いかがでしょうか。
みなさんが実務でデータに触れている際の肌感覚に合いますでしょうか?
最後に、ちょっと宣伝します。
黒歴史時代(?)に、せっせと作っていたものがあります。
Greenのデータを用い顧客のLTVを推計しつつ、アドエビスにためている広告接触履歴データによって可能となったattribution分析を搭載した、最強の(!)広告評価システムです。
なんとそれを目に留めていただきまして、AD EBiS Partner Forum 2017 in Autumnでの講演の機会をいただきました。
僕の人生の裏ミッションに、博士人材がちゃんと「使える」ということを証明しにかかるというのがあるのですが、まぁまぁ、滑り出しとしては悪くないかなとか思ったりしていたりします。
それではまた、次にお会いする機会まで。
最近のコメント