肉とビールとパンケーキ by @sotarok

少し大人になった「肉とご飯と甘いもの」

PHPカンファレンス2013 で「PHPerのためのデータサイエンス入門」という話をしてきました #phpcon2013

先日 9/14 に行われた PHP カンファレンス2013 で「PHPerのためのデータサイエンス入門」という話をしてきました。

データサイエンスというと、おそらく、キモになるところは「モデリングと効果測定のところ」ではないかと僕は思っているのですが、実はデータサイエンスの守備範囲は非常に広く、扱う領域、知識の幅を必要とする分野です。特に、データサイエンスの領域はエンジニアリングの領域のみならず、ビジネスの領域も含むと思います。データを分析し、ビジネスに使える結果・モデルをどう得るか、それを出すためには、どういった結果が、ビジネスに効いてくるのか、それがわからなければいけません。エンジニアリングからビジネスまで、という領域に対して、業務上、コミットできる人は、世の中にそう多くは無いと思います (だからこそ、データサイエンティストというのは稀有な存在であり、今最も注目を集めているのでしょうね)

さて、そんな前置きはともかく、そうはいって、PHP で扱う領域は、主に、Web アプリケーションです。
Web アプリケーションを作る、というのは、サービスを作る、つまりそれはビジネスを作ることです。(まれに、楽しければそれで良い、という人もいるかとは思いますが、それはまた真かと思います。しかし、殆どの場合、それは長続きしないでしょう)

我々が日々開発をするアプリケーションにおいて、何を達成したいのか、それを使う人がどのように使ってくれるのか、どう使ってくれると、我々が達成すべきものに近づくのか、それを考えることは、いちエンジニアにとっても非常に重要なことです。
その足がかりとなるのが「自分の作ったアプリケーションを利用してくれるユーザの行動を分析する」ということになるかと思います。

データを分析する...
それを聞くと、一見、非常に難しく、専門的な知識を必要とするように思えるかもしれません (当然、突き詰めると、計算幾何学や統計的解析手法の知識が必要となる場面もあるでしょう)
しかし、データからユーザの行動を表したり、あるいはモデル化したりすることは難しくても、まず、自分たちのアプリケーションをどうのうにユーザが利用しているのか、知る手がかりを得ることは実は、簡単なことです。

その、まず第一歩を踏み出すための、入門の入門としてのお話をさせていただきました。

うん、なんかすでに文章なげえ。


ようするに「PHPer だろうが、手軽にデータ分析はじめてみようぜ」ってことなんですよ。

資料と補足

発表資料はこちら。


なぜ Treasure Data か

Treasure Data http://www.treasure-data.com/

正直、発表内容は、TD ありきです。
むしろおもいっきり宣伝しています。ちなみにお金は一切いただいておりませんw ステマのつもりはなくて、単に素晴らしいプロダクトをみんなに使ってもらいたいと思っているから紹介しています。

ちなみに、自社内でデータサイエンスチームを持ち、Hadoop エンジニアがいるような方 (会社) はターゲットから外れるかと思います。
本講演では「そんなリソースは無い」「Hadoop クラスタ管理したくない」「ログデータ収集とか作ってられない」それでも分析をしたい!というユーザに対しての1つの方法として、TD を提案しています。
(当然ですが、重要なログデータをどこまで他社サービスに載せられるかというところに関しては、一定の判断を要することになるかとは思います)

つまり、サービス開発を行い、ユーザのデータ分析を行う際に、データの集め方を考えたり、ストレージの増設に追われたり、Hadoop クラスタの管理に追われたりすることは、まったく本質的なビジネス活動とは程遠いところにあるため、リソースを持たない小さな会社でどれだけエンジニアの工数をそこに割くのか、という話なのです。

そんなコストを払わずに、誰かがやってくれるなら、任せてしまいたくありませんか?

我々は、本質的に、自分たちのアプリケーションに必要な開発に、より多くのコスト (エンジニアのリソース) をかけるべきだと思います。



だから、Treasure Data なのです。


(ちなみに、まぁ自社内で Hadoop クラスタを管理したり、データを貯めこんだりすることが本質的に必要な場合もあるでしょう。それはそういった場合があると思いますので、そういうエンジニアすべてを否定する意味ではありません)

あとがき

... なぜか後半無駄に熱く語ってしまいましたが、少しでも、思いが伝わればと思います。
PHP においてどういったフックポイントでどうログを投げるか、今回はあまりコードを用いて説明できませんでしたが、それもまた、機会があればブログにでも書きましょう。


さて、そういうわけで。
参加された皆様、Ust 参加の皆様、僕の発表を聞いてくれた皆様、ありがとうございました。
スタッフの皆様、お疲れ様でした!


PHPカンファレンスFacebookページもあるのでいいね!してね: