2009年7月6日月曜日

記述と推測

かしまさんの仰る「分析的データ解析」と「予測的データ解析」は統計の言葉で言えば記述統計と推測統計であるように思います。

私の印象では、「統計」と言うとサンプルなり統計量なりがとにかく正規分布に帰着する話(渡辺研的には統計的正則モデル)をメインに扱う一方、「機械学習」と言うと良くも悪くもいい加減。悪くというのは理論的にわからないものも多いという意味で、良くというのは逆に厳密な理論に縛られず実用的に使えるという意味で。

2 件のコメント:

しましま さんのコメント...

kashi_pong さんが指摘されている「分析的データ解析」と「予測的データ解析」とも関連がきっとありますね.
http://www.geocities.co.jp/Technopolis/5893/research_diary-2009.html#20090703
※ 私は "analytical" より,探索的 "exploratory" の方がしっくりきます.

主観的な仮定はデータ分析には必ず必要で,真に客観的・帰納的だと事実の列挙にしかならないと思います.
※ iidなんて絶対成立してるはずないし
※ 言ってしまえば,事実が「存在する」ことすら主観だし
なので,仮定の多少で線引きをするのは,あまりクリアな分類にはならない気がします.

fuj さんのコメント...

統計は歴史が長いので「ここまでだったら使う人が殆ど何も知識がなくとも、何も考えずに使えますよ」という部分が切り出せている一方、機械学習は「玄人が使うと色々できるけど、ちゃんと理解していない人が使うと大ポカやらかしそう」という感覚が個人的にはあるんですね。特に分類をしたかったわけでもないのですが、あえて言えば「素人を含めた、使う人にとってどうなのか」という視点で見ていたのかもしれません。

どの分析方法(仮定)がより有用かは問題依存だと思うので、「対象とする問題全体にとってどのぐらい良いのか」という比較は意味がないと私も思います。