2009年5月23日土曜日

統計的推測について専門家以外に説明するには

たしか今の研究室に研究生としてお邪魔し始めた頃、伊庭先生の講演をお聞きする機会があり、
  • ベイズは事前条件と事後条件をひっくり返すことができるのが偉い
  • SVMの現状はいわばカーネルしおまねき、カーネルが大きくなり全てその中に隠蔽されている
という趣旨のお話をされていました。印象深かったので今でも覚えています。(この後の話に関係するのは後者だけですが)

一方、IEEE ICDM 2006のデータマイニングアルゴリズム TOP10 (鹿島さんの昔の日記など参照) を見たときの自分の感想は「比較的わかりやすいものが出てくるのだな」でした。

これを踏まえると、専門家以外の人のこの手の技術に対する感覚は、
  • よくわからないからとにかく入力を入れれば何らかの出力が出てくるものだけ使おう
  • よくわからないから直感的にわかるものだけ使おう
なのだろうと思います。

そんな状況で、専門家以外にこの手の説明をする際には、どういう風にすればよいのか、最近よく悩んでいます。「これはアンタがわからないぐらいすごいんだ」以外の見せ方がないものかと。どこを隠蔽してどこを隠蔽しなければ興味を持ってもらって納得してもらえるか。高校数学もおぼつかない人に説明する場合もあって、かなり厳しい。

蛇足ですが、そんなこともあって、先日の30歳の転職話の最後につながっているわけです。数学も英語もプログラミングも苦手意識があるのですが、他人と相対比較すると「そこまで出来ないわけではない」という気が最近してきました。すごく出来るわけではないですが、苦手だったにしてはましな方なのではないかしら。知らない間にそれなりの高等教育を受けていたのだ、とたまに実感します。

2 件のコメント:

しましま さんのコメント...

以前 http://sigdmsm.org/007/discussion.html なことをしたことがあります.
で,データを持ち込んでくる人は,許容できる結果がでれば,当然手法には無関心になると思います.「あなたのデータはこんな性質があるから,この手法のこんなところがいいんです.」という感じでないと食い付いてくれないんじゃないでしょうか?例えば,「ベイズだったら,モデルが複雑ぎみで,データが少なめだから使えそうですよ」といった風で説明を始めたらいいのではと思います.

> 「比較的わかりやすいものが出てくるのだな」
このあたりは性質がよく調べ尽くされているので,みんなデータの性質をさぐるプローブみたいな感じで,とりあえずまず使うのだと思います.

kaorif さんのコメント...

エンジニアの人ならその説明で結構いけるんですけど、エンジニアリングにも興味がない普通の人や、偉いめの人は、データの性質にも驚くほど無関心なんですよね……。あとは、コイン投げを2回したら必ず表と裏が1回ずつ出る、みたいな。

こつこつ事例を集めて説得するしかないかな、と今のところは思っています。