2009年3月20日金曜日

パターン認識と機械学習

職場の若手有志で数ヶ月前から、週1回1時間、ビショップ先生の「パターン認識と機械学習」の輪講をしています。たまたま最年長なので、どちらかというと解説する側に回ってます。あ、笑うな、そこ。

私の職場は研究ではなく応用なので、数式が出てきても、自力で式を解くことより「この式が何を意味しているか」を理解することだけをまず念頭におきつつ、

  • What これは何であるか
  • How どのように問題を解くか
  • Why 何が良いのか
  • When[Where] どのような場合に使える(使えない)と想定するべきか

をわかる範囲で、なるべく平易な日本語や図で説明するようにしています。機械学習を専門でやってきた人以外にも解説することを念頭に置きながらこの本を読んでみると、1ページ1ページの情報が多く、非常に手強くて、ぐだぐだな解説をすることもしばしばあり、毎回反省しています。

この本を勉強することですぐに実務にフルに役立つかと言われれば、個人的にはYesとは言えないと思っています。でも、こういった本を学んでデータ解析の基礎力をつけるのは、アルゴリズムとデータ構造の授業で、例えば単純ソートとクイックソートを習うことを通して、状況に応じたアルゴリズムの選択と、計算量を意識したプログラミングを身につけたのと同じだと思うのです。

実際は、ソートを自力で書く場面は、そう多くない(少なくとも私にはなかったです)のですが、基礎を通して身につけた地力があるかどうかって、いざというときに差が出ると思うのです。自分が身につけられているかどうかは棚に上げますが……。



…あれ、amazonでは定価が出てないんですけど、もしやもう上巻刷らないんですか??

2 件のコメント:

匿名 さんのコメント...

翻訳者の一人です.とりあげていただきありがとうございます.

> …あれ、amazonでは定価が出てないんですけど、もしやもう上巻刷らないんですか??
第4刷の印刷が終わったようです.数週間のうちには書店に並ぶと思います.


> でも、こういった本を学んでデータ解析の基礎力をつけるのは、アルゴリズムとデータ構造の授業で、例えば単純ソートとクイックソートを習うことを通して、状況に応じたアルゴリズムの選択と、計算量を意識したプログラミングを身につけたのと同じだと思うのです。

ご指摘されているように,まず一通りの方法を知っていると,とりあえず知っている方法ではなく,適切な選択ができるようになると思います.
また,入出力に外部のデータという要因がはいる機械学習では,モデリングと調整にも差がつくと思います.
0/1のの値を取る変数を,別にガウス分布でモデリングしても一応は動きますが,ちゃんと二項分布でモデリングした場合にはかないません.また,SVM のパラメータとかも,それがソフトマージンのソフト度合いであることを知っているのと,そうでないのとは全く違うと考えています.

kaorif さんのコメント...

しましま先生、コメントありがとうございます。恐れ入ります。まさかとは思いましたが、絶版ではなくて何よりです。
コメントで頂いたとおり、職場で読んでいる目的は「適切な選択」につきます。適切な選択が出来る人は社内に限らずまだまだ多くないのではないか、という印象を受けています。

この本は自分では一応一通り読んでいたのですが、他人に説明するために読み直したり、他の輪講当番の人の解説を聞いたりすると、理解がまだまだ足りないところや読み飛ばしていたところがたくさんあります。じっくり読める良書を翻訳していただき、本当にありがとうございます。