数学嫌いのための機械学習入門書 | [書評]ITエンジニアのための機械学習理論入門
はやりの機械学習は数学知識が必須
以前、別の機械学習の本を読んだのですが、数式のオンパレードで、ちんぷんかんぷんでした。高校の理系数学全部勉強した知識がないと理解できないレベルでした。私は理系でしたが、完全に頭から消えていますのでアウトです。
しかし、本書は、タイトルに「理論入門」とあるように、入門書です。一般的なITエンジニアで、少し頑張って数式を理解できれば、機械学習の仕組みも理解できるようになっています。一応本書の中では、「大学初等程度の数学の知識」が必要とはされています。
機械学習の「バイブル」を読破するための入門書として
サンプルプログラムがダウンロードできますがPython用のみです。本書で学習した成果を試すにもまずはPythonが早いと思います。ただし、Pythonの勉強が主題ではありませんので、サンプルを見ながら機械学習の方法を勉強して、必要に応じてサンプルをいじって試すので、良いと思います。
本書の「本書が対象とする読者」の項目で、次のように書かれています。
本書では、「データ分析結果をビジネス判断に役立てる」という観点から、各種のアルゴリズムの解説を進めます。機械学習のツールやライブラリーの使い方を説明した書籍ではありませんので、その点はご注意ください。
また、機械学習の世界で「バイブル」と言われる「パターン認識と機械学習 上・下」が難しすぎてわからなかった方のために
この「バイブル」を読破するための入門書として、本書を活用していただくこともできるでしょう。
と書かれています。
本書の冒頭には使用する数学記号と公式の説明があります。続いて、データサイエンスと機械学習について書かれています。その後、7つのアルゴリズムについて、理論の説明と、サンプルによる実験が書かれています。
サンプルは、CentOS 6、Mac OS X、Windows 7,8それぞれで動かすまでの手順が書かれていますので、問題なくみなさん動くと思います。私は、CentOS 6で試しました。
機械学習アルゴリズムの考え方が理解できる
一番面白かったのは、「第7章 EMアルゴリズム:最尤推定法による教師なし学習」ですね。NHKの番組で見たことのある、数字の「3」の手書きのいろいろなパターンを学習し、「3」を分類するもの方法が出てきます。手書き文字データの入手方法も書かれていますので、実際に試すことができます。
本書には、多くの機械学習アルゴリズムが解説されていますが、それぞれのアルゴリズムがどのような仕組みでルールを作ったかを知らなければ、ビジネスには適用できないと書かれています。データサイエンティストは、アルゴリズムをライブラリー的に知るだけでなく、その内容、数式も理解しなければならないと著者は述べています。
初めて機械学習を学んでみたい人に
機械学習を学んでみたい人にまずオススメです。簡単にサンプルが動かせますので。サンプル動かしてみるだけでも面白いです。ただし、文章、数式に誤記がありますので、サポートサイトは見てください。