フリーのデータマイニングツールはいくつかありますが、そのなかでも一番メジャーなのはWekaでしょうか。
このWekaは、いくつかの国内の書籍でも紹介されていて、それを参考にして使うことができます。
[amazonjs asin=”4627852118″ locale=”JP” title=”フリーソフトではじめる機械学習入門”]
[amazonjs asin=”B018VAV29I” locale=”JP” title=”知りたい分かりたい人の体験する機械学習”]
しかし、個人的に注目しているのは、こちらのツールです。
Orangeという名のデータマイニングツールです。海外でもまだこちらが書かれている書籍はなさそうなのですが、PythonのディストリビューターあるAnacondaからも呼び出せるようになっていて、Pythonとの連携が強そうです。
このOrangeを評価してみたいと思います。
こちらからダウンロードできます。
説明のチュートリアルはこちらにありますが、これはすごいです。
13パートの構成になっています。
- Welcome to Orange
- Data Workflows
- Widgets and Channels
- Loading Your Data
- Hierarchical Clustering
- Making Predictions
- Model Evaluation and Scoring
- Add-ons
- Principal Component Analysis
- Feature Scoring and Ranking
- k-Means
- kMeans Explained
- Silhouette
という13パーツでの説明動画があります。
これを見れば、使い方はわかります。
今後、いろいろと情報を提供していきたいと思います。
よろしくお願いいたします。