【MODELER TIPS】K-Means法の初期値


非階層的クラスター分析のK-Means法ですが、同じデータセットであっても初期値の違いで結果が異なります。

「cluster」の画像検索結果

そして、そういう特性を知って、何通りかでクラスタリングすべきなのですが、ModelerのK-Meansにはそのオプションがないんですね。

さてどうしたもんか・・・・。

どうやら、データセットの最初の1行を初期値とするようなのです。

だからを変えるためには、

初期値を変える=データセットの1行目を置き換える

 

ですので、影響度の強い変数をソートして、昇順のときはそれが最小でしょうし、降順にすると最大になると思うので、かなり対局の初期値ということになると思います。

コメントを残す