e1071パッケージのSVMのチューニングが終わらない

Rのe1071パッケージを用いて、
サンプルサイズ10,000で変数の数が10個ほどのデータセットに関して、
SVMで2値の分類予測を行おうとしています。

サポートベクトルを求める計算自体は数分くらいで終わるのですが、
チューニングを行う際に、何時間もかかってしまい終わりません。

どのようにすれば、SVMのチューニングを効率的に行うことができるのでしょうか。

ちなみに、クロスバリデーションは20にしています。

PCのスペックはメモリ8GBで、プロセッサはCore i3です。

行動規範の内容に同意します

回答1件

ベストアンサー

悩ましいところですね。{randomForest}パッケージのtuneRF関数であれば自動的にCVサンプルサイズを絞ってやってくれますが...

ということで、crossパラメータをいじってもどうにもならないようであれば、

そもそもパラメータチューニング用にサンプルサイズを絞った部分サンプルを作る

というやり方はいかがでしょうか。つまり、目的変数の割合が等しくなるように部分サンプルを抽出し（例えばYes/No比率が元データでは3:2なら抽出してきた部分サンプルでも3:2になるようにする）、これに対してチューニングを行うというもの。多少最適値からは外れるかもしれませんが、今回の場合500サンプルぐらいまで絞れればそこそこいけるのではないかと思います。

投稿2015/02/06 01:28