質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

ヒカラボ 尾崎

エンジニアの皆さんにデータ分析言語にして開発実行環境である「R」を用いて 実際にデータを分析しながら、データサイエンスを分かりやすく習得してもらうことを目指した実習コースを開講いたします。

Q&A

解決済

1回答

4372閲覧

e1071パッケージのSVMのチューニングが終わらない

Agent_P

総合スコア14

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

ヒカラボ 尾崎

エンジニアの皆さんにデータ分析言語にして開発実行環境である「R」を用いて 実際にデータを分析しながら、データサイエンスを分かりやすく習得してもらうことを目指した実習コースを開講いたします。

0グッド

3クリップ

投稿2015/02/05 14:03

Rのe1071パッケージを用いて、
サンプルサイズ10,000で変数の数が10個ほどのデータセットに関して、
SVMで2値の分類予測を行おうとしています。

サポートベクトルを求める計算自体は数分くらいで終わるのですが、
チューニングを行う際に、何時間もかかってしまい終わりません。

どのようにすれば、SVMのチューニングを効率的に行うことができるのでしょうか。

ちなみに、クロスバリデーションは20にしています。

PCのスペックはメモリ8GBで、プロセッサはCore i3です。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

悩ましいところですね。{randomForest}パッケージのtuneRF関数であれば自動的にCVサンプルサイズを絞ってやってくれますが...

ということで、crossパラメータをいじってもどうにもならないようであれば、

そもそもパラメータチューニング用にサンプルサイズを絞った部分サンプルを作る

というやり方はいかがでしょうか。つまり、目的変数の割合が等しくなるように部分サンプルを抽出し(例えばYes/No比率が元データでは3:2なら抽出してきた部分サンプルでも3:2になるようにする)、これに対してチューニングを行うというもの。多少最適値からは外れるかもしれませんが、今回の場合500サンプルぐらいまで絞れればそこそこいけるのではないかと思います。

投稿2015/02/06 01:28

TJO

総合スコア106

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問