質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

1回答

6103閲覧

SVMの評価指標

退会済みユーザー

退会済みユーザー

総合スコア0

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

1クリップ

投稿2015/11/14 08:04

SVMについてです.
統計解析ソフトRにて機械学習を行っています.
このソフトに限ることではないのですが,SVMにおける

・Training error
・Cross validation error

は何を表しているのでしょうか.
調べてみたのですが,いまいちわかりません.

上記の二つを含め,SVMの精度を確認する際にはどの指標を確認したらいいのでしょうか.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

SVM の専門家では無いのであれですが、分かる範囲でお答えいたします。

Training Error は判別ルールを作るのに使ったデータに対する誤判別率、Cross validation error は、データをランダムにトレーニングデータとテストデータに分割してトレーニングデータで判別ルールを作成+テストデータで誤判別率を評価、ということを何回も繰り返した際の誤判別率の平均などです。

SVMだけに限ったことではありませんが、統計科学の手法や情報科学の諸手法で回帰や判別を行うときは手元のデータからそのデータの背景にある「真の構造を導きだす」ことや「同じ構造で生み出される新しいデータの予測」を目的にします。

しかしながら、手元にあるデータだけで回帰モデルや判別モデルを作成すると、手元のデータに含まれるノイズにも過剰に適合したモデルになってしまいます。(これを over fitting などと呼びます。)
そこで、Cross validation では手元のデータをランダムにトレーニングデータ(モデルの作成に使用)とテストデータ(モデルの評価に使用)に分けるのを繰り返して評価をし、手元のデータに過剰に適合しないようにしています。

すなわち、今回の質問である「SVMの精度を確認する際にはどの指標を確認したらいいのか」ということに関してはとりあえずは Cross validation error を確認することをお勧めします。

投稿2015/11/14 10:28

Victorian-Vat

総合スコア104

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問