質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

2回答

2361閲覧

二つのモデルの精度を比較したい

makioo

総合スコア28

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2019/05/06 12:04

現在、ランダムフォレストとxgboostを用いて多値分類を行っています。それぞれの評価関数としてはf1_score(avarage = 'micro')を用いています。
ここで、この二つのモデルの精度に差があるかないかを調べたいのですが、良い統計の方法はあるでしょうか。
自分が思いついたこととしては、これ以外にもいくつかの評価関数を用いてそれらについてt検定を行うということを考えたのですが、この結果に差があった場合、精度に差があると判断しても良いでしょうか?
これ以外にも二つのモデルの精度について比較する方法があれば教えていただきたいです、

 よろしくお願いします、

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

解決済みですが、コメントします。
t検定は比較対象群が正規分布に従っていることが前提になります。よってF1_scoreが正規分布に従っているという確証がないのであればt検定以外の方法を使ったほうが正しい結果が得られると思うべきでしょう。ただ、これは教科書的な見解で、割り切ってt検定を使って構わないと思います。(絶対に間違った結果になるわけではないので)

ちなみに、私はt検定を使わない可能性が高いです。最大の理由はf1値は0以上1以下という制限があるので、平均と分散の組み合わせによってはこの範囲外を取る可能性がそこそこある確率分布になり、実態に合わないためです。

代わりにモンテカルロシミュレーションを活用した評価をします。f1値にこだわるのであれば、各学習器のアウトプットである混合行列を多項分布とみなして確率分布の学習をさせた後、乱数生成->f1値計算->f1値の差違計算というプロセスを1万回くらい繰り返します。これによって、ふたつの学習器のf1値の差違の分布が得られるので、任意の方法で評価すればいいことになります。

投稿2019/05/07 15:41

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

検定に使う評価指標をF1値のマクロ平均にすると決めたのであれば、使う評価指標はそれだけです(その選択が妥当かどうかはご自身でよく検討してください)。

検定は対応のないウェルチのt検定がもっとも一般的、かつ無難です。

交差検証とかを回していると思うので、データのランダムな分割とか、モデルのrandom_stateなどをあれこれ変えながら(再現性のために記録すること)、それぞれのモデルで「たくさん」回します。

「たくさん」は見積もる方法があるので、「t検定 サンプルサイズ」とかで検索しておおよその目安をつけておいてください。

最終的に2*「たくさん」の評価指標が得られたら、あとはウェルチのt検定で2群間の平均に差があるかどうかを検定してください。

投稿2019/05/06 12:58

編集2019/05/06 13:10
hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

makioo

2019/05/06 14:19

なるほど、サンプルを分割すればいいんですね。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問