機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。
Q&A
解決済
1回答
3282閲覧
総合スコア369
0グッド
0クリップ
投稿2019/01/10 15:12
0
機械学習、回帰問題等で用いられるRMSEとMAEについてなんですが、ネット上の記事を見ていると、RMSEはルートの中身で二乗しているから外れ値の影響を受けやすい、と書いてあるのですが、どちらかといえば、データ数であるNがルートの中に入っているのが原因では?と思うのですが、いかがでしょうか?
参考ページ
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答1件
ベストアンサー
最尤推定の観点からコメントします。 RMSEを最小化するということは誤差が正規分布していることを仮定した最尤推定と一致します。一方、MAEを最小化するということは誤差がラプラス分布に従っていると仮定した最尤推定と一致します。 このラプラス分布は、正規分布と比較して分布の裾野が広いため、外れ値の影響を受けにくい構造になっています。 試しに30個の正規分布から生成したデータに1個の外れ値を混ぜたものをもとに期待値の最尤推定を行うと、正規分布を仮定したケースであると真の値よりズレた結果になります。それに対し、ラプラス分布を仮定すると真を値に近似した結果が得られました。つまり、外れ値が含まれるデータをもとに作成したモデルを評価する場合は外れ値の影響を受けにくいラプラス分布仮定のMAEのほうが真の誤差に近似するということになります。
結論として、RMSEが外れ値の影響を受けやすいのは誤差が正規分布に依存している仮定のもとで推計しているからと考えます。
このあたりの詳しいことは以下が役立ちそうなので紹介します
https://funatsu-lab.github.io/open-course-ware/basic-theory/accuracy-index/
投稿2019/01/11 05:47
総合スコア3376
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.48%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
RMSEとMAEについて
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。