質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

2回答

1241閲覧

多分類問題において活性化関数tanhが有効な理由は何か?

_Victorique__

総合スコア1392

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2019/01/08 04:10

よく、多分類問題においてtanhが用いられていますが、どのような理由で優れているのでしょうか?

データを−1〜1に揃えた方が統計分析では扱いやすいということでしょうか?

参考

イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2019/01/08 04:18

多クラス分類では通常、出力層の活性化関数は softmax 関数が使われると思いますが、tanh が用いられてるとはどこの情報を見て言っているのでしょうか?
hayataka2049

2019/01/08 04:31

この書き方だと出力層か中間層なのかわからないです。
_Victorique__

2019/01/08 04:32

正確には出力層直前の活性化関数です。参考にリンクを貼ったサイトや、覚えていないですが他のサイトでも見た記憶があります。ちょっと探してみます。
_Victorique__

2019/01/08 04:32

中間層にあたる部分ですね
guest

回答2

0

ベストアンサー

sigmoid関数は初期に考案されたもので、1)出力が0.5付近のため、入力が0付近だとパラメーターの更新が大きくなる(結果、収束に時間がかかる)、2)ネットワークを複雑にすると勾配消失が起きる、という欠点が指摘されました。このうち1)の改善を目的に考案されたものがtanhです。したがって、質問にあるような多クラス分類だからtanhが有効というのは「そういうケースもあるかもしれない」という程度の正しさだと考えます。つまり、隠れ層の入力が0付近の場合、tanhがより有効と捉えるべきと思います。
なお、tanhで解決できなかった勾配消失問題はReLu(およびその発展型)で解決されており、人によってはReLu一択でいいというくらいメジャーのようです。(私は隠れ層が相当深くない限りsigmoidかtanhを使っています)

投稿2019/01/08 05:44

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

参考リンクを見ました。
画像自体も Height * Width * Channels 次元の特徴ベクトルと見なせますが、CNN でやっていることはこの元の画像から分類するために必要な特徴を取り出すということなので、次元削減をしていることと同じということです。

tanh を入れているのは出てくる特徴ベクトルの値を -1 ~ 1 の範囲にしたいからという理由であり、「クラス分類だから tanh がよく使われる」という結論には至らないと思います。

投稿2019/01/08 04:44

tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問