バカみたいな質問ですみません。
最近ニューラルネットワークにハマっていて過学習を利用したプログラムを作っています。
過学習を起こすことが目的ですので普通は嫌われる過学習を逆に意図的に起こす方法を探しています。
しかし、もちろん過学習のさせ方などという情報は調べた限りありませんでした。
そこで、ニューラルネットワークのパラメーターをどのようにすれば過学習が起きやすくなるのか教えていただきたいです。
ちなみにpython3.6でtensorflowとkerasを使っています。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
ベストアンサー
ニューラルネットワークのパラメーターをどのようにすれば過学習が起きやすくなるのか教えていただきたいです。
全結合層のみのネットワークで各層のニューロン数 (出力数) を大きな値にすれば、過学習すると思います。
基本的に学習するパラメータを増やして、重みの正則化などの制限もかけなければ過学習します。
追記
Pytorch で過学習の例を作ってみました。
ノイズを載せた x**2 関数を2層の全結合層で構成されるニューラルネットワークで回帰するコードを作り、中間層のニューロン数を変化させたときに、学習結果がどうなるかを確認しました。
python
1import torch 2import torch.nn.functional as F 3import matplotlib.pyplot as plt 4 5 6class Net(torch.nn.Module): 7 def __init__(self, n_feature, n_hidden, n_output): 8 super().__init__() 9 self.hidden1 = torch.nn.Linear(n_feature, n_hidden) 10 self.hidden2 = torch.nn.Linear(n_hidden, n_hidden) 11 self.predict = torch.nn.Linear(n_hidden, n_output) 12 13 def forward(self, x): 14 x = F.relu(self.hidden1(x)) 15 x = F.relu(self.hidden2(x)) 16 x = self.predict(x) 17 return x 18 19 20def train_and_show_result(x, y, n_hidden): 21 net = Net(n_feature=1, n_hidden=n_hidden, n_output=1) 22 optimizer = torch.optim.Adam(net.parameters()) 23 loss_func = torch.nn.MSELoss() 24 25 for t in range(1000): 26 # 順伝搬する。 27 prediction = net(x) 28 29 # 損失関数の値を計算する。 30 loss = loss_func(prediction, y) 31 32 # 逆伝搬する。 33 optimizer.zero_grad() 34 loss.backward() 35 36 # 学習する。 37 optimizer.step() 38 39 # 学習したモデルの予測結果 40 x2 = torch.unsqueeze(torch.linspace(-5, 5, 100), dim=1) 41 y2 = net(x2).detach().numpy() 42 43 # グラフを表示する。 44 fig, ax = plt.subplots() 45 ax.set_title(f"n_hidden={n_hidden}") 46 ax.scatter(x, y) # 学習データをプロットする。 47 ax.plot(x2, y2, "r") # 学習したモデルの予測結果をプロットする。 48 ax.grid() 49 plt.show() 50 51 52# サンプルデータを生成する。 f(x) = x^2 + noise 53torch.manual_seed(1) 54x = torch.unsqueeze(torch.linspace(-5, 5, 20), dim=1) 55y = x ** 2 + 10 * torch.rand(x.size()) 56 57 58for n in [100, 500, 1000]: 59 train_and_show_result(x, y, n_hidden=n)
パラメータを増やせば増やすほど、モデルの自由度が高くなり、ノイズつきの学習データに fit しすぎて、過学習していることがわかるかと思います。
投稿2019/12/26 09:16
編集2019/12/26 10:00総合スコア21956
0
ニューラルネットワークに限らず学習データ数に対するモデルの自由度が高すぎるときに起きる現象なのでそのように設定すればよいかと思います。
簡単な例を挙げるとXY平面上のM個の点をN次関数でフィットしようとしたとき、NがM-1以上だとM個の点がどんな点であれN次関数は絶対にすべての点を通過できてしまいます。
(N次関数のパラメータはN+1個なので)
投稿2019/12/26 09:48
退会済みユーザー
総合スコア0
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/26 09:20
2019/12/26 10:01
2019/12/26 10:35