質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • 機械学習

    684questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • 深層学習

    146questions

  • Chainer

    144questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

Chainerの重みの初期値についてです。

受付中

回答 0

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 692

Hayato1201

score 92

モデルの学習の際にloss関数の値がずっとnanのままなので何が問題か遡って見ていたのですが、ネットワークのモデルの設定の際に重みの初期値がNoneになっていてそもそも学習がされてない様でした。 Chainerはあまり使った事がなく慣れていないのですが、今作業しているOSSのプログラム上は以下の様になっていました。

L.Linear(n_in, n_out, initialW=wscale)

wscaleは0.1になっています。これで0.1までの範囲で重りがランダムに生成されるという事だと思うのですが、デバッグして見てみると重りはnanになってしまっている様です。これはどうしてでしょうか? 

Linearの中で以下の様に

self.W = variable.Parameter(W_initializer)

なってここでself.Wの表示させるとW(None)となっていてこの時点でNoneなのですがこれも問題なのでしょうか・・・?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.51%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 受付中

    python pkg の Convolutional Neural Network のコード (Ch...

    python の pkg にある fcn のコードについて分からないことがあり質問させていただきました。pip install fcn でインストールできる以下のコードに h =

  • 解決済

    list index out of range のエラー修正

    コード import numpy as np import chainer from chainer import cuda,Function,report,training,ut

  • 受付中

    chainerでDCGANを行いたいがエラーが発生

    chainerでDCGANを行いたく、以下の公式のchianerをダウンロードしました。 https://github.com/chainer/chainer/tree/maste

  • 解決済

    chainerのNStepLSTMを使う際、backwardを呼んだときにエラーが出る

    前提・実現したいこと chainerのNStepLSTMを用いて分類器を作成したいのですが、backwardを呼んだときにエラーが発生してしまい上手くいきません。 最終ステップの出

  • 解決済

    chainerでのin_types[0].shape[1] == in_types[1].shape...

    前提・実現したいこと chainerで作成したモデルを読み込みたいのですが、 Expect: in_types[0].shape[1] == in_types[1].shape[1

  • 解決済

    Pythonのlist.sort()でエラー

     前提・実現したいこと 技術評論社の「はじめての深層学習プログラミング」に沿って深層学習を勉強中です。 同本の80ページにあるサンプルプログラムをそのまま書き写しています。  

  • 解決済

    Pythonの文法について

    x = x[None, ...] この処理は一体どのようなものなのでしょうか? Chainerの勉強において、推論を行うために入力をミニバッチの形にするとあったのですが、Pyth

  • 受付中

    AttributeErrorについて質問です。

     前提・実現したいこと ディープラーニングについて勉強したいと思い公開されていたプログラム(MNISTデータの正解数と正解率を出すプログラム)を実際に動かそうとしてみたら以下のエラ

同じタグがついた質問を見る

  • 機械学習

    684questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

  • 深層学習

    146questions

  • Chainer

    144questions

    Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。