質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

326閲覧

TensorFlow流の奇妙

leilei

総合スコア39

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/07/29 06:24

TensorFlowでコードを組む場合、所謂『計算グラフ』を作るのですけれども、
計算式の定義は皆"単一"の訓練データに対するもので、ところが、
loss関数の計算や最適化処理(学習)は本質的に複数の学習データ(eg., mini batch)に対して統計的に行わなければなければなりません。

ということは、TensorFlowが内部的にC言語のような『静的な変数』を使って
個々単一訓練データに対する計算結果を"暗黙のうち"に累積していくのでしょうか。

宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

_Victorique__

2018/07/29 06:58

誤差逆伝播はご存知ですか?
leilei

2018/07/30 11:25 編集

お返答ありがとうございます。今質問として提起したのはbatch単位での誤差逆伝播をPython+TensorFlowで具体にどういうコード表現で実現したの?という話です。見かけ上scalarや単一データ計算のようですけれども、実際はmatrixで対応しています。これに関して私は誤解しました。R.Shigemori様の御かげでクリアできました!
guest

回答2

0

要は定義するパラメーターは単一だけれども、訓練に使うデータは複数あるから、パラメータ管理はどうなっているのという質問でしょうか?

ミニバッチなどで訓練データが複数あったとしても最適化するパラメータ自体は単一です。
ミニバッチ学習でしたら、通常は出力されたloss関数の平均値を用いて勾配を求めます。

単一の計算グラフを作れば、複数のデータが流されようとも、その計算グラフの変数を最適化すればいいので、それ以上の事は何も必要ないかと思います。

質問の意図と違うのであればすいません

投稿2018/07/29 11:16

puroko3

総合スコア185

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

leilei

2018/07/30 11:30 編集

お返答と丁寧な説明有難うございます。 >単一の計算グラフを作れば、複数のデータが流されようとも、その計算グラフの変数を最適化すればいいので これに関してどうやって実現したの?という質問つもりです。 ↑のR.Shigemori様が仰った通り、Pythonの計算はmatrix向きで、 訓練データを結局matrixの形で計算式に渡され、matrix計算が行われ、batch(複数訓練データ)による更新が実現されたということですね。
guest

0

ベストアンサー

「計算式の定義は単一の訓練データに対するもの」という部分に誤解があるように思います。tesorflowのコードを見るとわかるように、データの件数は任意であり、一方のパラメータはひとつです。そして、計算グラフは、これらの複数件のデータを行列式を使って一括処理しています。その意味では「単一訓練データに対する計算結果を"暗黙のうち"に累積していく」というよりも明示的に一括で処理しているというほうが正しいかと思います。
なお、コスト関数は、この一括処理した結果の総合計をしています。その点では累積という表現は間違いではないかもしれません。

投稿2018/07/29 17:55

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

leilei

2018/07/30 11:09 編集

R.Shigemoriさん ご指導ありがとうございます。 私が誤解していたと思います。 tf.placeholder(...)の戻り値(変数)はscalarであり、それ以降の計算は全部このscalarに対して定義されるため 私はTensorFlowにおいてloss等の定義が皆 "単一データ(scalar)"に関する計算だと, 勘違いしてしまいました! まずplaceholder(...)の戻り値(変数)は計算対象となるデータそのものではないですね。 もう一つ思い込みとして、Pythonの四則計算はscalarであって、実際はmatrix対応。 ★ ところで、tf.placeholder(...)の戻り値(変数)の正体は何でしょうか、 runでパスしたデータ本体のアドレス? それとも、runで受容する変数の辞書のキーでしょうか?
R.Shigemori

2018/07/30 13:21

placeholderの中身はrunを実行する際の引数であるfeeddictです。大抵はtesorを与えるので、以降の計算グラフはtesorのまま処理を進めます。 かなりざっくりとした説明をすると、tesorflowのコードはpythonから見ると関数のようなものです。関数はそれそのものでは機能せず、mainのコードから呼ばれて機能します。この際、引数が渡されます。この引数のうち、入力データに相当するものがfeeddictです。ご存知の通り、関数の入力データは配列も許容され、大抵は全ての入力データに同じ処理が適用されます。これと同じように、tesorflowも与えられたtesorに同じ処理が適用されます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問