🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

748閲覧

Tensorflowを用いたDeepLearningで、入力値・出力値が正規化しにくい場合の対処法を知りたいです

fdaskjlfda

総合スコア40

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/09/19 11:52

環境

tensorflow
python

質問したいこと

例えば、「降水量」、「曜日」、のデータから、「タクシーの利用数」を予測する深層学習のmodelをtensorflowで作りたい場合(深層学習である必要性は薄いですが、深層学習について質問したいのでこの例でお願いします)、入力値と出力値をどうするのがよいかがわかりません。

降水量

0~1に正規化するときに、正規化した値が1のときの降水量をいくつにするかを迷います。
今考えている方法を3つ挙げます。

  1. 過去最高の降水量にする。

問題点:今後それを超えたときに、正常に動作するかが僕にはわかりません。
2. 過去最高の降水量を仮に90とすると、正規化した値が1のときの降水量を95とする。
問題点:正規化した値が1のデータがない
3. 入力値を[降水量が0, 0<降水量<50, 50<=降水量<100, 降水量>=100, 曜日]とし、それぞれ正しいときに1,正しくないときに0とする
問題点:データのもっている微細な情報が消える・人がタクシーに乗るかのボーダーの降水量とこの分けたしきい値がおそらく一致していない
こういう値を正規化する手法はあるのでしょうか?

曜日

各曜日にそれぞれ、0, 1/6, 2/6, ... ,6/6の値を振り分けるか、
入力データを[降水量, 月曜日, 火曜日, ... , 日曜日]のようにし、
月曜日のときは、
[降水量, 1, 0, 0, 0, ... ,0]
火曜日のときは
[降水量, 0, 1, 0, 0, ... ,0]
のようにするかのどちら(または別の)手法が一般的かを知りたいです。

タクシーの利用数

降水量と同じです

その他

よろしくおねがいします

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

数値データは学習データに基づいて標準化(平均0, 分散1にする)するのが無難かと思います。この場合0~1には当然なりませんが、それで特に問題もありません。

曜日は名義尺度なのでone-hot表現を使うことになると思います。

投稿2019/09/20 01:47

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fdaskjlfda

2019/09/20 02:25

標準化を全く知りませんでした! ありがとうございます
guest

0

正解はないのであなたが考える仮説で色々試すしかないと思います。
先ずはデータを分析して仮説を立てて評価するのがベストでは?

投稿2019/09/19 22:28

nandymak

総合スコア799

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fdaskjlfda

2019/09/20 02:26

いろいろ試してみることにします ありがとうございます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問