環境
tensorflow
python
質問したいこと
例えば、「降水量」、「曜日」、のデータから、「タクシーの利用数」を予測する深層学習のmodelをtensorflowで作りたい場合(深層学習である必要性は薄いですが、深層学習について質問したいのでこの例でお願いします)、入力値と出力値をどうするのがよいかがわかりません。
降水量
0~1に正規化するときに、正規化した値が1のときの降水量をいくつにするかを迷います。
今考えている方法を3つ挙げます。
- 過去最高の降水量にする。
問題点:今後それを超えたときに、正常に動作するかが僕にはわかりません。
2. 過去最高の降水量を仮に90とすると、正規化した値が1のときの降水量を95とする。
問題点:正規化した値が1のデータがない
3. 入力値を[降水量が0, 0<降水量<50, 50<=降水量<100, 降水量>=100, 曜日]とし、それぞれ正しいときに1,正しくないときに0とする
問題点:データのもっている微細な情報が消える・人がタクシーに乗るかのボーダーの降水量とこの分けたしきい値がおそらく一致していない
こういう値を正規化する手法はあるのでしょうか?
曜日
各曜日にそれぞれ、0, 1/6, 2/6, ... ,6/6の値を振り分けるか、
入力データを[降水量, 月曜日, 火曜日, ... , 日曜日]のようにし、
月曜日のときは、
[降水量, 1, 0, 0, 0, ... ,0]
火曜日のときは
[降水量, 0, 1, 0, 0, ... ,0]
のようにするかのどちら(または別の)手法が一般的かを知りたいです。
タクシーの利用数
降水量と同じです
その他
よろしくおねがいします
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/20 02:25