teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

3

edit

2018/07/05 23:21

投稿

mkgrei
mkgrei

スコア8562

answer CHANGED
@@ -4,7 +4,7 @@
4
4
  予測しようとしているデータの分布によるんじゃないですか?
5
5
 
6
6
  もともとlogで分布しているものから平均と分散をいじっても正規分布にならないじゃないですか。
7
- モデルに学習させるときに正規分布が必要なので。
7
+ それでも、モデルに学習させるときに正規分布が必要なので、うまい変換を施します
8
8
 
9
9
  x=e^xの変数変換の末に標準分布になるケースがある、ということなら納得できますか?
10
10
 

2

edit

2018/07/05 23:21

投稿

mkgrei
mkgrei

スコア8562

answer CHANGED
@@ -6,4 +6,24 @@
6
6
  もともとlogで分布しているものから平均と分散をいじっても正規分布にならないじゃないですか。
7
7
  モデルに学習させるときに正規分布が必要なので。
8
8
 
9
- x=e^xの変数変換の末に標準分布になるケースがある、ということなら納得できますか?
9
+ x=e^xの変数変換の末に標準分布になるケースがある、ということなら納得できますか?
10
+
11
+ ```python
12
+ import numpy as np
13
+ from numpy.random import lognormal
14
+ import matplotlib.pyplot as plt
15
+ fig, (ax1, ax2, ax3, ax4) = plt.subplots(4, 1)
16
+
17
+ s = lognormal(size=1000)
18
+ ls = np.log(s)
19
+ ns = (s - s.mean()) / s.std()
20
+ nls = (ls - ls.mean()) / ls.std()
21
+
22
+ def p(ax, s):
23
+ ax.hist(s, bins=np.linspace(s.min(), s.max(), 100))
24
+ p(ax1, s)
25
+ p(ax2, ns)
26
+ p(ax3, ls)
27
+ p(ax4, nls)
28
+ plt.show()
29
+ ```

1

edit

2018/07/05 23:20

投稿

mkgrei
mkgrei

スコア8562

answer CHANGED
@@ -1,4 +1,5 @@
1
1
  https://www.kaggle.com/yww061851/data-preprocessing
2
+ http://forums.fast.ai/t/data-pre-processing-for-the-input-having-very-small-values/13656
2
3
 
3
4
  予測しようとしているデータの分布によるんじゃないですか?
4
5