load_mnistの使い方、意味

前提・実現したいこと

pythonでニューラルネットワークの勉強がしたくて、勉強本を読んでいるのですが、
わからないことがあったので質問します。
MNISTという手書きの数字のがっぞうデータセットについてです。
MNISTデータを次のように簡単に読み込むことができると書いています。

この関数どういう意味でしょうか。

python
1 load_mnist(flatten=True, normalize=False)
2

本によると、
〖load_mnistは、「（訓練画像、訓練ラベル）、（テスト画像、テストラベル）」という形式で、読み込んだMNISTデータを返します〗
と書いています。この説明を読んだうえで、つまりどういう関数なのかいまいちピントきません。
引数として、normalizeが正規化するかどうか、Flattenは１次元化するかどうかということはわかりました。
何冊か読み漁っているのですが、いつもここで詰まってしまいます。

例えば、

python
1(x_train,t_train,(x_test,t_test)= load_mnist(flatten=True, normalize=False)

だとどういう意味になりますか。

hoshi-takanori

2021/05/28 19:24

勉強本のタイトルもちゃんと書いて欲しいんですが、たぶん「ゼロから作る Deep Learning」ですよね？ https://github.com/oreilly-japan/deep-learning-from-scratch/blob/master/dataset/mnist.py#L90

meg_

2021/05/29 02:12

> 引数として、normalizeが正規化するかどうか、Flattenは１次元化するかどうかということはわかりました。では”詰まってしまい”の部分はどこでしょうか？また、「(x_train,t_train,(x_test,t_test)= load_mnist(flatten=True, normalize=False)」はエラーになります。実際のコードをそのまま提示してください。

行動規範の内容に同意します

回答1件

ベストアンサー

私は読んだことはないので、一般的方法で分かることだけ回答します。

python
1>>> print(load_mnist.__doc__)
2MNISTデータセットの読み込み
3
4    Parameters
5    ----------
6    normalize : 画像のピクセル値を0.0~1.0に正規化する
7    one_hot_label :
8        one_hot_labelがTrueの場合、ラベルはone-hot配列として返す
9        one-hot配列とは、たとえば[0,0,1,0,0,0,0,0,0,0]のような配列
10    flatten : 画像を一次元配列に平にするかどうか
11
12    Returns
13    -------
14    (訓練画像, 訓練ラベル), (テスト画像, テストラベル)

(x_train,t_train,(x_test,t_test)= load_mnist(flatten=True, normalize=False)

エラーになります。
（訓練画像、訓練ラベル）、（テスト画像、テストラベル）に合わせて括弧をつけましょう。

(x_train,t_train),(x_test,t_test)= load_mnist(flatten=True, normalize=False)

です。

normalizeが正規化するかどうかFlattenは１次元化するかどうか

分からないときはやってみましょう。

(x_train2,t_train2),(x_test2,t_test2)= load_mnist(flatten=True, normalize=True)

python
1>>> (x_train,t_train),(x_test,t_test)= load_mnist(flatten=True, normalize=False)
2>>> (x_train2,t_train2),(x_test2,t_test2)= load_mnist(flatten=True, normalize=True)
3>>> x_train[1]
4array([  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
5         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
6         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
7         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
8         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
9         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
10         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
11         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
12         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
13         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,  51, 159, 253,
14       159,  50,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
15         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,  48, 238,
16       252, 252, 252, 237,   0,   0,   0,   0,   0,   0,   0,   0,   0,
17..........
18         0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
19         0,   0,   0,   0], dtype=uint8)
20>>> x_train2[1]
21array([0.        , 0.        , 0.        , 0.        , 0.        ,
22       0.        , 0.        , 0.        , 0.        , 0.        ,
23       0.        , 0.        , 0.        , 0.        , 0.        ,
24       0.        , 0.        , 0.        , 0.        , 0.        ,
25       0.        , 0.        , 0.        , 0.        , 0.        ,
26       0.        , 0.        , 0.        , 0.        , 0.        ,
27       0.        , 0.        , 0.        , 0.        , 0.        ,
28       0.        , 0.        , 0.        , 0.        , 0.        ,
29       0.        , 0.        , 0.        , 0.        , 0.        ,
30       0.        , 0.        , 0.        , 0.        , 0.        ,
31       0.        , 0.        , 0.        , 0.        , 0.        ,
32       0.        , 0.        , 0.        , 0.        , 0.        ,
33       0.        , 0.        , 0.        , 0.        , 0.        ,
34       0.        , 0.        , 0.        , 0.        , 0.        ,
35       0.        , 0.        , 0.        , 0.        , 0.        ,
36       0.        , 0.        , 0.        , 0.        , 0.        ,
37       0.        , 0.        , 0.        , 0.        , 0.        ,
38       0.        , 0.        , 0.        , 0.        , 0.        ,
39       0.        , 0.        , 0.        , 0.        , 0.        ,
40       0.        , 0.        , 0.        , 0.        , 0.        ,
41       0.        , 0.        , 0.        , 0.        , 0.        ,
42       0.        , 0.        , 0.        , 0.        , 0.        ,
43       0.        , 0.        , 0.        , 0.        , 0.        ,
44       0.        , 0.        , 0.        , 0.        , 0.        ,
45       0.        , 0.        , 0.        , 0.        , 0.        ,
46       0.        , 0.        , 0.2       , 0.62352943, 0.99215686,
47       0.62352943, 0.19607843, 0.        , 0.        , 0.        ,
48       0.        , 0.        , 0.        , 0.        , 0.        ,
49       0.        , 0.        , 0.        , 0.        , 0.        ,
50       0.        , 0.        , 0.        , 0.        , 0.        ,
51       0.        , 0.        , 0.        , 0.        , 0.1882353 ,
52       0.93333334, 0.9882353 , 0.9882353 , 0.9882353 , 0.92941177,
53       0.        , 0.        , 0.        , 0.        , 0.        ,
54..........
55       0.        , 0.        , 0.        , 0.        , 0.        ,
56       0.        , 0.        , 0.        , 0.        , 0.        ,
57       0.        , 0.        , 0.        , 0.        , 0.        ,
58       0.        , 0.        , 0.        , 0.        , 0.        ,
59       0.        , 0.        , 0.        , 0.        ], dtype=float32)

(x_train3,t_train3),(x_test3,t_test3)= load_mnist(flatten=False, normalize=False)

python
1>>> (x_train3,t_train3),(x_test3,t_test3)= load_mnist(flatten=False, normalize=False)
2>>> x_train.shape
3(60000, 784)
4>>> x_train3.shape
5(60000, 1, 28, 28)

これで分かりますか。

投稿2021/05/28 23:37

編集2021/05/28 23:39

ppaul

総合スコア24670

tomomonX

2021/05/29 14:21

ありがとうございます。勉強段階なので読むのみで、PCを全然使ってなかったですが、ヒントいただいたおかげでこうかな？って仮説が立てれました。 x_train[1]は60000万枚のうちの一つを表していて、画素数784(28×28)分を一列に並べて、それぞれの画素一つずつに色の濃さを数値化したものを表記しているということですよね。

行動規範の内容に同意します