Batch_Sizeの適応される部分について

Question

機械学習の勉強をしている大学生です。
python,tensorflow,kerasを用いて2クラス分類を行うプログラムを書いています。
プログラムの大部分をkerasを用いて書いております。 

kerasを用いてプログラムを書いているのですが、batch_sizeについてよくわからない部分があるので質問させていただきます。
自分は学習させるときに学習データとして、複数のcsvファイルを用いて学習させています。

```ここに言語を入力
-data
 -csv_file
  -1.csv
  -2.csv
  .
  .
  .
```
のようなファイル構造になっています（わかりづらくてすみません）。
このcsvファイルはすべて128行3列のデータとなっています。

### 該当のソースコード
```python
history = model.fit(X_train, Y_train,
                    batch_size=32,
                    epochs=1000,
                    validation_split=0.2,
                    verbose = 1
                    )
```
この場合のbacth_sizeというのは、ファイル毎に32個まとめて学習をさせているのでしょうか？
それとも、ファイルの中身（128行3列）を32行ごとにまとめて学習させているのでしょうか？

もし根本から間違っている場合はご教授を願いたいです。
よろしくお願いします。

Accepted Answer

fit() では、X_train の全サンプルからバッチサイズ個ずつ順番に順伝搬、逆伝搬を行い、重みを更新します。

[Model.fit()](https://keras.io/ja/models/model/) 関数に `shuffle=True` という引数があるため、

X_train = [A, B, C, D, E, F]、BatchSize = 2 としたとき、

shuffle=False の場合
1. [A, B] を流して、順伝搬、逆伝搬で重み更新
2. [C, D] を流して、順伝搬、逆伝搬で重み更新
3. [E, F] を流して、順伝搬、逆伝搬で重み更新
4. 1~3 で1エポック、これを指定エポック分繰り返す。

shuffle=True の場合
1. シャッフルする。[C, E, A, B, D, F] これはエポックごとに行われる。
1. [C, E] を流して、順伝搬、逆伝搬で重み更新
2. [A, B] を流して、順伝搬、逆伝搬で重み更新
3. [D, F] を流して、順伝搬、逆伝搬で重み更新
4. 1~3 で1エポック、これを指定エポック分繰り返す。

となります。

## 追記

学習の際のバッチサイズは 32, 64, 128 などがよく使われますね。
一概に学習がうまくいく大きさをいろいろ試してみるとよいと思います。

大きくするメリット
- 計算時間が早くなる。一度に大量のデータを処理したほうが効率がいい。

大きくするデメリット
- 必要がメモリ量が増える。大きくしすぎるとメモリの乗り切らなくてエラー。
- 局所解に陥り、学習が停滞する可能性がある。(バッチ勾配降下法の仕組み)

該当のソースコード

追記

関連した質問